Basso Percepción Auditiva 2006 OCR

Gustavo Basso
Percepción auditiva
UNIVERSIDAD N ACIO NAL DE QU ILMES
Rect or
Dan iel G o rnez
(t)
Vicerrector
Un íversídad
Nac ion a l
Jorge Flores • ele Qu ilmes
. Editor ial
Colección Música y Ciencia
D irigida po r OscarPablo Di Liscia
Indice
Basso, G ustavo
Percepc ión auditiva - la ed. - Berna l : Universidad Nacional
de Quilrnes, 2006.
288 p. : il. ; 15x21.5 cm
(Música y cienc ia dirigida por Pablo Di Liscia) Presen tació n, por Oscar Pablo Di Liscia 15
ISBN 987-558-082-1 Prólogo 17
1. Percepción A uditiva. 2. Sonido. 3. Tono. - 1. T ítulo

Capítulo I. Sist ema auditivo periférico y fisiología de la audición 19
COO 152.15
I. Oído externo 20
A udición con auriculares 22
2. Oído medio 24
T ímpan o 24
© Gustavo Basso. 2006 Cadena de huesecillos 26
© Un iversidad Nac iona l de Quilm es. 2006 Cavidad timpáni ca y trom pa de Eustaqu io 26
Roque Sáenz Peña 352 Función acústica del oído medio : 26
(BI 876BXO) Bernal A lteraciones en el sistema de transmisión del oído medio 28
Buenos Aires l. O ído in ter no 30
ht tp://www.unq .edu.ar Fisiologfa de la cóclea 32
edito rial@unq.ed.ar
Ca racte rísticas del nervio auditivo 40
4. Teoría del lugar 42
Excitación de la mem bran a basilar con un impulso 44
S. Comportamient o activo de la memb ran a basilar y emisiones
otoacústicas 46
ú. Funcio nes de transferen cia del sistema auditivo periférico 47
7. Respuestas neurales a altos nivel es en el sistema auditivo 48
ISBN : 987-558-082-1
ISBN - l3 : 978-987-558-082- 4 Capítulo n. Sonoridad 53
Q ueda hech o el depósito que marca la ley I 1.723 J. Relación entre amp litud e intens idad 54
Decibel es 54
Poten cia e intensidad acústica 55
Esta edición de 1.000 ejemplares se terminó de imprimir en agosto de 2006, en los .talleres
2. Percepción de la sonor idad 57
gráficos de Imprenta El Faro, Oorrego 140 1, Mar del Plata, Provincia de Buenos A ires.
Umbrales absolutos 58
Contornos de igual sonori dad 60
Son idos de combinació n de tercer orden 113
Escala absoluta de sonor idad 62
7. Algoritmos psicoacústicos de compre sión 113
Sumario de unid ades relacion adas con la sonor idad 65
3. Discriminación de la inten sidad 66
Capítulo IV. .Procesamiento temporal de señales 117
Limen de intensidad 66
l . Resolu ción e integración temp oral 118
La Ley de Weber 68
Efectos de la frecuencia central en la resolución temporal 121
Ley de Fechner para la sono ridad 70
2. Resoluci ón temp oral en seña les de band a ancha 121
4. O tros factores que intervien en en la percep ción de la sonor idad 70
3. Resoluci ón temp oral en seña les de band a angosta 122
Int egración temporal 70
Detecci ón de discontinuidades en ruido de banda angosta 123
Factores espec trales 71
Dete cción de discontinuidades en sinusoides 124
Ca mbios en la sensibilidad auditiva provocados por sobrestimulación . 73
4. Modelos de resoluci ón temporal. 124
Det ección de seña les sinusoidales en presencia de ruido 77
Hip ótesis del banc o de filtros de modul ación 126
Patologías auditivas 77
5. O tros procesos temporales 127
5. Codificació n de la inte nsidad 81
Discriminac ión en secuencias de Huffman 127
El problema del ran go din ámico 81
Detecci ón de asincro n ías en el ataque y la ext inción
Límites a la discrimin ación en int ensidad 84
de seña les compl ejas 127
Codificación de rasgos y codificació n contextu al 85
Discrim inac ión de la duración 127
6. Modelos de percepción de la sonor idad 86
6. Juicios sobre el orde n temp oral 128
Desplazamiento acústico temp oral 128
Capítulo III. El oído como analizador espectral. 89
1. Diferenc ia ape nas percepti ble (DAP) en frecuenc ia 89
Capítulo V. Percepción de la altura tonal 133
2. Ban das críticas 91
1. Percepción de la altura tona l en sinusoides 135
Experimento de Fletcher 91
Discriminación en frecuenci a 136
Refin amiento del modelo de Fletcher 94
Variación de la altura tona l co n la sono ridad 137
3. So no ridad ante espec tros complejos 98
2. Percepción de la altura ton al en estí mulos armón icos co mplejos 139
Um bral para estí mulos com plejos 99
., Sensibilidad a la fase 99
Modelos de recon ocimiento de pat ron es 140
Model os temporales 142
Discriminación de parci ales en son idos compl ejos 100
Evidenci a experimental relevante a cada modelo 143
Selectividad en frecuencia en oídos dañ ados 100
Modelo de Brian Moore de l mecan ismo para la percepción
4. En mascaramiento 101
de la altu ra tona l en sonidos complejos .. ~ 145
Relación ent re las band as críticas y el mecani smo
3. La altura tona l como un medio morfofóric o 149
de enmascaramiento 103
4. Representación gráfica de la altura tona l 150
Modelos de cobertura y supresión 104
Son idos de Sheppard 152
Modelos temporales de enmascaramiento 104
5. A ltura tona l e intervalos musicales 154
5. Análisis espectro -tempora l co mbinado 104
Percepción de int ervalos musicales 155
Redu cción del enmascarami en to por comodul ación 105
Intervalos sincrón icos y diacrónicos 157
Enm ascaram ien to no simultá neo 106
Consona ncia y dison an cia 160
Enmascaramiento binaural ' 109
6. Distor sión alinea l y sonidos de combinación 110
Capítulo VI. Timbre 163
Son idos de combinación de segundo orden 111
1. Definici one s de timbre 164
2. Estudios y modelos exp licativos sobre el tim bre 166
Correlació n de los cambios en amplitud y frecuencia 220
El modelo clásico 167
Loca lizac ión de la fuente 22 1
Análisis multidimensional 171 Periodicidad y fusión perceptual ' " 223
Modelos verbales 178 Percep ción de secuencias rítmi cas 225
Modelos de aná lisis por síntesis 179
Percepción del orden temporal , ' 226
Estudios sobre el timb re en la voz human a 182 Regularidad en los datos físicos 226
Estudios sobre el "color" del son ido 183
Redund an cia de la información 227
Even tos acústicos diferentes a la voz y a los son idos musicales 184 3. Principios generales de organización perceptua l y teor ía de la Ge stalt . . 228
Resumen y conclusiones 186 Leyes de la Gestalt , , 230
3. Propiedades parti culares del timbre 187 Isomorfismo 238
Constanc ia del timbre 187
¿Timbres met américos? ' , 189 Capítu lo IX. P erc epción del habla 239
El timbre como medio morfofór ico 189 1. El aparato vocal y la fon ación 239
Tim bre y atención 190 El aparato voca l 240
4. Comentario fina l . , 190 Producci ón del son ido 241
Forman tes - 244
Capítulo VII. P erce pción au ditiva del espacio 191 Características genera les de la emisión voca l 247
1. Localización de sinusoides , 192 2. Representación gráfica de los son idos del habla 248
Diferencia in teraural de intensidad 192 1. Características parti cu lares de la percepción del habla 250
Diferenc ia interaural de tiempo 192 4. Modelos de percepción del habla 255
Bat idos bina ura les 197 Teoría motora 255
2. Localización de señales no sinusoidales 197 Teoría de los rasgos invariant es 255
Localización mon oaural: el rol del pabe llón aur icu lar 197 Mode lo de red neu ronal ~ 256
Empleo de datos espectrales en la localización binaural . . , 198 5. La búsqueda de indi cadores acústicos inv arian tes 256
3. Modelos de procesamiento espacial 20 1 Resisten cia del habla frente al deterioro de la seña l 257
4. El efecto de precedencia 202 (j . Inteligibilidad de la palabra 257
Refuerzo elect roacús tico en grandes espac ios 204 Ensayos de art iculación 258
5. Percepción de la distancia 206 Medición ind irecta y predicción de la inteligibilidad 260
Perspect iva aud itiva 206 Ayuda visual _ 265
6. Percepción del movimiento 211
7. Campos acústicos virt uales 212 Apéndices
8. Resumen 214 l. Teorema de Fourier 267
11 . Principio acústico de indeterminación 271
Ca pítulo VIII . P ercepción de objetos auditivos 215
1. Ecología acúst ica y análisis auditivo del ento rno 215 Referencias bibliográficas 275
2. Información uti lizada para separar los objetos auditivos 216
Armon icidad y frecuencia funda mental. 217 índ ice temático ' 285
Disparidades en el ataque - 219
Co nt raste con son idos prev ios 219
A Germán y a Florencia
Presentación
El arte sonoro, las modalid ades y géneros de co municación que invol ucran so-
nido , las técn icas y tec no logías de proceso de son ido y mús ica y la in vest iga-
c ión sobre per cepci ón aud itiva, se viene n desarrolla ndo de ma nera
interde pend iente y signi ficat iva desde el siglo pasado. Cada un a de las áreas
men cionadas ha impre gn ado de dud as y ce rtezas a las ot ras, a l participar de un
formida ble proceso interactivo que continúa acele rándose en la ac tu alidad.
Este libro presenta una exploración de los avances en el campo de la per-
cepción aud itiva. Su título tien e e! grado de det erminación y de generalidad que
requier en tanto e! dinamismo com o la varied ad de! campo de estud io invol ucra-
do. Por otra parte, no puede negarse que su autor ha sido fiel a su triple condi-
ción de músico, cien tífico y docente, al generar un texto que expone de manera
muy did áctica y eficaz los resultados más sign ificat ivos de la investigación en su
área, en una constante realimentación con la reflexión sobre e! arte sonoro.
Una de las cuest iones medul ares de la in vest igación ac tua l en esta área es
la det erminación del ámbito (físico-fisiológico) en el q ue se llevan a cabo los
procesos de decodificación de la se ñal acúst ica. En otras palabr as: ¿es el fabu-
'1
1, loso diseñ o de nue stro o ído in terno y exte rno , o son los proc esos neur ales de
alto nivel los responsabl es de que percib am os det erminados eventos so noros
de determ inada man era ? ¿Y si son ambos, có mo se repart e la tarea y cómo se
explica y modeliza su funci onami ento ?Así es que, por ejemplo, algunos auto -
res (v éase Bregman, 1994) hacen referencia a proce sos neurofisiológicos de
1" "alto ni vel" o de "bajo niv el" co mo responsable s de determinadas tareas de de-
cod ificac ión y otros (M alham , 2000), co incidenrernenre, den ominan "combi-
unci ón o ído-cerebro " al sistema auditivo en gene ral. Y por cita r un solo
ejemp lo de este trabajo, Basso escribe en el capítu lo V I: "[,.. ]la constancia del
I imhrc só lo puede ser ex plicada en func ión de complicados procesos en las
l'l:lpaS superiores del tratami ento neural" .
Los avances en esta dirección han sido tensados por la necesidad de invo-
11I<T:lr dentro del estud io de la psicoac ústic a a secuenc ias sonoras co mplejas,
15
que van más allá de los eventos individuales. Se involucran así, procesos de
eve ntos sonoros de muy variada naturaleza y complejidad, como la percepción Prólogo
de secuencias de habla (capítulo IX) , evaluació n de recint os y localización de
fuentes sono ras en movimiento (capítulo v ), segregación y fusión de estratos
sonoros simultá neos y sucesivos (capítulo VlII ), o, finalmente, los estudios so-
bre el desplazamiento entre el tiemp o físico y el fenoménico (capítulo IV).
Una de las dificultades que hubo de enfrentar el auto r de este libro es la
secuenc iaci6 n de los co ntenidos, dada su interdependencia. Es así que, por
ejemplo, en el capítulo referid o a la "sono ridad" (capítulo 11) se pregunta: "Pe-
ro, ¿es legítimo con siderar a la sonoridad com o un rasgo autó no mo, que se
puede est udiar de manera independ iente, separada del resto de las caracterís-
tic as que definen un' son ido real ?" Este libro fue con cebido inicia l ~en te como una publ icación int erna para un
y qué decir del capítulo dedicado al "t imbre" (cap ítulo VI), una de las no- semina rio de posgrado que se dictó en el año 2000 en la Universidad N acion al
cion es más interdependientes y cambiantes en toda la histori a del sonido y la de Quilmes, Ese origen exp lica, en parte, el conte n ido y la secuenc ia de los ca-
música. En su tratamiento, el auto r pone en evidenc ia, además, el rol de los pítul os. Su objetivo prin cipal es el de expone r los elementos, principios y pro-
aportes de las técnicas y tecn ologías de son ido propias de la electroacústic a: cesos que intervienen en la percepción del son ido. Nu estra int enci ón no es
"Los modelos de aná lisis por síntesis h an demostrado ser eficaces para gene rar presentar los temas como si formasen part e de un conjunto de conoc imientos
conocimiento científico y técn ico, reducir la cantidad de inform ación necesa- definitivos, sino integrar las dificult ades propias de una disciplina en la que los
ria para exp resar una seña l ac ústica , producir var iantes y modificacion es nun - mismos dat os experimentales llevan much as veces a la creación de modelos ex-
ca experimentadas y controlar la prosodi a musical en tiemp o real. [...] Una plicativos totalmente diferentes.
descripci ón detallad a de las técnicas empleadas contendría la historia de la Quizá la confusión más habitual en cualqui er texto sobre ac úst ica tien e
electroacústica dur ante los últimos 60 años ." origen en la ambigüedad de la definición de son ido . Según el autor o e l text o
Por todo lo antedicho , este libro const ituye un trabajo valioso para explo- que trate mos, el t érmino sonido se puede referir a un fenó meno físico -como
rar ante s que para simplemente "leer", para que el lector realice múltiples reco- una vibración o una onda en el espacio- o a un fenómen o psicológico. Aquí
rridos en los que puede y debe encontrar variados puntos de entrada-salida y de llamarem os son ido a la representación mental asoc iada a la percepción , y se-
relación, a despecho de la necesaria secuenc ia que impon e el texto escrito. ñal ac ústica al estí mulo físico que lo origina. La psicoacúst ica tradici on al es-
ludia dir ect amente la relación entre las seña les acúst icas de ent rada y los
sonidos, co loca ndo los procesos int ermedios en un a especie de caja negra cu-
O sear Pablo Di Liscia yo mecani smo no con sidera de su incumbencia. La fisiología de la percepción
y In neurobiología, por su part e, se interesan especialmente por los procesos de
I ransducció n que operan ent re la seña l ac úst ica y la representación ment al
asociada . En nuest ro caso predomina la prim era aproximación, pero no evita -
remos mencion ar los aspec tos fisiológicos inv olucrad os cuand o lo crea mos ne-
cesarlo. El prim er ca pítulo, por ejemplo, está dedicado por completo a la
fisiología de la audició n.
Este tex to está conceb ido com o parte de un programa complet o de ac ús-
I ica destinado a músicos e inv estigadores en tem as relacio nados co n el soni -
.111. A unque los aportes de la psicología y de las cien cias médicas result an
('s\'llciales, nuestra aproximació n al tema adopta decidid amente la perspecti-
va espec ífica de la cien cia ac ústica. Si bien se supone que el lec tor está fami-
16
17
liarizado con los conc epto s básicos de la ac úst ica general, en la bibli ografía al
fina l del libro se menciona n algunas referencias para quien necesite refrescar
alguno de e llos y en los apéndices se describen brevemente dos temas que no Capítulo 1
siempre aparece n en los tex tos de acúst ica habituales: e! teorema de Fou rier y Sistema auditi vo periférico y fisiología de la audición
e! principio de indetermi nación. Toda vez que fue posib le se emp learo n los
términ os téc n icos en español y en algunos casos las exp resiones se presentan
tambi én en e! idioma de orige n para faci lita r la consulta en la bibliografía es-
pecia lizada.
M i más sincero agradec imiento al profesor Pab lo Di Liscia -direct or de la
co lecc ión Música y C ienc ia- por e! apoyo que le brind ó al proyect o desde su
inicio, al profesor Juan Pamp in y al profesor Emanue! Bon nie r - responsab le de
la realización de los gráficos. Mi grat itud a los int egrantes de! equipo de inves-
El oído -{) sistema auditivo per iférico- com ienza en el pabellón auricular y lle-
tigación en ac ústica de la Facul tad de Bellas A rtes de la Universidad N acion al
ga hasta la cóclea. Su misión es co nvert ir las vibraciones mecánicas en impul-
de La Plat a. Y a los co legas y alumnos que, di rect a o ind irec ta mente, parti ci-
sos nerviosos para q ue sea n procesados en el ce rebro. Es muy pequ eñ o y
paro n en las cha rlas y en los inn umerables intercambios de corre o sobre per-
delicado y se halla prot egido en el int erior del hu eso temp oral. En la figura 1
cep ció n auditiva de los últimos años. Sin su estí mu lo este libro no hub iera sido se lo representa esq uemát icamente.
posible.
Canales semicircu lares

Yunque
La Plata, mayo de 2006
Estribo en la
ventana oval
.L-~-- Nervio vestibular
( . -0r-~ Nervio coclear
Cóclea
Ventana
redonda
Conducto auditivo
11 I1
Oido externo Oido medio Oido interno
1,'
Fi¡:ura 1. Siste ma aud itivo periférico
Para su estudio se lo divide en tres partes.:oído externo, oído medio y oí-

do inte rno . Los can ales semicirculares; que comparte n algunas estructuras ana-
r ómi c as con el oído interno, pertenecen en realidad al sent ido del equilibrio.
En este capítu lo nos det endremos extens amente en los proc esos involu-
crudos en la fisiología de la audició n , cuyo obje to de estud io incluye la totali-
18
19,
dad de los eventos físicos y neurales invo lucrados en la percepci ón del son ido,
desde el siste ma audit ivo periféric o hasta la corteza cerebral.' Hélix ------~
En lo qu e sigue ana lizaremos ana tó mica y fisiológicamente cada una de Fosa del hélix - - - - / --/-- - - -
las partes del siste ma auditivo periférico . Antihélix - - - - -1'---1--
Concha (plato) ----+-+--~..

Crus helias
l. Ofoo EXT ERNO Concha (cavum) - - - \ - - \ - - \ -

Trago -------\--\-~- ",,\
Antitrago - - - - - --''r-.>.,-J
El oído exte rno, junto a la ca beza y la parte superior del torso, form a part e del
Hendidura del trago ~_-f
siste ma receptor de vibrac iones q ue aco pla el t ímpano con el cam po ac ústico
Lóbulo - - -- - - - - - ' ' < --
externo. Adem ás de protegerlo ante posib les agresiones mecáni cas, filtra y
mod ifica las seña les que le llegan del exte rior y contribuye decisivamen te en
la tarea de localización espac ial de las fuentes ac ústicas.
Una descripción ana tó mica del oído exte rno , de ade ntro hacia afuera, in-
cluye e l can al auditivo exte rno, la co ncha y el pabell ón auricular. El canal au-
ditivo exte rno es un a estructu ra tubular irregular de aprox imada mente 26 mm
de largo por 7 mm de anc ho y un vo lume n de 1 cm', con un eje ce n tral sin uo-
so, que conecta el pabellón co n el tímpano. Su pared está co nfor mada por una
porció n cartilaginosa (móvi l) y una ósea. La parte carti laginosa, continuació n
de la est ruc tura del pabellón auricular, es de mayor lon gitud q ue la ósea y es-
tá cubie rta por piel co n fol ículos pilosos, glándulas ce ruminosas y sebáceas . En
cambi o, la piel qu e recubre la región ósea del ca na l auditivo externo , en la
parte más profund a adhe rida al tím pan o, es muy delgada.
La parte externa del canal audit ivo exte rno se ensa nc ha notablemente
formando una cav idad en forma de taza llamada conc ha, con un vo lumen in- Figura Z. Vista lateral y corte esquem ático superior del o ído exrem o
terno de aproxi mada mente 4 cm", En la figura 2 se pueden aprecia r una vista
lateral y un corte del oído exte rno.
El pabellón auricular (la o reja ) es un a estruc tu ra cartilaginosa que actúa 20
íD
como un filtro dir eccion al de las seña les que llegan del exte rior. Es muy dife- ~ 15
o
rente al de otros mamí feros, por ejemplo el de los felin os, q ue poseen pabello- e
ro
a.
nes cónicos q ue puede n enfoca r hacia un punto del espacio de man era
ª
10
independ iente por medio de músculos de contro l específicos . Qj
e
Los efectos del pabe llón auricular (6 cm), de la cabeza (22 cm ent re oí- Ql 5
.'!l
dos) y de los hombros (15 cm de anc ho ) se vuelven significat ivos cuand o las '"
Ql
:J
a. O
lon gitud es de onda son co mparables con la dim ensión de las estruct uras. El sis-
o::'"
Ql
tema completo puede ser ca rac te rizado co mparando -o midiend o- la presión -5

acústica en el ca mpo libre, a la ent rada del pabellón auric ular, co n la presión 0,2 0,5 0,7 2 5 7 1012
acúst ica en la superficie del tímpan o. En la figura 3 se aprecia la acción de fil- Frecuencia (kHz)
I La parte de la ac ústica que estudia la fisiología de la audición se de nomi na {¡sioacústica. Figura 3. Función de transferencia del o ído'exrem o ame un esrímulo difuso de ruido blanco
20 21
tro espectral que prod uce e! oído externo. La tran sferencia máxima, a una fre- te en calibrar los aur iculares en su posición de uso en un oído rea l. Primero se
cuenc ia de aprox imadamente 2.800 H z, se debe a la reson an cia del cana l au- mide, con un micrófon o muy pequeño colocado den tro de l canal audi t ivo, la
ditivo externo. presión sonora pro vocada por una fuen te acústica de espectro plano alejada de
La comp leja forma de la curva se debe a la co ncurrenc ia de los fenóme- la cabeza de! oyente (ca mpo libre ). La señal en e! micrófon o correspo nde
nos de reflex ión, difracc ión y reson an cia en difere ntes part es de l oído exte r- exac tamente a la fu nción de transferencia -o HRTF- de ese oído exte rno en par-
no . Como curiosidad, en la figura 4 se reproduce e! expe rimento de Goode, en t icu lar. é La curva de tran sferen cia obtenida se repro duce en e! oído ecua lizan -
e! que se compara la tra nsferencia de un oído norm al con un modelo en e! que do la salida del auricular en posición de uso. De este modo se puede lograr la
e! tímpano queda a ras de una esfera, como ocurre en e! caso de algunos sau- misma respuesta espectral que en e! campo libre para cada pareja auricu lar-oí-
rios (Goode, R. L. et al., 1994) : es eviden te la comp leja acción espectral de! do . Como el proced imiento es complicado, se ofrecen cientos de curvas HRTF
oído ex te rno sobre las seña les q ue le llegan de! exte rior. En e! ca pítulo sobre -que se pueden obtener, por ejem plo, en internet- que cada usuar io escoge de
percepción aud itiva de! espac io nos det endremos a estudiar con detalle este acue rdo a su tipo logía particular.
efecto y sus consec uenc ias. U na de las características más notables de la audición a través de auric u-
lares es la excelente respuesta en bajas frecuencias, imposible de conseguir con
Audición con auriculares los mismos auriculares ubicados en e! campo libre, lejos de la cabeza de! oyen-
te. Este efecto se exp lica por la diferencia en e! acop le ac ústico entre ambas
C uando los estímulos _se presentan a través de auric ulares las característ icas situac iones . Con la fuente en e l campo libre actúa e! filtro de! oído externo en
de! cam po libre son reem plazadas por la in teracción entre e! auricular y e! oí- toda su capacidad: la ene rgía de baja frecuencia llega ate nuada al tímpano
do externo de l oyen te. Esta in teracción incluye efec tos propios de la mecá ni- pues difract a alrededor de la cabeza. Cuando se co loca un auric ular se c ierra la
ca de ondas que son muy d ifíciles de contro lar, especia lmente a altas comun icació n con e! cam po libre y se crea un a cav idad esta nca comp uesta po r
frecue ncias . U n méto do que permite acop lar con precisión el sistema cons is- e! volumen in terno de! auricular más e! volu men interno de! oído externo. En
la figura 5 se puede ver este caso.
El vo lumen es ahora co nstante y posee ún icamente dos superficies mó -
.... viles, e! altavoz de! auric ular y e! tímpano . Cualquier desp lazam iento net o
.... Limite teóri co
.... +10
10
"".... )..' /4rc de l altavoz se va a tra nsmit ir íntegramente a l tí mpano amp lificado por la re-
....
....
E O ldo com pleto
.... ....
~ ....
oUJ .... .... O
.2 .... E
i5 u
o
a. UJ
E -10 Q)
ro 0,1 Qj
u .o
c: -13
Q)
Tlmpano con esfera Q) Area del Area del
c: o ....-t-* limpan o
·0
.~
oUJ 0,01 -20
altavoz
-----....
.o
«
Volumen consta nte
0,001 -30
0,2 0 ,5 2 5 10 20
Frecuencia (kHz ) Figura 5. Acople ent re un aur icular y el oído externo
Figura 4. Compa rac ión entre las func iones de tra nsferenc ia de un oído comp leto y de un
tímpa no adosado a una esfera 1 Heaarelated tmnsfer functions ( HRTF). Este tema será estud iado en detalle en el capítulo VII.
22 23
5,1
lación entre sus áreas, 4:1 a favor del a lta voz en un caso promedio. Dicha / 1,2
tran smisión es ind ependiente de la frecu encia , pue s act úa como un a prensa / 2,8
// //1 1"1'1í'i~~ 4,4
neum át ica y exp lica la no table efic ienci a en bajas frecu encias del siste ma .
5,9
Lamentablemente, e l dispositiv o de aj uste esta nco que permite tan buen
7 ,5
rendimiento en graves es un o de los factores qu e con vierte a los aur icul ares 5,1
" 8 ,2
en ca usa pot en cial de h ipoacusia po r ruido, sobre to do si se los usa incorrec -
rarnente.!
Figura 6. Vibración relativ a de l tímpano ante una excitación de 525 Hz y 121 dB

2. Oíoo MEDIO
El oído med io permite aco plar las seña les acústicas entre el cana l aud itivo y el
oído interno. Ocupa un a ca vidad en el hue so temporal den om inada caja tim- Martillo Yunque
pánica y está con stitu ido por el tímpan o, la cade na de hu esecillos -rnart illo,
yunque y estribo- con sus ligamentos y músculos de control, la trompa de Eus-
taq uio y las ventanas oval y redonda, que lo comunican con el oído in te rno ."
Su princi pal función es la de permi tir q ue las vib raciones acús ticas lleguen a
la cóclea con suficiente ene rgía. S i las seña les llegasen dir ectamente al oído
interno a través de la ventana ova l, casi tod a la ene rgía se reflejaría a ca usa de
la diferen cia ent re las propiedades mecáni cas del medio aé reo exterior y del
med io líquid o de la cóclea. En los verte brados terrestres el oído medi o actúa
como un siste ma de acople que adapta ambos medios, permitiendo un a efec- Tlmpano Estribo
tiva transferenc ia de energ ía. T écnicamente, es un ada ptador de impedancias
y como tal lo ana lizaremos más adela nte. Figura 7. Ca dena de huesecillos del oído medio
Tímpano
El tímpan o es una membran a semitranspa rente co n forma de con o co n un a su-

perficie prom edio de 0,6 crn/ . A ca usa de su geometría irregular y al anclaje
solidario del manubrio del martillo, el tímpan o vibra como un a compleja
mem bran a elástica no homogénea. En la figura 6 se aprecia su respuesta ante
un est ímulo sinusoida l de 525 H z. Se destaca nítidamente la form a del área de
contacto con el manubrio del martillo.
J A lgunos de los facto res que aumenta n el riesgo de hlpoacusia son el uso de auriculares en
amb iente s con gran nivel de ruido de fondo, por ejemplo la vía pública, y el empleo de am-
plificadores de aud io de baja calidad, con deriva estática y alto porcentaje de "rurnble" (rui-
do de muy baja frecuenc ia).
4 Esta estr uctura es similar a la de casi todos los verte brados terrestres. Las especies que no
poseen membrana timpáni ca, co mo las salamandras y las serpientes, son la excepción. Figura 8 . Forografía del estr ibo
25
24
Cadena de huesecill os La impedancia es un a magn itud que permite evaluar la resistencia al movi-
miento de un siste ma . En nue stro caso se verifica que la impedan cia acúst ica
Las vibrac iones del tímpano se transmiten hacia el oído in terno a través de en el tím pan o es mucho menor que en el oído interno.
tres pequeños hu esecillos: el martillo, el yunque y el estribo. El mart illo posee Veamos el proceso en det alle. Con la exc epción de las frecuencias más al-
una parte promi nente, "el man ubr io, que se inserta entre las lám inas de la tas, por enci ma de 5 kH z, la dim ensión tran sversal del cana l audit ivo ex te rno
mem brana timpán ica. A su vez, el martill o y el yunque están cone ctados enes pequeñ a frente a las longitudes de onda y, por lo tan to , la presión sono ra re-
tre sí y a la pared ósea por medio de ligamentos. El yunq ue se vinc ula con el sulta aproximadamen te constante sobre el área del tí mpan o. En este caso la
estribo a través de otro ligamento, y el pie del estri bo se conecta por medio de interacción acúst ica puede describirse en tér minos de dos var iables: la presión
un ligamento an ular a la venta na oval. sonora en el tímp an o PT y su velocidad de volumen UT . El movimiento del
Dos músculos contribuye-n a sostener los h ueseci llos y permiten controlar tímpan o se transmite a través de la cadena de huesecillos a la ventan a ova l.
la rigidez de la caden a osic ular. El tensor del tím pan o está ligado al mart illo y Aquí tam bién la int eracción acústica puede describ irse a partir de la presión
el estapedial al est ribo. Tal como veremos, estos múscu los funci ona n como un sonora en la ventana oval Pva y su veloc idad de volumen Uva. En la figura 9
control de ganancia varia ble del oído medio. se ve un esque ma muy simplificado del sistema de tran smisión .
En una primera aprox imación, la cadena de huesecillos act úa como un sis-
C avidad timp án ica y t rompa de Eustaquio tema de palancas. Para vibrac iones de amplitud moderada, el estribo ejerce una
fuerza 1,3 veces mayor sobre la ventana ova l que la que ejerce el tímp ano sobre
La tromp a de Eustaqu io, que cone cta el oído medio con la cav idad nasofarín- el martill o. Co mo el área de la ventana ova l - unos 4 mm 2- es mucho menor que
gea, es un conducto de paredes bland as que está cerrado la mayor part e del la del tímp an o -de alrededor de 60 rn rrr -- en ella puede aplicarse una presión
tiem po y que se abre al tragar, masticar o bostezar. Su función es la de permi- hasta treinta veces mayor que en el tímpano. Y como la int ensidad es función
tir la ecualización de la presión estática a ambos lados del tímp an o. G racias a del cuadrado de la presión , la diferen cia de int ensidad puede llegar a ser de mil
este mecani smo el aire en el interior ejer ce la misma presión que la atmósfera
desde el exterior. Se resuelv e así la parado ja que inqui ere por qué la presión Músculo
del estribo
atmosférica, de un valor superior a los 100 kPa, no se oye mien tras que una se-
_.
(stapedius )
ñal acús tica de sólo 20 Pa nos result a de una intens idad intolerable. La res- Estribo
Ventana oval
puesta es senc illa: la presión at mosfér ica, práct icame nt e está t ica, no mueve al Pared del
tímpano pues se ejerce co n igual va lor en sus dos caras gracias a la acción de canal (óse~'
la tro mpa de Eustaqui o. La presión dinámica, que vibr a a frecu en cias superio - Membrana
res a 16 H z, se aplica con facilid ad sobre la ca ra externa del t ímpan o pero lle - basilar
ga con dificultad a la cara interna, aun con la trompa de Eustaqui o abierta. La

diferencia de presion es din ámicas se trad uce en un movimiento efectivo del Canal Membrana de la
auditivo ventana redonda
tímp an o y de la cadena de huesecill os.
Músculo tensor
del timpano
,~
Función acústica del oído medio
La funci ón principal del oído medi o es transmi tir la mayor cantidad de ener-
gía desde el canal auditivo ext erno h asta la cóclea. Para lograr este fin la ca-
dena de huesecill os debe adaptar la impedancia del siste ma tímpano-aire con
la del sistema ventana oval-perilinfa. Como ya seña lamos, si las ondas acúst icas
.,.
Membrana
timpánica
Pared del canal

(cartilaginosa)
Trompa de
Eustaquio
pasasen del tímp an o a la ventan a ova l, casi tod a la ene rgía se reflejaría por la
gran diferen cia de impedanc ia existente entre los dos medi os de propagación. Figura 9. Esquema del sistema de transmisión del oído med io
26 27
10
veces, equiva lente a una ganan cia de unos 30 dB. En realidad, el movimi ent o es
más complicado que el de una simple rotación y el manubrio del mart illo no se iiJ
~
mueve como un cuerpo rígido a altas frecuencias. En la figura lO se puede apre- o O
i5
ciar la curva real de tran sferen cia de presión entre el tímpano y la ventan a ova l. Ql
E
En la funci ón de transferencia se ve que se obt iene una gana ncia de o
"O
20-3 0 dB en el ran go medio. La variación espec tral de la curva demu estra qu e 'O - 10
ro
"O
la caden a de hu esecillos no actúa como una palan ca lineal.
.~
En cuanto a la tran sferencia net a de pot en cia, se co nsidera que en el oí- ro -6- 500 Hz
~ -20
do medio se pierde alrededor del 50% de la energía: al menos la mitad de la ro • 1000Hz
:2 .... 2000 Hz
pot enci a recibida por el tímpan o' no llega al oído interno. ro
en -O- 3000 Hz
-30
Alteraciones en el sistema de transmisión del oído medio
-20 -10 O 10 20
Una alte ración frec uente en la gana ncia del sistema de tran smisión se da cuan- Presión en el oído medío (cm H,O)
do la trompa de Eustaquio perm an ece ce rrada y la presión atmosférica varía Figura 11. Variación de la transferencia de energfa del oído medio en función de la presión
rápid amente, por ejemp lo en el interior de un avión mientras se presuriza la está tica
cabina, o al sume rgirse a varios metros de profun didad en el agua. La diferen-
cia net a de presión está t ica curva al tí mpano, aumenta la tensión mecán ica de
pende de la frecuencia y gene ra la sensac ión de sordina que expe rimentamos
la mem bran a y mod ifica la capacid ad de transferencia de energía del oído me-
al ten er los oídos "tapados".
dio. Por ejemplo, una diferenci a de 1 kPa -que equi vale a una co lumna de 10
O tra fuente de variación en la gana nc ia del sistema la apo rta la acció n de
cm de agua o a 0,0 1 atm- produc e ca mbios detect ables en la sens ibilidad au -
los músculos de oído med io. Estos músculos se cont raen, en una acción den o-
ditiva. Como se puede aprecia r en la figura 11, la profundi dad del efecto de-
minada reflejo acúst ico, ante estí mulos acústicos de gran intensidad, antes y
dur ant e la fonaci ón y, en gene ral, du rant e los movimientos cor porales de me-
40
diana y gran amplitud. El esta ped ial es de acción rápid a -el reflejo acúst ico
aparece ent re 10 y 20 ms después del est ímulo- mientras que el te nsor del tím-
pan o respond e más len tamente - tarda un os 100 ms en ac tivarse. El ret ardo del
30 sistema de pro tecc ión lo vuelve ineficaz cuand o el est ímulo es de tipo impul-
sivo, po r eje mplo el esta llido de un petardo. Los dos músculos co mbinados lo-
iiJ
~ gran ate n uar la seña l alrededor de 20 dB. Como se puede ver en la figura 12,
20
¡{"
el reflejo acúst ico no posee respuesta plana y su efecto es mayor a bajas fre-
cuencias .
¿ 10 La supresión patológica del reflejo acúst ico t ien e, ent re o tras, las siguien -
les consecuenc ias: 1) disminuye la discriminación del habla a altas int ensida-
des, 2) inc rement a la pérdid a de audición ant e estímulos prolon gados de alta
O
int en sidad y 3) aument a el en mascara mient o simultá neo. El dañ o audiol ógi-
l'o provocado por el uso inadecuado 'de auriculares es similar a l inducido por
0,1 0.5 5 10
la supresión patológica del reflejo acústico.
Frecuencia (kHz) Es int eresante marcar que la func ión de transferenci a desde el pabe llón
auricular hasta la ventana oval define casi completa mente la in versa de la cur-
Figura 10. Func ión de tra nsferenc ia de presión ent re la venta na ova l y el tímpano
28 29
i: 85 Superior
O Canales ,
semicircula res Posterior
al [
~ -2
e Lateral
-o
'00
'E -4
(/)
e
~ -6
~
e
Q)
-8 Nivel del estimulo Ventana oval
o
:o en dB Vesli bulo
E
ro -10 Ventana redonda
Ü
-12
400 500 800 1000 2000 Figu ra 13 . Esquema del laberin to óseo
Frecuencia (Hz)
Figura 12 . Reflejo acúst ico en fun ción de la inten sidad del estím ulo bién conocido como ca raco l memb ran oso, forma una espiral de dos vueltas y
media de tej ido conect ivo que sigue el desarroll o de la espiral ósea del caraco l.
El laberin to está inervado por el nerv io auditivo -octavo par crane al- que
va de sensibilidad auditiva en el ser h umano (en la figura 30 de este capítulo en su interior se divide en dos ramas: el nerv io coclea r, que es el nervi o vincu-
se puede ver la curva de transferencia completa ). A partir de este punto el pro- lado a la audición , y el nervio vestibular, que perten ece al sent ido del equilibrio.
ceso comp leto parece comportarse de manera lin eal. Los estím ulos que llegan En la porción central del laberinto está n los ca na les semicirculares, q ue
por la ventana oval producen los mismos pat ron es cocleares que los que lle- poseen células receptoras y cr istales de ca lcio que respond en a la gravedad y a
gan por vía ósea, aunque am bas funciones de tran sferencia difieran notable- la acelerac ión , inform and o al cerebro sobre la posición y el movimiento de la
men te en tre sí. ca beza. So n tres co nd uctos semicirculares orientados en cuadratura según las
1res dimens ione s espac iales. A l mover la ca beza se produ cen movimientos re-
lativos entre el líquido y los crista les de calcio en suspens ión que est imulan a
3. OíDO INTERNO las células sensibles que tap izan el tejido int erior de los canal es. Así , además
de las estructuras prop ias del sentido de la audición, el laberinto óseo contie-
El oíd o interno es parte de una cav idad irregular del hueso temporal que reci- ne también los órgano s del sen tido del equ ilibri o.
be el nombre de laberinto óseo y comprende el vestíb ulo, el caracol y los ca- El tamaño de los elementos del oído int erno es extra ordinariamente peque-
nales semicirc ular es. Sus paredes está n formad as por h ueso recubierto de Ii(l . La base del caraco l mide menos de 9 mm y el diámetro del conducto que for-
epitel io y contiene un líquido acuo so parecid o al líquido amn iótico. Gr an par- lila la cóclea es de alrededor de 1 mm en su parte media, estrechándose a med ida
te del espacio in terior está ocupad o por un sistema de finos cond uctos y sacos que se acerca al vértic e. En su int erior, el conducto cocle ar -o scola rnedia- es
que constituyen una segunda capa, de paredes tapizadas por tejido conectivo aún más pequeño, ya que la cóclea está dividida en tres partes o scolos como se
blando, llamado laberinto membrano so. La porc ión del laberin to óseo que si- puede ver en la figura 14. La membrana basilar (MB) sigue la forma en espiral de
gue a la ventana ova l se denom ina vestíbu lo, que a su vez está dividido en dos la c óc lea y forma el piso del conducto coclear. En su desarro llo describe dos vuel-
partes, el ut rículo y el sáculo. Mientras la base del estribo cubre casi co mple- 1; IS y media y, totalmente extendida, mide alreded or de 35 mm de largo.
ta mente la ventana ova l, la ventan a redonda se halla recubierta por una del - En la membran a basilar se en cuentra el órgano de C ort i, q ue con t iene las
gada membrana de tejido conect ivo. U n estrecho ca na l conduce del sácu lo al ,'( llIlas ciliadas respons ab les de con vertir las vibraciones mecánicas en impu l-
conducto coclear, situado en el interior del carac ol. El cond ucto coclear, tarn- l.' IS nervio sos. Durante mucho tiemp o se creyó que la cócle a era ún icamente
30 31
Scala Ve stibuli
(per ilinfa )
Hueso
Ganglio
espiralado :
Cápsu la de una
cél ula ganglionar
Figura 14. C orte transversal de la cóc lea en su parte media
un órgano recep tor que procesaba las seña les ac ústicas para tran sform arlas en
pote nciales eléc tricos e impulsos nerviosos. Hoy sabe mos, gracias a num erosos Scala Tympan i
estudios, como los de Kem p y Zwicker, que también posee propiedades moto- (per ilinfa )
ras que le oto rgan la ca pac idad de ac tuar sobre las seña les que llegan desde el
Figu ra 15 . Det alle del conducto coclear
exte rior.
Fisiología de la cóclea vian a y delgada no actúa mecán icamen te sob re el mov im iento de los fluidos
cocle ares. Su función principal es la de separar la endolinfa de la perilinfa
El movimi ento de la cade na de huesecill os del oído med io se aplica a tr avés para mantene r una dife rencia de potencial eléct rico de un os SO mV entre
del estribo a la ventan a ova l. Co mo el laberinto está lleno de líquid o y sus ambos medios.
parede s son óseas, el conjunto result a prácti cam ente incom presible. El mo- La membrana basilar es una membran a elástica en la q ue se ubica el ór-
vimiento del estri bo sería poco menos q ue nul o de no ex isti r la ventana re- gano de Cort i. Posee alrede dor de 3.500 células ciliadas internas dispuestas en
donda, que perm ite q ue el volumen de líquid o en la cóclea se mantenga una fila y de tres a cinco filas con aprox imadamente 25.000 células ciliadas ex-
co nsta nte y -que, por o tanto, se comp en sen exacta men te los movimientos te rnas en cada oído. Tal co mo veremos, las células int ern as son aferen tes - en-
netos de la ventan a ova l y de la ventan a redonda. La ene rgía acústica llega vían información al cerebro a tra vés del nervi o auditivo- y las células externas
en to nc es a la cócl ea qu e, como se puede ver en el corte de la figura 15, est á son eferent es - reciben impul sos ner viosos desde el cerebro. La membrana tcc-
d ividida en tres com par timi entos. La scola tympani co mienza en la venta na r órea cubre las este reoci lias de las células ciliadas ayuda ndo a su excitación
ova l y está llen a de perilinfa, un líquido rico en sodio. La scala vestibula na- mecá nic a. En la figura 16 se puede ver una imagen del órgano de C ort i toma-
ce en la ventana redonda y se comun ica co n scola tympani a tr avé s de un a da con un micro scop io electrónico de barrido.
abert ura, el heli cotrerna, que permite el paso del líquid o perilinfáti co en el
extre mo superior o apex del caracol. Entre ambos co nductos se encuentra la l )rgano de Corrí
scola media o co nd ucto coclear, q ue está a islado de los anteriores por la mem -
brana bas ilar y por la membran a de Re issner y que co ntiene en do linfa -un I ~I ógano de C orti es una compleja estruc tura-compuesta, ent re otros elernen -
líquido viscoso rico en potasio. Como la mem brana de Re issner es muy li- l OS, por células nerviosas transducroras, cé lulas de soporte y fibras n erviosas.
32 33
Zona Iimbica Zona media Zona marginal
Figura 16 . Imagen del órgano de Corti to mada con un microscopi o electr ón ico de barrido .
J, 2 Y3: células c iliadas externas; CC!: cé lulas ciliadas internas; Te: túnel de Corti ; Figu ra 17. Cé lulas sensor iales y de sopor te en e l órgano de Co rti. A : pilares in tern os;
MI3: mem brana basilar E: pilares externos
Las cé lu las ciliadas son neuronas alta mente especializadas y se dispo ne n con las células cil iadas externa s. C ada cé lula interna se comunica co n alrede-
en dos arcos sepa rados por el túnel de Corti, En el arco exterio r se agrupan dor de 20 neu ron as afe rentes de t ipo 1 y cada ne uro na aferente de t ipo II se re-
un as 25.000 cél ulas ciliada s externas, cada un a co n cerca de 140 este reoc ilias parte en tre varias cé lulas cili adas ex te rnas . En ca mbio, las fibras efe rent es que
interc onectadas En el otro arco h ay ce rca de 3.500 cé lulas c iliadas in te rnas, parten de l ce rebro se co n ectan sólo co n las célu las ci liadas externas, aunq ue
cada un a co n alr ede dor de 40 estereocilias interconec tadas. La mem bran a tec - algunos invest igado res suponen qu e puede n ta mb ién ac tuar, au nq ue indirec-
tórea cubre las célu las de Cort i y se sabe que entra en contacto co n las este - lam ente, sobre las cé lulas internas.
reoci lias de las cé lulas extern as, pero ac tualme nte se d iscute si también lo El punto de contacto a través del cual la infor maci ón pasa de un a neuro-
ha ce co n las de las cé lulas internas . na a otra se denomina sin apsis. La sinapsis entre una cé lula ci liada y un a fibra
Las cél ulas de sopo rte proveen apoyo estructu ral y metabólico a las cé lu- afe ren te se caracteriza por un ade lgazamie nto de la mem bran a cel ular y la pre-
las cil iada s. Se pueden d ivid ir en dos grupos: el de las célu las con filamentos scucia de peq ueñas vesíc ulas en la célula ci liada que co nt iene n las sustan cias
y microtúb ulos que co ntro lan la rigidez de la mem bran a basilar y que son en qu ímicas necesarias para transmi tir la señal. Por el co nt rario, en la sinapsis en-
parte responsables de la distr ibuc ión espacial de la frec ue nc ia de resonan ci a a 1re un a fibra efere nte y una cé lula c iliada las ves ículas se enc uentran en la fi-
lo largo de la membrana ; y el de las cé lulas que poseen orgá nu los capaces de hra tran smiso ra.
sin tetiza r las proteínas y de tr ansportar los iones necesarios para el meta boli s-
mo del órgano de Cort i. ( :élulas ciliadas
El ó rgano de C ort i se vincula co n el siste ma nerv ioso ce n t ral por medi o
de dos t ipos de fibras nerviosas: las aferen tes llevan inform ac ión desde el oíd o b isten dos clases princ ipa les de cé lulas ciliadas, las internas y las exte rn as,
intern o h aci a el cerebro y las efe rentes lo h acen en el senti do co n trario, 'l ile difie ren nota blem ente entre sí. Las cé lulas ciliadas internas t ienen forma
desde e l cere bro ha cia el o ído in terno . Existen dos t ipos de fibras aferentes. 1:1.ibular con el núcleo ubicado en el centro y est án sop ortadas lat e ralmente
Las del tipo 1 constituyen el 95 % de l total y contactan únicamente a las cé lu- por células de sostén. La part e infe rior de cada célula interna está en co ntac-
las cili ad as internas, mientras que las del tip o II -el 5% restante- se conectan to directo con las fibras nerviosas q ue se proyectan h ac ia el sistema n ervioso
34 35
Endolinfa cen tral. C omo las fibras aferentes que parten de las células internas forman el
95% de las fibras afere n tes de l nerv io aud it ivo , se supo ne que éstas actúan co-
mo los receptores primarios de la cócl ea a l convertir los movimientos mecá-
n icos en impulsos neurales. Las fibras eferen tes, q ue llevan infor mación desde
el cerebro hacia e l órgano de C orti, están en co ntac to con las fibras aferentes
pero no co n las cé lulas ciliadas internas.
Las cé lulas c iliadas exte rnas son largas y de forma cil índ rica, co n el nú -
cleo situado en su parte inferi or. Más de cuatro vece s más n umerosas q ue las
células interna s, forma n de tres a c inco filas a lo largo de la membran a basilar.
Se hallan en contac to d irecto tanto co n fibras aferen tes co mo eferentes. Du-
rante la est imulación con tensión eléctrica, las cé lulas externas se aco rta n y
alargan a un a frecu enc ia est able. A raíz de esta capac idad motora se ha suge-
Fibras eferentes
rido que son las responsables de los procesos cocleares ac t ivos, que incl uyen la
capacidad de sinton ía de ban da angosta y la gene rac ión de em isiones o toac ús-
Perilinfa ticas. Como ex iste n cerca de 1.S00 fibras ne rviosas eferentes que llevan infor-
mación hacia la cóclea desde el co mplejo olivar superior, se supone que en las
primeras etapas del análisis aud itivo perifér ico actúan centros elevados de pro -
Figura 18. Cé lulas ciliadas int ernas y extern as cesamiento y co ntro l.
Proceso de transducción en las células ciliadas internas
La perilinfa, rica en sod io , es sim ilar a los fluidos que ocupa n el espacio exte-
rior a las células del organ ismo , mien tras que la endo linfa, con un a gran con -
cen trac ió n de po tasio , se asemeja al med io líquido interior de las cé lulas. Dada
su ubicación en la membrana basilar, las cé lulas del órga no de C ort i están ex-
puestas a la end ol infa en su parte supe rior y a la perilinfa en la infer ior, con
una diferen c ia de po tenc ial de alrededo r de SO mV en tre ambos extremos. Du-
rante la est imulació n acúst ica el movim iento de la mem brana basilar se trans-
mite a través de d iferen tes clases de células de soporte, en un ión solida ria con
las células sensor iales. Las este reocilias de estas últ imas se mu even entre la
memb rana basilar y la masa gela t inosa de la membrana tect órea , excita ndo
mecá n ica mente las cé lulas c iliad as e in iciando el proceso de tran sducci ón en-
tre vibraci ón e impulso ner vioso.
Tod as las estereocilias de una cél ula están un idas entre sí. Se supone que,
co mo éstas son rígidas y pivot an sobr e su base, el movimien to en una d irec -
ció n abre canal es selectivos de iones a través de los que fluyen ion es de pota -
sio hacia el interi or y la cé lula se despolariza. La co rrien te ión ica, que fluye
desde la escala media haci~ e l in terior de las cé lulas c iliadas interna s, está mo -
Figura 19. Tres filas de cé lulas ci liadas externas to madas con un microscopi o elect rón ico dulada por la deflexión del haz de este reoc ilias en relación con un eje de má-
de barrid o
x ima sens ibilidad.
36
37
El período refract ario de un a cé lula es muy grande en relación con los pe-
ríodos característicos de las señ ales acúst icas: una sola célula es incapaz de
captu rar la variación temporal, pues no puede seguir con suficiente veloc idad
sus ascensos y caídas. Sin emba rgo, las células ciliadas internas pueden respon -
der ante cie rtos valores de la forma de onda del est ímulo. Si varias cé lulas dis-
paran ante la misma seña l a diferentes niveles o fases, el conjunto de la
Inh ibición Exci tación informac ión permite reconstruir la forma de onda or iginal aunque ésta posea
una frecue nci a muy elevada.
Figu ra 20 . DeAex ión de la estereoci lias en un a cé lula c iliada int ern a La inform ación de fase del estí mulo también es codific ada en el patrón
te mpora l de disparo de las cé lulas ci liadas in ternas. Los intervalos en tre dispa-
Los movimientos en direcci ón de la fila más aira provocan un aumento ros son, aproximadament e, mú ltipl os enteros del período del estí mulo. Una
en la conductancia de l siste ma y los que van en sent ido contrario la dism in u- célula aislada no dispara necesariamente en cada ciclo de! est ímulo pero,
yen , mien tras que los movimientos ortogonales al eje no la altera n . La co- cuando ocurre, lo hace siempre a la misma fase de la form a de onda . El patrón
rrient e ión ica está constituida principa lmente por iones positivos de potasio temporal de disparo de un grupo de neuronas contien e inform ación clara so-
(K +) pues su co nce nt rac ió n en la endolinfa de la scala media es muy alta . La bre e! per íodo del estímulo porq ue ex iste siempre algún disparo en cada ciclo
t ransd ucc ión en las cé lulas ciliadas es no lineal. Los desplazamientos simétri- de! mismo. En la figura 22 se ve que e! intervalo entre disparos es siempre un
cos del haz de este reoci lias desde la posición de reposo, de la misma magn itud múltip lo entero de l período de la seña l de entrada.
pero en sent idos opuestos , generan ca mb ios de co nd ucta nc ia asimétricos. La sensib ilidad a la fase desapa rece por encima de 5 kH z. El límite supe-
In mediat ament e después de un disparo la cé lula ciliada in terna entra en rior no está determinado por la tasa máxima de disparo de las neuron as, sino
un estado refractario, en el cua l se reaj usta químicamente, de una du rac ión por la prec isión con que e! impu lso ner vioso "enga nc ha" una fase parti cular
aprox imada de 1 ms. No pod rá dispa rar nuevamente hasta haberlo superado. de! estí mulo. A 5 kH z la variabilidad estoc ástica de enganc he es comparable
En la figura 21 se puede apreciar el co mpo rta mie nt o temporal de una cé lula con el períod o de la onda.
de Cort i durante un disparo .
120
120 A
120 B e
850 Hz 1.000 Hz
406 Hz
: 178/5 182/5
50 E NA++ 72/5
60 60
60
••••_-_. -._.- -_••••••-••••• ~ ••• •••••••••••• •• Nivel del pico
5' <J)
.s
O
O
O
ro
<:al 10 15 20
O
O 10 15 20 10 15 20
.~
ro E
~ al
"O
ro
'0
Potencial postsin ápuco O
120
-50 excitatorio Q:; 120 120 F
e O E
al E 2 .300 Hz
o
a.
' :J
z 1.500 Hz 2.00 0 Hz
178/5 83 /5
234/5
60 60
..
60
-100
E K+
O
..
O O 10
-4 0 -30 -20 -1 0 O 1 2 3 4 5 6 15 20 O 5 10 O
O 10
Tiempo (ms) Duración del intervalo (ms)
Figu ra 2 1. Diferenci a relat iva de potencia l entre el interior y el ex ter ior de un a neurona Figura 22. Int ervalos int erd isparo para una neuro na audit iva am e estímulos de diferentes
especializada ame un potencial de acc ión variab le frecuen c ias
38
39
Mu chos investigad or es acep tan q ue n uest ra ha bil idad para local izar son i-
Sinapsis
dos depen de en parte de la comparación de la infor mación tempor al de los dos dendr ita-dendrita
llícllls; pe ro la relevancia de la in formación tempor al en el en masca ram iento y
en la pe rcepció n de la alt ura tonal es todav ía debatida acaloradamente, tal co-
mo ve re mos más ade lante.
Proceso de tmnsducción en las células ciliada: externas
En 1983 Brownell desc ubr ió qu e las célu las c iliadas externas aisladas pued e n
camb iar de lon gitud ante un cambio en el po tenc ial eléctrico de polar ización
(Bm wn ell, W E., 1985 ). A pesar de que el mecanismo n o se conoc e en deta-
lle, se supone que el estímulo efectivo lo pro vee una varia ción en el potencial Sodio (Na ++). .~.-..-...-..~
...,,",..~·--~"'i
e n la membrana celula r y no , co mo en el caso de las cél ulas cili adas in ternas , *+~~¡~ +++- + ++ + + + !
una cor rien te i ónica. El cambio de longitud tota l se logra sumando los ca m- - - - - - - -- -+ + + + + --- - - -
hios geo mé tricos de gran cantidad de estructuras senso motoras independ ien- Potencial Direcc ión del impulso
Potasio (K+) de acción Interior del axón
tes alojadas en el pl asma de la me mbrana celular. La membrana de las cé lu las
ciliadas externas posee gran ca ntidad de m itocondrias adyacentes q ue le per - - - - - - - - - +1+1++ + Membrana celular
miten tra nsfor mar las mo léc ulas orgán icas para o bten er la energía ne cesar ia de
+ ++ ++++ ++ ::-r- - - - +++ + ++ ~ Medio externo
acu erdo al ciclo de Krebs . Pasajes de iones por concentración y por gradiente eléctrico
Las cé lul as c iliadas externas actúan como pequ eño s mús culos q ue agregan Figu ra 2 3. N euro na tfpi ca y tran sm isión de un potencial de acción en el axón de un a
ene rgía mecánica a la onda progresiva en la membrana bas ilar. Se c ree qu e la n euro na
fracción de en ergía agregada pu ed e ser co ntro lada po r los centros ele vad os de
pro cesa m iento a tr avés de la in for mació n que v iaja por las fibras eferentes de l
\' la resiste nc ia eléctrica de la membran a cel ular muy pequeña, resu lta un co n -
nervio auditi vo . A ct úan co mo una "res istenc ia negativa" q ue compensa la
du ctor eléctrico inefi ciente. En consecuencia, la ca rga posttiva inyectad a en el
energía perdida en el proce so de vibración. Este con tro l de ganancia tamb ién
axón se disip a tra s uno o dos milíme tros de recorrido . Para que la seña l recorra
puede reducir la respu esta ante estímulos muy intensos, y actúa con muc ha
distancias mayores es necesari o regenerar frecuentemente el potencial de .a_c-
mayo r velocidad qu e el reflejo del músc ulo estaped ial. La realimentació n po -
c ión a lo largo del camino a pa rt ir del intercambio iónico . A sí, la in fo rm ac i ón
sitiva q ue tien e lugar per m ite sor tear las lim ita c iones prop ias de un sistema pa-
sivo impuestas por el prin ci pio de indeterminación acús t ico . 5 viaja a lo largo de los axo nes e n for ma de bre ves imp ulsos eléctr i~os qu e son ~l
resultado del despl azam iento a través de la membrana celular de Iones de sodio
Las células ciliadas ex tern as afec tan la transducci ón de las células c iliadas in-
dotados de carga positi va. En la figura 23 se puede o bserva r un esq uema del pro-
ternas prin cipalmente a través de la vibrac ión ind ucida de la membran a basilar.
ceso de tra ns m isión .
Característ icas del n ervio a udi tivo Un pu lso n erv ioso que viaja por un axó n es pot enciado cada ta nto a través
de discontinuidades en las va ina s m íelínicas llamados nódul os de Ranvier. La ne-
cesidad de reforzar repetidam ente la corriente eléctrica lim ita la ve locid ad máxi-
El nervio aud iti vo se di vide en dos ramas ana tó mica y fisiológicamente d iferen -
ma de viaje de los impulsos. Para axo nes de 2 mm de diám etro la velocidad d~
tes, la rama vestibular -o n erv io del equi librio- y la rama coclear. Está form a-
. cond ucción es de 10 mis, mientras qu e para axo nes de 20 mm llega a los 120 mis.
do prin cipalmen te por los axones de las ne uronas conectadas con las cé lulas de l
órgano de Corrí. C o mo la resisten cia eléctrica a lo largo del eje es muy grande
roLe to ma cerca de un quint o de segundo a un me nsaje llegar desde la cab eza ~e un orga-
, A lgo simi lar oc urre cuando un percusion isra "apaga" el sonid o de un timbal. nista hasta sus pies --en un pasaje rápido éste debe compensar este retard o ind ic ándol e a sus
pies qué hacer an tes que suene la not a.
40
41
4. T EORÍA DEL LUGAR cia mecán ica de la memb rana basilar. Recordemos que , para un sistema discre-
to, la frecuencia de resonancia fR dep ende direct amente de dichos pará metros a
Como los pulsos nerviosos que nacen en las células ciliadas int ernas no son lo part ir de la relación f El =vr¡¡;; , en la que k represe nta la rigidez y m la masa del
suficientement e rápid os co mo para seguir la forma de onda exacta de una se- sistema. La variación de la elasticidad en funci ón de la posición, en una razón
ñal acúst ica (las vent anas que definen poseen anc hos de banda limi tados), de- de 1:100 en tre ambos ext remos, es la principal cara cte ríst ica física que ex pli-
ben existir necesariamente otros mecan ismos q ue per mitan cod ificar dichas ca el mapeo frecuencia-espacio que tien e lugar en la cóclea . La est ructura del
seña les. De todos los propuestos se destacan la teorí a del lugar y las teorí as órgano de Cort i, a su vez, ca mbia co nt inua ment e a lo largo de su desa rrollo.
temp orales. Desarrollaremos aquí la primera de e llas y estudiaremos las teorías C erca del apex, en la zona sensible a las bajas frecuencias , las cé lulas son más
tempor ales en el capítu lo dedic ado a la altu ra tona l. grandes y las estereoci lias más largas que en la región cercana a la base, sensi-
El descub rimiento de la mecán ica de la membran a basilar, fundamen to de ble a las altas frecuencias.
la teor ía de l lugar -o teoría to no tó pica-, se deb e a G eo rg Va n Békésy (B ékésy, Si el estribo empuja muy lent amente a la ventana ova l, la peri linfa pasa
G . Va n , 1960). Su magnífico trabajo, que le valió el Premio N obe! de Fisiolo- a través del heli cotrern a y el volu men tot al de líquido permanece constante al
gía y Med icina en e! año 1961 , es e! fundamento de casi todas las invest iga- desplazarse hacia fuera la ventana redond a. Pero si empuja rápidamente a la
cio nes poster iores sobre la fisiología de la audición. La teoría del lugar postul a ven tana ova l, la deflexión en la mem brana basilar co mpensa el cambio de vo-
que cada punto de la membran a basilar vibra a una frecuenc ia partic ular, las lumen y no ex iste flujo a través de! helicotrema, En esencia, una onda de una
más agudas en la zona ce rcana a la base de la cóclea y las más graves en la re- frecuenc ia definida no puede viaja r más allá de un determ inado "punto de cor-
gión próx ima al apex, en una espec ie de mapeo frecuenc ia-espacio ." te" en la cóclea . A medid a que se aprox ima a ese punto, la onda progresiva se
Cu and o vibra el estribo, la onda gene rada en la venta na oval se propaga hace más lenta, la amplitud aumenta y su energ ía es absorbida por el movi-
rápidament e por el fluido coclea r y llega al apex en apenas unos microsegun- miento de la memb rana basilar. En la figura 24 se aprecia una onda prog resi-
dos. Pero tambi én se propaga tran sversalmente a lo largo de la mem bran a ba- va en la membran a basilar generada por un estím ulo sinuso ida l de 200 H z.
silar con una velocidad mucho menor, recor riendo su exte nsi ónen algunos El gradien te espac ial que define el com porta miento tonotópico de la mern -
milisegun dos. La velocida d de propagación en la membrana basilar no es un i- hrana basilar se man ifiesta también en la pendiente de la onda progresiva.
forme y varía en funci ón de la distan cia a la base de la cóclea. Ce rca de la ven - Se puede pensar en la membran a basilar co mo un filtro en el cua l la res-
tan a ova l la veloc idad es rápid a y la lon gitud de onda comparat ivament e puesta máxim a ante una seña l sinusoida l se mueve hacia el extremo apical a
grande. En el apex , por e l co nt rario, la ve locidad y la lon gitud de onda son
much o men o res. La velocid ad finita de la o nda progresiva implica un ret ardo
acumulado en función de la distan cia desde e! estr ibo que produc e un corri- +
miento de fase, tambi én ac umulat ivo, de gran import an cia en algunos proce-
sos de transducc ión coclear.
Esta característ ica mecán ica de la mem brana basilar se debe a q ue funcio-
na co mo un a estructura de sopor te con parámetros que se mod ifica n gradual-
"~
:J
01---":;""------"""----4:---f--f-'-----¡
E
ment e a lo largo de su exte nsión. Es más angosta, gruesa y rígida en su base y <1:
devien e progresivament e más ancha, delgada y elást ica a med ida que se acer-
ca a su extremo ap ica l. La rigide z aumenta progresivamente hacia la base de
la cóclea , mient ras que su masa decrece en la misma d irecc ión. Este grad ien-
.te de rigidez y masa permite la variación grad ual de la frecuenci a de resonan - 20 22 24 26 28 30 32
Distancia desde el estribo (mm )
7 En e l tec lado de un piano se realiza un mapeo espacio-frecuenc ia: cada punto del espac io
-cada tecl a- co rrespo nde a un a frecuen cia diferente. En esta an alogía la membra na basilar Figura 24 . Dos instantes diferentes de una onda progresiva gene rada por una exc itación
vend ría a ser un a espec ie de anti -piano, sinuso idal de 200 Hz
42 43
med ida que la frecuen cia disminuye. En otras palabras, existe una conve rsión 11 kHz 2 kHz 500 Hz 200 Hz
frecuencia-espacio , ta l como se aprecia en la figura 25.
A l margen de la frecuenc ia del estímulo, la form a de la envolvente tem-
pora l de la vibración en cada punto de la membrana basilar sigue isom órfica-
mente la de la vibración en la ven tan a oval. A nte estímulos sinusoidales tod a
la mem bran a basilar vibra de manera aproximadament e sinusoida l, a la fre-
cuenc ia de la seña l de ent rada. Por eje mplo, si se ap lica un a sinusoide de 1.000
Hz, cada punto de la memb ran a que se mueve lo hace a esa frecuenci a, con un Base 10 20 30 Apex
desplazam iento máxim o en el plinto de reson ancia correspond iente a 1.000 Hz. Dista ncia a la base (mm)
El patrón de vibració n de la membrana basilar no depen de del punto so-
bre el cual se localiza la exc itación: vibracio nes que llegan a la cóclea desde Figura 25 . Resonan cia de la membrana basilar en función de la frecuencia
y de la d istanc ia a la base de la cóclea
los hu esos de la cabeza generan respuestas similares a las que prov ienen de la
ventana ova l.
Retardo
Exci tació n de la membran a basilar con un impulso acústico
A
o
C uando se ap lica un impulso al estribo aparece una perturbación ce rca de la 'E
ventana oval q ue se prop aga la lo largo de toda la membran a basilar. C ada
punto de la mem bran a se comp o rta como un filtr o de banda pasante cuya fre-
Ql
'E
~ O
1 AA
Vv v ~
'\
ro
a.
en
cuencia ce ntral cor responde a la frecuen cia de reson anci a característ ica en ese Ql
o
pun to. La form a de onda y el espec tro var ían cont inuamente con la posición ,
hecho que afecta nu estra habilidad para discriminar son idos de ca rác te r tran-
síto r ío .f En la figura 26 se puede ver la respuesta al impu lso en un punto par-
ticu lar de la membran a basilar. O 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
A su vez, la respuesta ante un clic de las células inte rna s en un punto de- Tiempo (ms)
ter mina do de la mem bran a basilar se puede ver en la figura 27.
('il:ura 26 . Respuesta mecánica ante un impulso de l pun to de la membrana basilar
Los picos múltiples aparece n debid o a las oscilaciones aten uadas del filtro ,', .rrespond iente a una frecuenci a de resonancia de 10.000 Hz
basilar co rrespondiente: el intervalo tem pora l ent re picos es el in verso de la
frec uenc ia carac te rística de la zona de la mem bran a basilar. Si la polaridad de l 256 r - -- - - -- -- - -- --,
clic se inv ierte, el patrón se desplaza en el t iemp o de modo que los picos apa-
recen donde an tes se local izaban los valles, efec to muy import ante a la ho ra ~ 192 ..
de local izar espacia lmente una fuente ac úst ica. ~
Estos hec hos tam bién se relac iona n con la percepción de señale , periód i- ~ 128 .
'O
ro
cas. [avel mostró q ue una porción de la actividad de las células ciliadas int er- 'O
.¡¡;
e
nas que responde a los armón icos de una seña l periódica es sensible a la fase ~ 64
.!:
de repetición de la onda complet a, que co inc ide con la fund amental de Fou-
rier de la señal (j ave l, E., 1980) . 0 1-...,..- .,......-,1-.,........
O 2 3 4 5 6 7 8
Tiempo de respuesta (ms)
8 El co mporta mient o de la membra na basilar en este caso es similar al definido por la rrnns-
fonnada wavelet (Basso, G., 200 1a). ¡' jl:ura 27 . H istograma posest ímulo en un punto de la MB ante un clic
44 45
5. C OMPORTAMIENTO ACTIVO DE LA MEMBRANA BA SILAR alinea lidad coclea r se verifica al excitar un oído co n dos sinusoides de frecue n-
Y EMISIONES OTOACÚST ICAS
cias f l y [z- El eco coclear que aparece coincide en frecuenc ia con el son ido de
combinación principal 2fl - f2. Este resultado prueba la disto rsión armón ica o
De acuerdo con la teor ía del lugar clás ica, tal co mo la en unció Von Békésy, la alinea l que actúa duran te el proceso de transducción (Basso, G., 2001 a).
membrana basilar actúa co mo un ana lizado r lineal de Fourier con un poder de La alinea lidad ocurre prin cip almente en los lugares de la memb ran a basi-
resolución insuficiente para ex plicar la resolu ción en frecuencia del o ído hu- lar próximos a la frecu enci a de reson an cia cor respondi ente. En un cadáver la
mano. En otras palabras, el ancho de banda de la resonan cia de la memb ran a respuesta es siempre lin eal, tal como con stató Von Békésy en sus experimen -
es much o mayor que el qu e se mide en los expe rimentos psicoacústicos. Por tos, ya que desaparecen los procesos celulares ac t ivos aportados fundamenta l-
ejemplo, de ac uerdo con la teoría del lugar clásica, al excita r la mem bran a ba- mente por la motr icidad de las células ciliadas exte rnas . La alinea lidad se
silar a una frec uencia central de 1.000 Hz apa rece una banda de 100 Hz de ex- pierde con el daño fisiológico y con la muerte: los ecos cocleares sólo se ob-
tensión , cien veces más grande que la resolución real, que es del orde n de 1 servan en sujetos en buen a cond ición fisiológica. Están relacionad os con pro-
Hz para dich a frecuen cia ce ntral. La ca usa de esta enorme discrepan cia es, lo cesos vulne rab les y las hi poacusias temporarias o pe rmanentes, c iertas drogas
sabemos aho ra, la existencia de un mecanismo act ivo en el órgano de C orti y otros trasto rnos fisiológicos los inh iben.
q ue Von B ék ésy, a l trabajar exclusivamente con cadáveres, no pudo descubrir. En aproxi mada ment e el 30% de las person as aparece n emisiones o to ac ús-
En 1978 Kemp enc ontró que al estimu lar e l t ímpano de un individuo vi- ticas espon táneas, que suceden en ausencia de estímulos acúst icos exte rnos .
vo con un impulso de baja int ens idad se detect a un eco generado en el int e- Los tinnitus o acúsfenos son , en esenc ia, emision es otoacú stic as espontáneas .
rior del oído (Kem p, D. T., 1978) . Co mo estas seña les poseen un ret ardo
comprendido ent re 5 y 60 ms se sugirió que tenían un or igen coclear. Actual-
men te se las conoce como ecos cocleares, ecos de Kemp o emisiones o toacús- 6. FUNCI ON ES DE T RA NSFERENCIA DEL SIST EMA AUDIT IVO PERIFÉRICO
ticas evocadas. El nivel relat ivo de la reflex ión es mayo r a men ores n iveles de
exc itac ión , lo que reve la una operación no lineal. En ocasiones, la ene rgía re- Es posible reunir toda la inform ación descripta hasta aho ra para ana lizar có -
flejada supe ra a la energía incidente ev idenc iando un proceso ac tivo de arn - mo el sistema audi t ivo periférico mod ifica las seña les acúst icas que llegan a ca-
plific ac ión biológica. Las emisiones o toacústicas provien en de la ac tividad da oído. El resultado final es la función de transferencia del sistema auditivo
mo tora de las células ciliadas exte rnas . f¡eriférico, q ue relacion a la presió n acústica de la fuente ex te rior p(t ) co n la vi-
El desc ubrimien to de Kem p modificó profundamente el co noc imiento hración que llega hasta la membran a basilar S(t ).
que tenemos sobre la fisiología del oído. Los procesos coclea res activos posibi- Si hd Y h¡ son las señales ac úst icas a la ent rada de los pabellon es auditivos
litan la sin to n ía de banda angosta que se observa n en las experienc ias psicoa- derecho e izquierdo y &J(t ) y g¡(t) las respuestas al impu lso del espac io acúst i-
cústi cas y que las teorías anteriores basadas en el oído como un receptor pasivo co entre la fuente y las dos ent radas auditivas, hd y h¡ se pueden obtener de las
--como la teoría clásica del lugar- , no podían expl icar. El comp ortamien to ac- expresiones qu e siguen (el símbolo * denota convolución) :
tivo del oído int erno permit e su asombrosa resolución en frec uenci a, su gran
sens ibil idad ant e est ímulos déb iles y ex plica el efecto de supresión de un to no hJ(t) = p(t ) * &J(e)
por otro, temas que desarrollaremos más adelante. h¡(t ) = p(t ) * g¡(t)
La act ividad coclear puede ente nderse tambi én como una relación alineal
ent re las señales mecáni cas de entrada y salida. Numerosos trabajos en ind ivi- Una part e de las respuestas gd (t) Yg¡ (e) está dada por las caracte rísticas del a rn-
duos vivos han demostrado que la respuesta de la memb rana basilar es alinea l, hiente acúst ico exte rior y otra part e por las funci on es de transferenc ia defini-
es decir que la salida no respond e proporcionalmente a la entrada. A niveles das por los homb ros, la form a y tamañ o de la cabeza y el pabellón auricular.
de seña l de entrada por debajo de 60 dB, un mecanismo biológico act ivo am- Los efectos de estas piezas ana tómicas se vuelv en sign ifica tivos cuando las lon-
plifica la respuesta coclear. A medida que el n ivel crece la amplificación dismi- gitudes de onda son comparables con sus dim en sion es a causa del fen ómeno
nu ye y, para altos niveles en la seña l de entrada, ce rcanos a 90 dB, el .Ic difracción , tal como veremos en el capítulo V II . Para simplificar la exposi-
mecanismo act ivo deja de operar y el sistema deviene lineal. Una prueba de la á -m, obviaremos desde aquí las diferenc ias entre los oídos de recho e izq uier- .
46
47
20
do y utili zaremos la tran sformada de Fourier H(w) para simbolizar la respues -
ta espectral de la entrada auditiva h(t).
En el trayecto del estímulo interviene a continu ación la funci ón de tran s-
ferencia del ca na l auditivo externo E(w), que al co mbina rse con H(w) modi - s
fica la señal de ent rada de la man era que se ve en la figura 28.
w:S
;[ -10 .._ .._ --_ _ _ _ ._ _._ _ .... _ ..
En seguida aparece la acció n del sistema de palancas y filt ros del oído me-
dio, cuya func ión de tran sferen cia promedio , C( ro), se aprec ia en la figura 29. -20 L.... _ _L....._---L_--..l '--_-'-.........J
S i se co mbina n las tres funci ones de tran sferenc ia anteriores se obt iene la 0,2 0,5 2 5 10 15
funci ón de transfere nci a total entre la fuen te acústica y la entrada de la cóclea Frecuencia (kHz)
5(W):9
5(w ) = H(w) E(w) C (w ) Figura 28. Función de tra nsferenc ia co mbinada H(oo) E(oo)
En la figura 30 se co mpa ra a 5(w ) co n la sensi bilida d pro med io de l oí do 30 ,..-----.-----.-----r-----,------,

h uman o.
El notab le ajuste ent re la func ión S(w) con la curva de sensibilidad del
oído permite afirmar que e l proce so que sigue luego de la llegada de la seña l a
la membra na basilar es, al menos para int en sidades medias, esenc ialmente li-
neal. Risset afirma: "En un artíc ulo teórico, Yan g, Wan g y Sh amm a ( 1992 ) de -
mostraron que un modelo fisiológico plausible de la periferia auditiva puede
ser invertido y usado para regenera r la ent rada o rigina l completa mente. Este
0 L-_ _-1-_ _- ' - - _ - - - ' ' - -_ _--'-_----'
resultado sugiere que el siste ma audit ivo no pierde inform ac ión ac úst ica en las 0,2 0 ,5 2 5 10
etapas tempranas del proce so" (en Deutsc h, D., 1999) .
Frecuencia (kHz)
Figu ra 29. Función de tra nsferencia del oído medio C( oo)

7. RESPUESTAS NEURA LES A ALTOS N IVELES EN EL SISTEMA AUDIT IVO
Existe ev idencia de que conc urren grupos de de tectores neurales alta mente es- o
'O
pecializados en los niveles superiores del sistema aud it ivo. Ap arentemente, en '0
ID
la cor teza cerebral se ana liza algo más que la frecuencia o la int en sidad de las 'O
o
seña les q ue le llegan . A lgun as neuronas cort icales parecen respond er dir ect a- 'C
al
ment e a los tra ns itor ios de la seña l de ent rada; otras reaccion an an te cambios E
ec.
un idireccion ales de frecuenc ia (se las den omi na "frequen cy sweep detectors" 'O
lO
.......
en la literatu ra especializada) ; otras son sens ibles a la tasa de modul ación (im- ~
:o
.¡¡;
porta nte q uizá para la inteligibilid ad del hab la); otras a los dat os necesarios c:
al
para la localización espacial, etcétera. La mayoría de los investigadores opina 10 dB (/)
que la ton ot op ía de la memb ran a basilar llega hasta el cerebro , pero no cree LI----+---+----ii-----i-----l
0,2 0,5 2 5 10
que la relación iso m órfica se co nse rve plenamente y propon e un rnapeo m úl-
Frecuencia (kHz )
y La relación expuesta es valida sólo para fuentes acúst icas localizadas frente al oyente . En Figura 30. Función de transferenci a ent re el campo extern o y la cóclea 5 (00 ) (pun tos)
el capítulo VII se ana lizará el caso gene ral. "tlmparada con la sensibilidad promedio del oído hum ano (línea)
48 49
o dB r---,----r---r-- ¡ - - - - , - --,---,------, Hem isfe rio Hemisferio
izqu ierdo derecho
-20
"-
•Cl.Q'" '" r
·~ · t '" ?
-40 "'tt} . 'Q. '" ?
~ '~ ~ ?
-60 ~ ········¿.r ~ t
~ ~ ~~...?
-80 .~ rf c/J
.; A b
-100
0,1 0,2 0,5 2 5 10 20 50

Frecue ncia (kHz)
. ~.
......... ~
Figura 31. U m bra les de respuesta de dife re ntes fibras sim ples ante d ifere ntes est ím ulos Núcleos
coc leares
sinusoida les. La segun da pendien te es de l orden de 1.000 dB/octava dorsales
tiple entre ambos siste mas. En todos los casos, e! mape o ocurre entre un siste - Núcleos
. . . . ; ·· · · 0
~~ ••• ::
ma unidimensional, la cóclea, y otro bid imen sion al, la co rteza ce rebra l. Aun- cocleares~
ven trales Oido derecho
que nos representamos al cereb ro co mo una estructu ra tridi mens iona l, qu izá Oído izquierdo
sea más cercan o a la realid ad pensarlo com o un a estructura bidimension a l -la

Figura 3 2. Recorrid o esquemáti co del flujo de inform ación entre el oído ex te rno
mat eri a gris- plegada en num erosas con voluciones.
y la co rteza cerebral
Lo que sí se puede afirmar es que la información acúst ica llega al siste ma
auditivo central con un grado de detalle extremadamente fino. Por ejemp lo, dis-
tin guimos diferencias de apenas 10 ¡.ts entre las seña les que nos llegan a los dos comprendidos en profund idad, algunos auto res han aplicado esquemas similares
oídos; tomand o en cuenta que la duración de los pulsos mismos es de 100 us, al ante rior para crear modelos compl etos de percepción auditiva. Por ejemplo,
diez veces más largos, la precisión del sistema resulta poco menos que increíble. Yoichi Ando postula un modelo en el que aparece un mecanismo precortical de
Las propied ades de respuesta en frecuencia de las células ciliadas internas, extracción de la autocorrelac ión de las seña les, una posterior correlación cruza-
asist idas por la realimentación positi va provista por las célul as ciliadas exte r- da interaural ent re las vías derecha e izquierda y la especialización de los hemi s-
nas, se muestran en la figura 31 para cuatro frecuencias centrales distintas. La ferios cerebrales para el proceso de factor es espaciales o temporales. En la figura
segunda pendiente es de! orden de 1.000 dB/octava, valor consistente con 13 se puede ver un gráfico del modelo de Yoichi Ando (Ando, Y , 1985, 1998) .
nu estra cap acid ad de discriminac ión diferencial de aproximada mente e! 0,3% Para ciert as ta reas compl ejas, como las involucradas en el "efecto de ca-
de la frecuencia central correspondiente. fetería", lOes nec esaria la interacción de ambos hemisferios: el izquierdo -rern-
Se define así el máximo nivel de det alle espectra l posible a la ent rada del poral- t iene a su cargo e! procesamiento de la palabr a, mientras que el derecho
siste ma de tran sducción . De acuerdo con las exp eriencias psicoacú stic as en la- c~pac ia l- proce sa la localización de las fuentes. El model o de Ando se ha em-
boratorio, este nivel de det alle se conserva int acto a lo largo de toda la cade - picado con éxito en el diseño de salas para música no amplificada .!!
na senso neural.
El recorrid o esquemat izado de la información audi tiva, desde que abando- 1(1 Efec to qu e describe la ca pac ida d de co mprende r el habl a en a mbientes de gra n co n rarn i-
na el oído hasta que llega a la corteza ce rebral, se puede ver en la figura 32 . naci ón por ruido . Don ald H all lo den ominó "~ockta il party effect", .
Aunque el recorrido y la naturaleza de la inform ación acústica distan de ser 11 Por ejem plo, e n el A uditorio de Kirishima , en j apón, diseñado por Yo ich i A ndo .
50 51
.!B ro
'" :;:;
ID >
::J cu
C- "-
'" .Q
cu ::J Capítulo II
a:: '"
o
c: c:
Sonoridad
-o ro
'13 §
~..c:
:.= o
ro ~
.~ ~
C- cu
w
'" _
U
cu
"O
o
0"0
a. ro .Q
Es razonab le relacionar la sono ridad - una magn itud perceptual- con la inten-
~ :;"'O
cu U cu sidad de la seña l física que la origina. El mecan ismo parece claro: una onda
8 'c cu E acúst ica produce c ierta presión dinámica en e l aire a la entrada de l oído ex -
Ol
terno y gene ra movimientos de amplitud prop orcion al en el t ímpan o, en los

0'" :2
c: huesos del oído medi o, en la ventan a ova l y en la membrana basilar. El mov i-
E U miento de la mem bran a basilar, a su vez, impl ica la esti mulaci ón de las célu-
"'~
'c
ro ~
U
~
o las ciliadas y la aparic ión de una ca nt idad de impulsos nerviosos viajando por
cu U
::;;: cu
"O
el nervio aud it ivo. La relación causal intensidad física -¿ sonoridad se insin úa
",'"
o ~ cu con aparente cla ridad. Pero, ¿es legítimo considerar a la sonori dad co mo un
cu ro fjj
u~ ::J rasgo autó no mo, que se puede estudiar de manera independ iente, separada del
' ::J U
2 8 ¿- _-.
resto de las caracte ríst icas que definen un sonid o real ? Es prácticamente una
ro c:
cu -
o perogrullada decir que todos los son idos qu e nos resulta n relevantes está n ca-
c: ~
ro "iij
~ ro "O c:
.0=
c:-ro ract erizados por diferencias en la int en sidad del espectro a lo largo del tiem-
E ~ 0 '=
cu .Q
~ po, pues la percepción de la int en sidad del estímulo acúst ico está present e en
o ro c: todos los aspectos de la funció n auditiva. Pero la int en sidad en sí misma, aun-
c: c: ro -o
'13
~~ ~ ~
que resulte vital para la función supe rior de extrae r inform ación de los soni-
Ero<l .Q
¡=ü s dos del ambiente, no es un rasgo de int erés primario para la audición.
-
Aclarado lo anterior, de bemos reconoce r que e l estud io autó no mo de la
roo
c:
c:
ro cu
~
percepción de la intensidad es uno de los tem as tradicionales de la investiga-
Ü X
cu ción acústica y ha gene rado gran cantidad de info rmación relevan te. Durante
rJ los últimos diez años se ha incremen tado not ablemente nu estro conoci mien -
~
-::J
0
c-~
0 U
ro
lo sobre una de sus princ ipa les características, que es la forma en que el siste-
E o ro ma auditivo represent a o codifica la int ensidad de las seña les acústicas.
t3~ "O
c:
O En lo que sigue descr ibiremos el estado act ual de los estudios sobre el te-
ma, tra ta ndo de no perde r de vista nu estro objet ivo ce nt ral -a cumplirse un os
capítu los más adelante: integrar cada un o de los rasgos en un a imagen global
y completa del son ido tal co mo efec tiva mentelo percibimos.
Por el momento , pode mos adop tar la siguiente defin ición de sonor idad,
que nos va a servir para co menzar su estudio: "La sonoridad es el rasgo de la
52 53
sensación aud itiva en té rminos del cual los son idos pueden ser orde nados en rítmica, el decibel, much o más adecu ada para describir la relación ent re la
una esca la que se extie nde del silencio a lo muy sonoro". 1 energía del estímulo físico y la son or idad resultante.t De aquí se obtie ne una
En esta defin ición , la sonori dad aparece co mo un at ributo gene ral del so- de las magnitudes más usadas en acústica , el nivel de presión sonora (NPS) ,5 cu-
nido y se refiere, ant e todo, a la sono ridad globa l de un objeto acústico. Más ya unid ad es el decibel (d B):
adelant e la ampliaremos para ana lizar la sonoridad de los diferentes elemen-
tos q ue co mpone n dichos objetos.
N PS = 20 laglO _ P- [dB]; con Pref = 20 pPa
Pref
l. R ELACi ÓN ENTRE AMPLITUD E INTENSIDA D
En esta relac ión p es la presión acústica en un punto del espacio y Pref es una re-
En el caso de una onda sinusoida l, la amplitud no es más que una man ifesta- ferenc ia convenc iona l estandarizada. Hay varios elementos a destacar en esta
ción de la can tidad de en ergía presente en el siste ma . Como esta ene rgía no se ecuación: en primer término, e! nivel compara dos presion es dinámicas entre sí,
puede medir direct amente y es muy difícil determinar la amplitud de! movi- indicand o cuál de ellas es mayor y en qué proporción. En segundo lugar, para po-
miento de las molécu las, se acostumbra medir algún parámetro más acces ible. der comparar dos nivel es de presión en dB éstos deben haber sido tomados se-
De todos los parámetros relacionados con la energía de la onda, el más senc i- gún una misma presión de referencia (Pref) ' El estándar internac iona l estipula
llo de evaluar es la presión dinámica (p), que puede ser medid a empleando di- que la referencia debe co incidir con el umbral de audibilidad a 1.000 Hz, que
recta mente los micrófon os de presión clásicos. La presión es una magnitud que corresponde a una presión de 20 IlPa. Así se consigue vincular de manera direc-
vincula una fuerza con la superficie sobre la que se aplica, y la unid ad que le co- ta una unidad física, el decibel, con una de las principales características de la
rresponde es e! pascal -que equivale a una fuerza de un newton aplicada sobre aud ición humana. Por último, e! eno rme rango físico presente en los est ímulos
una superficie de un met ro cuad rado. Una onda acústica que se propaga en el acúst icos, en e! que la mayor presión audible supera un millón de veces a la me-
aire está form ada por una sucesión de zonas de presión por enc ima (p positiva) . nor, se reduce considerablemente al ser expresado en decibeles. En la figura 1 se
y por debajo (p negat iva) de la presión atmosférica media. La presión atmosfé- ' aprecia la relación ent re la presión din ám ica de la seña l, exp resada en pascales,
rica norm al, a nivel del mar, es de aprox imadamen te 101.300 Pa y se mantie- y el n ivel de presión sonora en decibeles. Para que el lector pueda vincular es-
ne relativamente consta nte du rante interva los de tiemp o breves. 2 tos valores con los son idos cotid ianos, en la cuarta columna se hace referenci a
a los contextos acústicos con los que habitualm ente se asocian. Se observa que
Decibeles el valor de OdS correspo nde a una presión de 20 IlPa, e! umbra l de audibilidad,
y no a presión cero . Por su part e el umbral de dolor ronda los 120 dS , aunque
Se sabe que para obte ner increm entos de sono ridad en pasos perceptu alm en- este límite varía apreciablemente según la sensibilidad de cada indiv iduo.
te iguales los incrementos en la presión del est ímulo deben ser cada vez ma-
yores. 0, con mayor precisión , para percibi r un aumento de sono ridad Pot encia e intensidad acústica
consta nte ha y que aumen ta r el estímulo un porcentaje también co nsta nte. A
mediados de l siglo XIX Web er y Fechner-' condensa ron mat emát icamente este Toda onda acústica nace en una fuente cuya función es transferir ene rgía al me-
comp ortamiento en dos leyes que permitieron la creación de una unid ad loga- dio. La cant idad de energía (E) que ent rega por unidad de tiempo se denomina
/)()tencia (P) y constituye una de sus característ icas más importantes. La potencia
1 Algunos auto res llaman "inte nsidad subjetiva" a la sono ridad. Por ejemplo, véase el artí- se mide en watts (W) y se vincu la con la energía a través de la siguient e relación:
culo de Plack y Ca rlvon en el que emplean los términ os loudness y subjective mtensíry (Moa -
re, B., 1995) .
P = !1E /!1t [W) = [lou lej/[s]
2 Son los \. 013 hPa (hect opascales) que informa el servicio meteorológico como presión
at mosférica normal.
J Ernst Heinrich Weber (1795-1878) y G ustav Theodor Fechner (1801-1887), fisiólogos ,1 Un poco más adelante vamos a volver sobre este punto.
alemanes pion eros de la psicología ex perimenta l y creadores de la psicofísica. " En inglés se lo deno mina sound pressure leve! (SPL).
54 55
Presión dinámica Intensidad Nivel de presión sonora Situaciones típicas I =P/ A
1~,.
2 Pa
1 wlm 2
10- 2 wlm 2
120 dB
100 dB
---? Umbra l de dolor
Martill o neu mático

Es posib le demostrar que la intensidad acústica de una onda progresiva plana
es proporcional al cuad rado de su presió n dinámica :
1)2
---? 1=-[W/m2j
poc
200 mPa 10" wlm 2 BOdB ---? Calle muy trans itada
en la que Po es la den sidad media del aire y c es la velocidad de propagac ión

20 mPa 10-6 wlm 2 60 dB ---? Conversación normal
del son ido en ese medio. En la figura 1 se pueden observar los valores que to-
ma la intensidad acústica ante algunas fuentes acús ticas cot idian as.
2 mP.a 10-. wlm 2 40 dB ---? Ruido de fondo
en una sala de estar A partir de la intensidad 1 es posib le definir el nivel de intensidad acústica
(N I): 7
200 li Pa 1O-1O wl m 2 20 dB ---? Dormitorio tranquilo
I
20 uPa 10-' 2 wl m 2 OdB ---? Umbral de audibilida d NI = 10 logIo - - [dB]; con Irej = 10 - 12 W / m2
[re[
Figu ra 1. Relación entre presión d inámica y n ivel de presión sonora en decibeles

Para el caso de ondas planas o esféricas progres ivas el valor del nivel de inten-
sidad N I coincide aproximadamente con el del nivel de presió n sonora N PS.
Es decir que la potencia describ e la variació n de energía ~E que oc urre en el C ualq uiera de las magn itudes anterio res (am plitud, presión . N PS, inten -
t iemp o ~t. 6 En otros términos, es el trabajo físico ejercido por la fuente dur an - sidad y N I) puede deducirse de las de más: todas se refieren , en última insta n -
te el t iempo ~t. La potencia ac úst ica máxima que entrega n a lgunos instru- cia, a la cant idad de energía asociada a un a onda acústica.
mentos musicales se puede aprecia r en la siguien te tabla (los valo res son un
pro medio entre varias mediciones) :
1.. PERCEPC¡ÓN DE LA SONO RIDAD
Fuente acústica Potencia acústica máxima l.a sonoridad es una magni tud perceptual y como tal" no puede med irse d irec-
I amen te a partir de sensores físicos. Puesto que todas las técnicas indirect as de
Ca nta nt e (ten or) 0.04W medic ión aportan sus propi os presupuestos y limitac iones, nuestra discusión
Flaut a 0.05W
Trom peta 0,2 W incluirá neces ar iamente una descr ipción de la metod ología aplica da en cad a
Trom bón 6 W 111 10 de los casos expuestos. Quizá la menos con tro vert ida de las técnic as de
Orquesta sinfón ica (fff) 60 W medici ón sea la de comparación de sonoridades , en la que un oyen te debe variar
1;1 intensidad de un est ímulo hasta cons eguir igualarlo en sonoridad con otro
La ene rgía to tal que radia la fuente se propaga en muchas di recci ones . En par- "sl<índar de intensidad fija. En este método el oído se usa com o un detector de
ticu lar, a nosotros nos va a interesar la q ue atrav iesa det ermi nada área (por n-ro y es capaz de revelar cóm o otros parámetros de la señal, tale s como la fre-
ejemplo, el t ímpano de una persona) . Otra magn itud, la intensidad acústica (1). ,'llcncia o el ancho de ban da, afectan la sono ridad. Tamb ién sirve para de tec-
da cuenta de la pote ncia que atravies a un área A: I al' la mane ra en que alguna característica particular del oyen te, como un a
I',;rdida de sensibilidad aud itiva, influye sobre su percepc ión de la sonoridad.
(, La potencia instant ánea se ca lcula a part ir de la derivada de la energía con respecto al
tiempo: Pi = dE/dt. I "",md inte115ity level (IL) en inglés.
56 57
90
Umbrales absolutos
80
•••••• MAP (monoaural)
El umbr al absoluto de int ensidad - la intensidad a part ir de la cua l comenza- - - - MA F (monoa ural)
mos a percibir son ido- fue det erminado por prim era vez en la segunda mitad iD
~ - - MAF (bínaural)
del siglo XIX. Se lo midió a una frecuencia central de 1.000 Hz y se supuso que .9
:J
,
el oído human o mantenía un co mporta miento parejo a lo largo de todo el ran - o
VI
40 \
\
.o \
go audible. Hoy sabemos que, para una seña l sinusoida l de 1.000 Hz, la mayo- ro 30 \
ría de las person as con oído sano co mienza a o ír cuando la inte ns idad alcanza ~
.o 20
\
,,
E -c
un os 10- 12 W/m 2• Esta intensidad equivale a una presión sono ra de 20 millo- :J 10 "
nésimas de pascal (20 IlPa ), o a una amplitud de movim iento de 10-11 m (o O

0,1 Á ¡un décimo del diámetro del áto mo de hidrógeno!). El oído humano es · 10 ...........................'---'-...........L.UJo"'-.................... ,..J.,....,J
incre íblemente sensible a la int en sidad acús tica, pues si pudiésemos perc ibir 0.02 0.05 0. 1 0.2 0.5 1 2 5 10 20
int en sidades aún menores oiríamos el ruido provocado por la agitación térmi- Frecuencia (kHz)
ca de las moléculas del a ire. C uando compa ramos nuestros oídos con los de al-
Figu ra 2. Mínimas int en sidades ac úst icas audib les (umbrales MAr y MAF)
gunos an ima les nocturnos, como los gatos o las lechu zas, no deb emos buscar
en una mayor sensibilidad absoluta la razón de sus excele ntes capacidade s au-
ditivas (no al men os a 1.000 Hz). En cuanto a los límit es de audibilidad para bajas frecuen cias, podemos
La variación del umbral de audición en func ión de la frecuencia del estí- apu ntar que Wh itde midió en 1972 los umbr ales ent re 3,5 y 50 Hz y concl u-
mulo se obt iene hab itu almente a part ir de dos métodos: el de la presión míni- yó que forman un continuum con las curvas a frecuencias medias (a 3,5 Hz se
ma audible (MAr), que se evalúa con auriculares, y el del mínimo campo audible necesi ta n 120 dB para llegar al umbral) (Whiu\e, L. S. et al., 1972) . En 1974
(MAF), que se mide con altavoce s y que incluye los efec tos de filtro del ca na l [on son sugirió, no obsta nte , que para son idos de men os de 16 Hz lo que se oye
audit ivo ex te rno y del pabellón auricular (de gran importancia para definir los es el prod ucto de la distorsión armó n ica del oído (j ohnson y Gierke, 1974) . El
filtros HRTF). 8 La figura 2 permite aprec iar, junto a estos umbrales, el co rres- límite para situacio nes normales parece ser de alrededor de 16 Hz, frecuen cia
pond iente al mínimo campo audible binaural (MAF bina ura l), que es alrededo r cercana a la más baja que produce un a sensac ión clara de altura to na l.
de 2 dB menor que el mon oaural. En la prácti ca clín ica los umbrales se toman co n relación a los con sidera-
Se cons ideran sujetos con aud ición norm al aqu ellos que presentan um- dos "estadíst ica mente normale s" y se miden en niveles de umbral (HL) : un um-
brales de hasta 20 dB por enc ima de la curv a ant erior. Para frecuencias supe- hral de 40 dB HL a 100 Hz sign ifica que está 40 dB por encima del umb ral
riores a los 1.000 H z las diferen cias in rerindivi dua les son apreciables. normal a dicha frecuen cia. En el aud iograma de la figura 3 se puede n ver los
Es notable la semejanza de forma que existe ent re la sensibilidad del oído niveles de umbral HL para ambos oídos.
derivada de los filtros del sistema auditivo periférico (figura 30 de l capítu lo 1) y La sensibilidad del oído human o a la int ensidad es destacable tanto en t ér-
la inversa de la curva umbral que acabamos de presentar. Ad emás de proporcio- minos absolutos como en términ os del rango de valores al que respond e (del
nar la identificación puntual de la causa de cada reson an cia y de cada factor de orde n del billón de veces entre la máxim a y la mínima int en sidad percepti ble,
pond eración espectral, la semejanza aludida permite supone r una codificación " del millón si lo medim os en presiones acús ticas }." El moti vo de semeja nte
espectral "plan a" en los n iveles superiores de procesamiento neural, a partir del ¡;lIlgo hay que buscarlo en el conjunto de son idos habitu ales en los tiempos en
flujo de información que asciend e por el nerv io auditivo. Así, podem os inferir l.,s que estas ca pacidades se fijaron biológicam ente. La gran sensibilidad ant e
que tanto la sensibilidad máxim a del oído alrededor de los 3.000 Hz, como la ('sl únulos minúsculos, del orden del dec ibel, nos permitía oír por ejemplo el an-
ca racte rística de filtro pasa altos que presenta hasta los 5.000 Hz, se origina n dar distante de un depr edador o de una pequeña presa. En aquellos t iemp os
principalmente en la reson ancia acústica del co nducto auditivo externo. r.uuhién exist ían estímulos de gran ene rgía, com o el son ido de un truen o o de
8 Funciones de tra nsferenc ia relati vas a la ca beza (Head Relared Transfer Func uons) . " En números, un a relac ión de 10 12/ 1 en intensidad, o de 106/1 en presión acús tica.
58 59
-10 120 r-r-1r--"F;¡:nrrr--r--r"-rrrTTr---'~,......,r-rrn...,..,
r-- >---
~
R t>
/-.
><
O ................0:~.;.;.:.::~~)l
................ ~ ~ f- .... 110
100
<-------3
~~~>:.,
- -- - ---~ ~
Í'
10 ................... ................... ...~.~.~.~.:.:::."I -,
[-<...... ......... ........ ......... ....... 90
ro <,
<,
ro SO
~
20 ................... ................... ................... ......... ........ ....... ....... ~ 70
\~
T§ El 60
.o o oe
E 30 ...................
Oído dere cho .......... .................. ....,.... ...... o 50
::J / ,,'
Q)
"O X Oído izquierdo :~' '">
Q; 40
Q; 40 ................... .......... ,........ .\. ... ........ .......
30
- Z
>
Z
Oíd o normal
"\ (./-·:7J... ......... ...... 20
50 ................... ---_. Deterioro causado ...... ..\~ 10
60 ...................
- - ~F"'O'T,, ~~r ......... ......... ........ ....... O
0.02 0.05 0.01 0.2 0.5 2 5 10

70
125 1000 2000 4000 SOOO Frecuencia (Hz)
250 500
Frecuencia (Hz)
Figur a 4 . C urvas isófonas (Flerche r-Mu nson)
Figu ra 3. Aud iograma de un sujeto co n oído sano y de otro con hip oacu sia
provoc ada por ruido
Las curvas de igual sonoridad --o isófonas- son una descripción de la varia -
ción de la sonoridad en funci ón de la frecuenc ia del estím ulo (Fletcher y
un grito a cort a distancia . La estrategia que nos permit ió conservar una sensibi- Munson , 1933 ). El nivel de sonoridad (medido en fones) del son ido de prueba
lidad aud itiva ext rema sin que por ello aumente excesivamente la fragilidad del es nu méricamente igual a la int ensidad NI (medida en dB) de l tono de refe-
sistema es comp leja y aún no se conoce comp letamente. Entre los factores de renc ia de 1.000 Hz. As í, por ejemp lo, todo sonido que posea la misma sonor i-
importa ncia que intervienen está , sin duda, el efecto de lupa propio de la com- dad que una sin usoide de 40 dB a 1.000 Hz, tendrá un niv el de sonoridad de
presión logar ítmic a que opera entre el estímulo y la respuesta: nuestra sensibili- 40 fones. U n contorno de igual sonoridad es una línea que une los niveles de
dad es máxim a a pequeñas intensidades y se va reduciend o a medida que la los estí mulos -de diferentes frecue nci as- que present an el mismo n ivel de so-
int ensidad aumen ta. Así, para est ímulos cercano s al umbral de dolor, el conjun - norid ad en fones.
to de mecanis mos periféricos y ce ntrales que se describie ron en el capítulo [ ate- La ca nt idad de información úti l que aportan estas cur vas es muy gran de .
núan considerablemente la señ al que nos llega del exterior. Menc ione mos algunos ejemplos:
• La form a de las curvas es, para bajos niveles de sono ridad , parecida a la
Co ntorn os de igual son oridad del umbra l de la figura 2: la sensibilidad decrece a medida que nos alejamos de
la zona central del espectro hacia las a ltas y bajas frecu en cias. Es necesario
Existen dos téc n icas que per miten medir la sono ridad: una es la estimación de aplicar más energía en la región grave que en la media para obtener el mismo
magnitud, que intenta determina r va lores absolu tos de sono ridad; la otra co n- resultado auditivo.
siste en med ir el nivel de sonoridad en relaci ón con una sinusoide de 1.000 Hz. • Para sono ridades interm edias, entre 60 y 70 fones, es menor la diferen -
Las curvas de contornos de igual sonoridad de la figura 4 se o btienen a partir de cia de sensibilidad aud itiva en func ión de la frecu encia.
este último mét odo y resultan algo diferentes según el laboratorio en el cual • Las curvas de nivel, para altas sonoridades, son prácticamente planas:
fueron determinadas (la forma exacta no debe tom arse literalmente ). Pueden nuestro oído responde de man era similar en todo el rango audib le a co nse-
ser repro ducidas con senc illez al pedirle a un oyent e que iguale la sonoridad cuencia de la ate n uac ión prov ista por los mecani smos de protección auditiva.
de una señal sin usoidal, de frecuenc ia e intensidad variab le, con la de un to- • Existe una zona de máxima sen sibilidad entre los 2.500 y los 3.500 Hz.
no estándar de 1.000 Hz a N dec ibeles. Obvia decir que son un promedio ela- Tiene una gran import ancia pues el est ímulo que ocupe esa banda va a ser per-
borado sobre la base de las respuestas de cientos o miles de suje tos. cibido con mayor facilidad que los que ocupen o tras regiones de l espec tro . Co-
60 61
rno ya sabemos, este máximo de sens ibilidad se or igina en la resonancia del exac tam ente una esca la logar ítm ica similar a la paut ada en la esca la de decibe-
conducto aud itivo externo . les: un estí mu lo de SOdB deb ería tener una sonoridad dob le que uno de 40 dB.
• Si se gene ra un a señal sin usoidal que recorra completamente una de las O qu e a cada ad ición de 10 dB le debería cor respo nde r un paso siemp re igual
curvas de igual sonoridad se oye un glissando perfecto, de sono ridad consta nte . en sonor idad. Como veremos a con tin uación , nu evas mediciones psicoac úst i-
U na co nsecue nc ia de las cur vas is ófo n as, muy co mún en el ca mpo de la cas refut aron estas afirmac iones.
mús ica, es el con tro l de sonoridad --o loudness- que poseen algunos prea rnpli-
ficadores de audio. Las grabaciones de piezas de música se realizan por lo ge- La sonoridad
ne ral a n iveles altos, donde la sens ibilidad del oído es plan a. S i se reproduce n
a n iveles menores cambi a el ba lanc e espectra l al ca mbiar nu est ra sens ibilida d A pesar de qu e las técn icas qu e emplean al oído co mo un detector de cero -co-
auditiva: o ímos debi litadas las regiones más graves y agudas del espec tro . Para rno la de compara c ión de sono ridades- han prob ado ser útil es en la determi-
cor regir este efecto algun os equipos de aud io vienen equipados con un co ntrol nación de los facto res que afec tan la sono ridad, no proveen un a med ida
de sonoridad qu e refuerza los extremos del espec tro a bajos n iveles de ampli- d irecta de la sensac ión percibida. Uno de los procedimientos empleados pa ra
ficac ión . La salida del pream plificador co n el contro l de sonor idad ac ti vado si- resolve r el prob lem a fue aplicar la técnica de estimación de magnitudes, en la
gue de mod o más o menos fel iz la curva umbral de aud ibilida d. que el oye nte debe simplemen te asigna rle un n úmero a cada son ido de d ife-
rente intensidad. Una alte rnativa co ns iste en emp lear la técnica de producción
Escala absoluta de sonoridad de magnitudes en la qu e, a la in versa, el oye nte debe ajusta r la in ten sidad de un
estímulo de acue rdo a un número dado de antemano. Durante la décad a de
El n ivel de sonori dad en fones toda vía se refiere, sin emba rgo, a la seña l físi- 1950 Steve ns empleó ambos mét odos para desarroll ar sus esca las de sonoridad,
ca . Só lo proporcio na un a esca la co mpa rativa y no perm ite descr ibir la sono ri - que descr iben la relac ión entre sonoridad - pe rcep tua l- e int en sidad - física-
dad prop iam ente d ich a. ¿Cuán to más sonoro es un son ido de 70 fone s qu e uno (Stevens, S. S. , 1959) . Los prob lem as met od o lógicos que encon tró fueron
de 50 fones ?Con los elem entos ha sta aquí evalu ados no se puede dar respues- muy gra ndes pues resulta d ifícil cuan tificar la so nori da d que es, co mo ya sabe-
ta a esta pregunta. H ace falta definir un a unidad auté n t icamen te perceptua l, mos, un a magnitud en te ramente percep tual. S teve ns tu vo qu e defini r un a
que per mita medi r la magn itud de las percepciones en sí mismas y no con re- nueva unidad , el son, para cuan t ificar d irect am ente la sonoridad. El son es, fi-
lación a referencias externas. nal mente, un a un idad lin eal : un soni do de 2 sones posee el dobl e de sonori-
dad que un o de 1 son, y un o de 3 sones e l tri ple. A l igual qu e la altura, la
La ley psicofísica sonor idad es un a magnitud perce ptu al y de bería definirse a partir de un a un i-
dad de referencia estab le. Pero com o la esta bilidad en el ca mpo de las sensa -
Este problema se enca ró in icial mente en la segunda mi tad del siglo XlX. Los fi- ciones es muy poco confiable, se tom a un a referen cia física exte rna: una seña l
sió logos alema nes W eber y Fechner propu sieron una ley psicofísica que pre- 1.000 Hz y 40 dB (40 fones) produ ce por defini ción un son ido qu e posee un a
tendía vincular los est ímul os co n las percepciones a través de un a relaci ón SI mon dad de 1 son (para la a ltura también se tom a una referencia física ex te r-
común a todos los sent idos . Esta ley fue co nside rada ade cuada y se la reprodu- un: 440 Hz definen el La en m úsicaj .l ''
jo en la mayo ría de los tex tos especializados hasta no hace much o t iemp o. A partir de los trabajos de Steve ns se encon tró q ue la relación estí mulo-
Aunque dio lugar a un a varieda d de técnicas y un idades de medición entre las rvspuesta sigue aprox imada mente un a ley de potencia, diferente a la ley laga-
que se enc uentra el decib el, en la mayorí a de los casos no es ni apro ximad a- I (u n ica de los psicofísicos. Propu so la siguiente relación ent re la sono ridad (S)
men te co rrec ta. La definición más difundida de la ley psicofísica estable ce que y la intens idad (1):
la magn itud psicológica percibi da es prop orcional al logar itm o del estímu lo fí-
sico. Es dec ir, que multiplicaciones sim ilares en la magn itud del estímulo ge- s = k [ 0,3 [son es]
neran adic iones prop orc ionales en la respuest a perc eptual, transformand o un a
esca la geomé trica en un a escala aritmé t ica. En el caso del son ido , lo an ter ior 1" El co nt exto es aquí de gra n impo rta nc ia. 40 fone s originan un son ido de 1 son só lo si en
sign ifica simplemen te que nu estro s juicios sobre la sono ridad deben seguir 1"" instantes prev ios el oyente se enc uent ra en un ambie n te ex tremada mente silen c ioso .
62 63
20
El valor de la constante 1< depe nde de las cond iciones experimentales y de las
10
unidades empleadas. El gráfico de la figura 5 muestra la relación de S tevens (n o
5
hay que olvidar que es consecuencia de exper imentos realizados con ond as si- 2
nusoidales y no con est ímulos complejos). Se puede observar que a un aumen-
(ñ
to de 10 dB en el est ímulo le corresponde una duplicación de la son or idad . g 0,5
A unq ue la relación anterior ha sido ratificada para seña les mayores a 40 dB, .e 0,2
"O
se le hacen varias crític as: existen diferencias individuales muy grand es, y el re- ~ 0,1
sultado se obtuv o a partir de medias de poblaciones muy grandes y dispersas. 0g 0,05
Warren encontró que la duplic ación de la sonor idad corresponde a un aumento e5l 0,02
de la int ensidad de 6 dB, en vez de los 10 dB de Stevens (Warren, R. M., 1970). 0,01
Además, aunq ue las técnicas de estimación y de producción de magn itudes tie- 0,005
nen la ven taja de permit ir la obtenci ón de una relación directa ent re un paráme- 0,002
0,001 L.J._ _ ~ .J
tro físico y un rasgo perceptual, a diferencia de la técn ica de comparación de O 20 40 60 80
magn itudes, ambas asumen que los oyentes pueden usar los números para califi- Intensidad (dB)
car sus percepciones de un modo cons iste nte. Existen varias razones que permi-
Figura 5. Relac ión de Steve ns ent re int en sidad y sonoridad
ten suponer que esto último no siempre es así, que los oyent es polarizan y sesgan
sus juicios de estimación acerca de la son oridad que perciben . Sin embargo, asu-
miendo que el riesgo existe y extremando los cuidados metodológicos, la técnica compensación "A " sigue de man era aproximada la curv a de respuesta del oído
dc estimación de magn itud es es usada ampliamente para medir la sonoridad. para un niv el de sonor idad de 30 fon es, en compensac ión "B" la de 70 fones, y
Existe una objec ión aún más impor ta nte: algunos auto res desaprueban el Vil compensac ión "C" es práctic amente lineal. Cas i toda la normati va relacio-
hecho de preguntar por la sonoridad en sí misma. De ordinar io, evaluamos nada con acústica ambien tal está especificada en decibeles A . Por ejemplo , el
ciertas caract er ístic as de las fuentes acús tica s co mo un todo que invo lucra al nivel equivalent e de ruido aceptable en zonas residenciales no debería superar
contex to, a la perspect iva y a muchos otros factores circunsta nciales. La est i- los 65 dBA en horarios de actividad diurna ni los 50 dBA durante la noche.
mación aislada de la sono ridad parece una abstracción muy difícil de rea lizar. Si se tom an dos lectu ras de una misma seña l, una en dB lineales y otra en
Helmholtz escribió: "[oo.] estamos muy bien entrenados para eva luar los obje- .IBA, por lo general la últ ima da rá un valor inferior pues se filtran las bandas
tos que nos rodea n, pe ro fallamos completamen te cuando inten ta mos obser- ,:raves del espec tro de ruido.
var las sensaciones per se [oo.]" (Helmholtz, H . va n , 1885).11 Los medidores de n ivel sono ro, sin emb argo, sólo son confi ab les cuando
~! ' los emplea para med ir seña les co nt in uas de larga dur ación. Las respuestas
Medidores de nivel sonoro I\(' rceptuales ante seña les impulsivas o muy cortas no corresponden a la mag-
nirud que indican. Los med idores tampoco proveen lecturas sat isfacto rias de
Los instr umentos de medició n más tradicio nales en acústic a son los medidores 1;1 sonor idad de est ímulos compuestos muy separados en frecuencia. Y, por su-
de nivel sonoro.V que permiten det erminar el nivel de presión sonora . Por lo ge- puesto, no está n ca librados en sones, la uni dad que debe emplearse para eva -
neral, tie nen un banco de filt ros en la etapa de entrada que permite med ir la luar la sonoridad propi amente dich a.
señal acústica tal co mo llega al micrófono - respuesta.p lana o lineal- o com-
pensada según cierto pat rón espectral. Así, un medidor de nivel sonoro en Sumario de unidades relacionadas con la sonoridad
ll c.un ino que nos llevó de la amplitud de las ondas en el aire a los sones es co rn-
1I Traducción de GB. Hermann Ludwig Ferdinand van Helmho ltz ( [821·[ 894 ) fue un cien-
I,I! 'jo Y se podría suponer de una dificultad inn ecesaria. Sin embargo, la aut én-
tífico alemán de destacada actu ació n en el campo de la fisiología, la ópt ica, la acústica y la
electrod inámica. I jl :1 complejidad está dada por la multipl icidad de mecanismos que act úan en la
12 Co noci dos popularmente como "decibelímetros". I od iíicaci ón auditiva de la int ensidad. Para ilustrar esta situac ión volvamos a las
64 65
curvas isófonas de la figura 4: se las esque matizó en dos dimensiones -nótese que
no aparece la dimen sión sonoridad- , pero en realidad deberían haber sido repre-
senta das en tres dimension es. En la figura 7 se puede ver una porción de la re-
presentación trid imension al, más adec uada pero mucho más difíci l de leer.
Para sin te t izar e l camino q ue llevamos recorrido, la siguien te tab la enu-
mera las diferentes un idades relacion adas con la sono ridad, co n sus unid ades
y carac te ríst icas part iculares.
Tab la 1. Magnitudes relacion adas co n la sono ridad (pa ra ondas acústicas plan as)
Magnitud Naturale za Unidad Rango audible
Amplitud Física Metro 1O - 1Im _IO - 5 m

Presión Física Pascal 20 ~Pa - 20 Pa
N ivel de presión sono ra (N PS ) Física dB Od B - 120 dB
Intensidad Física W /m 2 10 - 12 W/m 2 _ 1 W /m 2 " ' J
Nivel de int en sidad (NI) Física dB OdB - 120 dB

Nivel de sono ridad Hí brida Fon Ofon - 120 fones
So nor idad Psicológica Son Oson - 250 sones
3. DISCRIMI NACiÓN DE LA INTENSIDAD

, ..
La discriminación en inten sidad se refiere a la hab ilidad del sistema auditivo
I-'i¡:ura 6. Med idor de nivel sonoro
para detec ta r diferencias en tre la in ten sidad de dos o más est ímulos. Durant e
el siglo xx se rea lizaron numerosos ex perimentos con el fin de medir los lími-
tes de este sign ificativo aspecto de la audición, que adquir i ó espec ial impor-
tancia con la llegada del audio digital. Sonoridad
(sones)
Lim en de intensidad
Varias defi niciones de la diferencia apenas perceptible (DAP o JN D13) en inte n-

sidad, tambié n llamada limen de intensidad (óL), fuero n emp leadas en el pasa-
do . En el presente las más usuales son:
NI
1) L1L = .11/1 co noc ida co mo fracció n de Webe r (dB)
2) L1L = l a lag (.11/1) la fracción de Weber definid a en dB
3) L1L = 10 lag {(l +.1I) 11) en d B.
13 JND, del inglés just IlOticeable difference. I-I\'"r;, 7. Representación tridimension al de las cu rvas is ófonas
66 67
En todas ellas 1 es la int ensidad de la seña l de base (el pedestal) y L'lI la int en- 8 kHz
sidad del menor incremento detectable por el oyen te. 1,5
Para med ir el limen de intensidad se emplea con frecuencia el método de ¡¡¡
elección forzada entre dos alternativas (2 AFC) , en la q ue cada sujeto de be op - ~
a. 1,0
tar obligator iament e por alguno de los sonidos q ue oye, aún cua ndo le parez- <!
o
can indi stinguib les. El umbral de discri minac ión se obtiene cua ndo la 0,5
diferencia L'lI en e l est ímulo prod uce el 75% de respuestas correc tas. Esta téc-
nica se ap lica a part ir de tres métod os prin cipales: método de detección de
modul ación , de det ecci ón de incrementos y de discriminación de estímulos 40 60 80
pulsantes. En la detección de modulación los oyentes deben not ar la presenc ia Nive l de intensidad sonora
de una peq ueña modulació n en amp litud en una seña l dad a. En la detección de Figura 8 . DAP en int en sidad
incrementos y en la discriminación de estímulos pulsantes deben percibir un cam-
a) b)
bio en la intensidad de un est ímulo está nda r (e l pedesta l). r--- - - - - - - ---,
100 _ Le y de Web er ·4
.. .. Desvio
La Ley de Web er
80 ·6
.'
Para ruido de banda anc ha se co mprobó que el mínimo cambio de int en sidad ~ 60 ~ ·8
el
det ectable es una fracc ión constante de la intensidad del estí mulo. En otras pa- .Q
el
o
o 'O 0 .10
labras, la razón L'lI/I se mantiene con stante. Éste es un buen ejemplo partic ular
de la con oc ida Ley de Weber, que establece que nu estro sistema perceptivo dis- 20 ·12
crimina cambios porce ntuales con stant es. La relación L'll/l se llama fracción de
·14
Weber y es habi tualmen te expresada en dB como L'lL = 10 log (MIl). En el ran -
20 40 60 80 100 20 40 60 80 100
go de 20 a 100 dB el valor de L'lL permanece entre 0,5 y 1 dB. Ce rca del um- 1010g(l )
1010g(l )
bral de audibilidad la fracción de Weber aumenta drásticamente, en part icular
a frecuencias po r deba jo de los 200 Hz. Fi ~ura 9. Ley de Weber y desv ío de la Ley de Weber para est ímulos sinusoida les
En contraste con los resultados anteriores para ruido de banda ancha, la

100
fracción de Weber sufre un desvío cuando el estímu lo se construye con sin usoi-
90
des: la discriminación mejora al aumentar el nivel del est ímulo. A 80 dB L'l L
¡¡¡ 80
llega a ser de 0,3 dB, por debajo de la Ley de Weber. En la figura 9a se pued e ~
e 70
ver que el gráfico de la relación 10 log (L'll) en func ión de 10 lag (1 ) presenta -o
'13 60
una pendiente de 0,9 en vez de 1, ta l como correspon dería a la fracción de We- 1!!
'13 50
x
ber exacta. De acuerdo con McGill y G oldberg, la diferencia quizá se deba al Q)
40
Q)
ensanchamiento de la zona afectada de la memb rana basilar a causa del incre - -o
a; 30
>
mento en la intensidad del estímulo sinusoidal (McG ill y Goldberg, 1968 ). Z 20
El desvío -aumento en la discrim inación - que sufre la Ley de Weber pa- 10
ra estí mulos sinusoidales puros parece relacion arse con el patrón de en masca -
ramiento: al aumentar el n ivel sonoro se act ivan otros ca na les espec trales q ue 1000 2000 5000
Frec uencia ce ntral (Hz )
contribuyen a la sonor idad general. Este ensanc ha mie nto de la zona de in-
fluencia en la membran a basilar se puede apreciar en la figura la. lIil:ura 10. Ensan chami ento de la zona de la memb ran a basilar que explicaría el desvío de
l., I.'·Yde Webe r para est ímulos sin usoidales
68 69
Ley de Fechne r para la sonoridad
Como ya sabemos, la sonor idad es el correlato perceptual de la in ten sidad físi- donde lL es el umbra l para un pul so de larga duración y r es un a co nsta nte
ca, al men os en una pr imera aprox imac ión . Podemos suponer, por lo tanto, la que repr esenta el "t iempo de integración " del siste ma aud itivo . La relación
existencia de alguna relación ent re la discriminación de la sonoridad y la habi- an te rior es válid a sólo para inten sidade s ce rcanas al umbr al. Lejos del mismo
lidad de los oyentes para det ect ar diferenc ias de int en sidad. La Ley de Fech ner no se puede asegurar la form a que ado pta la integración de la en ergía, So la-
va un paso más allá proponiendo que la fracc ión de Weber, !ll/l, está asociada mente se puede decir que, para una int ensidad dada, la sonoridad crece has-
a un inc remento const ante de la sonoridad !lS (Fechner, G., 1860): ta los 200 ms de dur ación . Para menos de 80 ms de dur ación se puede afirmar
que, aprox imada men te, energía cons tan te = sonoridad constan te. Aqu í la frac-
LlS = k LlI/ [ ción de Weber disminuye 3 dB cada vez qu e se duplica la dur ación del estí-
mulo. Más allá de un a cierta dur ación crít ica Ar la fracción de We ber deviene
en la que k es una constante. Aunque esta relaci ón fue defendida dur ante más constante. Para dur acion es mayores a 500 ms los umbr ales son independien -
de un siglo, se ha com pro bado que es incor rec ta, tal co mo advertimos antes, tes de la dur ación .
en este mismo ca pítulo (Zwislocki y [ord an, 1986 ). El va lor crí tico !lt es función de la frecuenc ia: decrece al aumenta r esta
últ ima y to ma valores que van desde 100 ms a 250 Hz hasta 10 ms a 4 kH z. A l
parecer, int egramos mejor los impulsos de alta frecuencia.
4. O TROS FAcrORES QUE INTERVIEN EN EN LA PERCEPCIÓN DE LA SONORIDA D En el órgano de tubos no se puede mod ificar la inten sidad de cada son i-
do porque las teclas sólo abren o cierran las válvu las que distr ibu yen el flujo
Integración te mporal de aire. S in embargo, la int egración temp oral a ene rgía constan te le permite
al organ ista modul ar agógicamente la sonor idad, actuando úni cam ente sobre
Garner y Miller enco ntraro n q ue el umb ral de audición de la sonor idad corres- la du ración -al menos en los pasajes veloces.
ponde más a un a ca nt idad const ante de ene rgía que a una can tid ad consta n-
te de potencia - o de int ensidad-, al men os sobre cierto ran go de dur acion es Factores espectrales
(G arner y Miller, 1947) . Tiemp o después, Hen ni ng descubr ió q ue para estímu-
los de corta dur ación la ene rgía del men or incremento det ect able (!lE) se En un ex perimento desarrollado en la década de 1950 , Zwicker, Flottorp y
mantiene constan te , contra la creenc ia generalizada de la constanc ia de la in- Stevens le pidieron a un grupo de oyentes que igualasen la sonor idad de una
tensidad .!" banda de ruido con la de un to no sin usoida l está ndar (Zwicker, Flot torp y S te-
En 1995 Moore co mpro bó que para dur acion es men ores a 200 ms la in- vens, 1957) . Los autores concl uyeron que si la sonor idad en cada band a críti -
tensidad necesaria para la det ección del estímulo se incrementa a medid a que ca sigue la ley de la pot encia S = k [ 0,3, al distribuir la misma int ensidad de la
la duración disminuye (Moore, B., 1995) . Pareciera que el oído integrara la señal en n band as crít icas se debe obtene r un incremen to en la sonor idad to-
energía de la señal: ral simplemente porqu e:
l x t = cte. k [0.3 < nk (IJn)0.3 , para n > 1
En la que [ es el umbr al de intensidad para un pulso de du ración t. En la prác- En la actualidad se realiza el siguien te aná lisis para calcul ar la sono ridad tota l
tica la siguiente expre sión da mejores result ados: de un conjunto de est ímulos sinusoida les combinados.
1. Nunca se suman los niveles de presión sono ra o los niveles de intensi-
14 G . B. H enning (19 70) . Este hech o ya había sido nota do por Exner en 1876: "Tam o [os dad direct amente: dos est ímulos de 80 dB jamás gene ran juntos 160 dB.
umbra les absolutos en sonor idad como la sonoridad en sí misma depend en de la duración 2. Si se desean sumar señales de frecuencias cercan as - amb as dentro de la
del est ímulo." misma banda crí tica- se deben sumar en prim er término las intensidades efi-
70 71
caces, pues la in fo rmación de fase no es relevante. 15 Con este resultado se pue-
30 ~------------1
de ob ten er el nivel de intens idad en dB . A continuación se extrae de las c ur-
vas isófonas (figura 4 ) el n ivel de sonoridad en fones y, por fin, de la relación
25
de Stevens (figura 5 ) se ob tiene la sonoridad tota l. Po r eje mp lo, si se suma n
do s seña les de 100 y 120 Hz co n e l m ismo n ivel de inten sidad de 80 dB, el re- <ñ 20
sultado da un NI de 83 dB, equivalentes a 77 fones q ue correspo nd en aprox i- Q)
<::
o
madamente a una son o ridad de 12 sones . :; 15
ce __.. __ __. .. .. . __ _
3 . S i se des ea sumar señales de la m isma frec uencia el procedimiento es "O
simi lar, pero en pri me r luga r deben suma rse las amplitudes por q ue aquí la in-
s
(l)[[nación de fase resulta decisiva al aparecer el fenómeno de interferencia de S 10 . Sonoridad de cada señal (13 sones)
o nda s: dos señales de 80 dB de la misma frec uencia puede n dar lugar a un a 5 _ _ Sonoridad combinada
co mbinación cuyo nivel tenga entre O y 86 dB (Bas so , G ., 200 1a).
4 . S i la d ifere nc ia de frecuencia en tre los estímulos supera un a banda cr í- o L,--,---,- - - , , - , - ¡ - ¡ - ¡ - ¡ - ¡ - ¡ - ¡- j
rica, en la práctica es usua l sumar directamente las sono ridades en sones . Sin 024 6 8 10 12 14 16 18 20 22 24 26
e mba rgo, e l escenario es algo más complicad o, y sigue la curva de la figura 11. Separación de alturas en 1/12 de octava
5. Si los est ímulos están m uy separados en frec uenc ia, en más de tres oc -
lav as, se co mpo rtan indepen die nte men te uno del .o tro y no p uede ha blarse Figu ra 11. So nor idad co mbinada de dos siuusoides de l3 sones cada un a. La frecuencia de
C( In pro pieda d de un a verdadera sum a de sono ridades. la señal base es de 300 Hz
U n eje mp lo nos permitirá co mpre nder cómo se estructura la sonoridad total

e n un so n ido per iódico co mplejo . Consideremos una onda d ie nte de sierra dentro de band as crít icas solapa das . En el ejemplo se su ma~1 las inten sidad es de
l t ónicos 6 7 y 8 q ue co n trib uyen co n 21 sones al co njunto. La suma co m-
p~:~r:lcanza u~os
co n un nivel de intensidad de 100 dB y un a periodicidad de 200 H z. Las fre-
cue nc ias, niv eles de in tensidad y sonoridades de los pr imeros ocho armó nicos 200 sones. En co mparación, un a sin usoide de 200 H z co n un
se rá n entonces: . 1dee im tensiida d de 100 dB de ter m ina un a sono n dad de apenas 80. sones
ruve d . Se
entiende claramente aq uí la ca usa del mayor rendimien to sono~o asce ta o a una
i, = 200 Hz NI = 98 dB Sonoridad = 70 sones señ al periódi ca compleja. Éste es uno de los motivos q ue exp[¡~~ el e~ca.so em-
fz = 400 H z NI = 92 dB Sonoridad = 45 sones pleo de señales sin usoida les e n cualq uier siste ma de co murucac ion acusnca,
h = 600 Hz NI = 88,5 dB Sonoridad = 40 sones
f4 = 800 Hz N[ = 86 dB Sonoridad = 35 sones Cam bios en la se ns ibilidad auditiva provocados por sobrestimulación
fs = 1.000 Hz NI = 84 dB Sonoridad = 30 sones
f6 = 1.200 Hz NI = 82,5 dB Sonoridad = 20 sones Adaptación auditiva
h= 1.400 Hz N[ 8 1 dB
= Sonoridad = [8 sones
fs = 1.600 H z NI = 80 dB Sonoridad = 15 sones
U na propied ad co mú n a to dos los sentidos co ns is,te en q ue la resp uesta neura~
tí los establ es de larga durac ión decae r ápidamen te, luego de su apa
an te es trnu " . ib . "E
rición, hasta alcanza r un c ierto esta do de eq uili n o. sta
ada/nación auditivan
La sonor idad total se obtiene al sumar las sonoridades de los pr imeros cinco ar-
ll11ín icos de ac uerdo con la figura 11 -Ia distancia entre ellos supe ra el ancho de resulta de la in teracc ión en tre la ene rgía de respu esta del oye n te fr.e~~e ; ~
b:lI1da c rítico-, agregand o luego la ocasionada por los de mayor orden que cae n estímulo estac ionario y la en ergía ne cesari a par a mantenerl o en act rvi a . a
contrapa rte psico lóg ica es un a de cl inac ión en la sonorida d apa ren te h asta que
1', L: IS band as críticas se van a ana lizar en deta lle en el capítulo Ill. Por ahora , nos alcanza ésta alc anza un va lor constante. . 1
l'11 11 saher qu e cor respo nde n aprox imadamente al 15% de [a frecuen cia cent ra l considerada. Sorprende, sin e mbarg o, qu e la sono rida d ante estím~ los de medi a o al ta
intens idad n o pa rezca de cr ece r en el t iempo . Só lo los est ímulos dentro de os
72
73
prim eros 40 dB por enc ima del umbr al presentan una apreciable adapta ción Fatiga auditiva
auditiva . En la figura 12 se muestra de manera esquemát ica esta prop iedad de
la percepci ón audit iva. La fatiga auditiva es la pérdida temporal de sens ibilidad q ue aparece cuando
Las seña les de alta frec uenc ia se adapta n más profund amente que las de nos exponemos a un son ido muy in ten so y se la mide luego de remover e! es-
baja frecuencia, y los sonidos estables en el tiempo lo hacen mejor que los so- tímulo que la ca usa. Generalmente está ca racterizada po r e! desplazamiento
nid os modu lados. Si cumpl en ambas condicio nes, es dec ir, estímulos agudos y temporario del umbral (rrs) " .
estables, los son idos pued en llegar a desaparecer completamente luego de una La fati ga audi tiva es más acusada a altas frec uenc ias. El máximo ns ocu -
exposició n prolon gada. Este efecto no ocurre con estí mulos de baja frecuencia . rre entre 4 y 6 kH z y está relacionado con el n ivel de presión acús tica de! rui-
Las med icion es típ icas de ca mbio de umbr al por ada ptació n se realizan do -a mayor n ivel en dB mayor inc reme nto del umbral- , co n la frec uencia y
co mparando las sono ridades en el ataque y tres minu tos más tard e. En condi- el espectro del mismo -cuan to mayor sea la frec uencia, hasta llegar a 6.000
ciones favorab les, la adaptac ión puede alcanza r una disminución de sonor idad Hz, mayor será e! incremen to de! umbral- y co n el pat rón tem poral del rui-
co rrespondie nte a un ca mbio de -20 dB en el estí mulo. do -los ruidos intermitentes prod ucen menos pé rd idas te mporarias que los
En la adaptación patológica la sensación auditiva desapa rece co mpleta men- conti n uos.
te ante un est ímulo conti nuo al cabo de un os segundos. \ Como ejemplo, pode mos observar en las figuras 13 y 14 e! deterioro y la
posterior recuperación de la sensibilidad audi tiva ca usada por un ruid o de un
ancho de ban da de una octava, ce ntrado en 4.000 Hz y con nivel de presión
il~~
sonora de 85 dB.
Observamos que la sensibi lidad auditiva se recupera tota lmente sólo 48
horas después de la supresión de la fuen te de ruido. Si una persona, por ejem-
plo, reac tiva la fuente a las ocho horas de haberla suprimido, su umb ral desde
Tiempo (s) el reinic io será 10 dB mayor que .e! norm al a ca usa de la fatiga auditiva, obl i-
gándola a aumen ta r 10 dB la potenc ia de la fuente acústica para alcanzar e!
11~t:::: ~
nivel deseado: su oído verá multi plicada por diez la ene rgía recibida. Este pro-
ceso puede realimen tarse varias veces hasta alcanza r niveles capaces de provo -
car daños no reversibles. Algunos de los mecani smos fisiológicos involucrados
en la pérd ida temp oraria de la audició n son los mismos que producen la pér-
Tiempo (s) dida permane nte de la capac idad audit iva. La diferencia es sólo una cuestión
de grado .
il__ r----
I
Tiempo (s)
. 1
En la actua lidad (nor mas ISO ) se consi de ran seguros ni veles de ha sta 85
dBA, ocho horas por día. A part ir de este va lor a cada incremento de +3 dB
en la in tensidad de! estímulo le corresponde un a disminución a la mit ad de!
tiempo de ex posición per mitid o. l ? Por ejemplo, si se aplica esta regla una per-
sona podr á expo nerse sin riesgo auditivo hasta dos horas por día a un nivel
fl-oo---t:- ,~
contin uo de 91 dB. En algunas norm as se est ipula un n ivel máximo, por ejem-
plo 115 dBA, que no debe superarse en ninguna circunsta nc ia.
Tiem po (s)
16 Del inglés Temporary Thre$holdShifr.
17 Ya no se emple a la "regla de los 5 dB" propiciada por ciertas industr ias.
Figu ra 12. A dap tación auditiva (gráficos esquemáticos )
75
74
aumentar el intervalo tempor al entre a mbas seña les y de saparece luego de un os
iD poc os cientos de mili segundos. El efec to es mayor si los dos est ím ulos tienen la
~ 15
~
m isma frecu encia y si son expuesto s al mism o oído (o a los mismos oídos ).
.o
E
:J
~ 10 D etección de señales sin u soidales en presencia de ruido

o
e
'"
E Para ana lizar se ña les sin uso ida les a las qu e se le agreg a una banda de ruido se
¿ 5 emplea un a met od ología sim ilar a la qu e se usa par a estud iar la d iscriminación
en intensid ad entre sin uso ides .
Un efect o temporal relacionado es el de desborde (overshoot).1 8 El umbral
O :--;:--'--"'-~....------r------,----J ne cesario para de tectar un a seña l breve es mayor si se la prese n ta ce rc a del ata-
1 2 4 8 12 16 20 24
TIempo de exposición (horas)
que o la ex t in ció n del ruido en mas caran te . El efecto alimenta entre 10 a 15
dB c ua ndo el ru ido en mascara nte cubre un gra n anc ho de banda y la seña l es
FiJ.:lI ra I J . Desarro llo de las pérdid as trans irorias de audic ión
de alta frecu encia. Las componentes en frecuencia del ruid o por enci ma de la
señal son impo rta n tes para produc ir el efecto .
20 I-.--,--r----.--,--r----.-~ El efecto de overshoot m uestra qu e el umbral pa ra un breve est ímulo sin u-
soidal in iciado luego del ataque de un ru ido puede ser 10 dB mayor q ue si se
iD 15 lo co loca, por eje mplo, 200 ms de spué s del in icio del ru ido e n rnasca ra nte
~ (Zwicke r, E., 1965) . Algunos experimentos pos teriores seña laro n q ue , pa ra
~
.o q ue oc urra un gra n efecto de overshoot, el ru ido enrnascarante deb e co ntener
E
:J
a; 10 ene rgía a frec uencias alejadas de la frecu encia de la seña l, y qu e esta ene rgía
"O
o de be apa recer un brev e inst an te a n tes del ataque de la señal (M cFad den, D.,
e 1989 ). La figu ra 15 sinte t iza los traba jos de McFadd en.
'"
E
:J 5 Los mecanismos qu e dan lugar a estos resultados no se co mp rende n to da-
«
vía con clarid ad, aunq ue sin dud a está n vinc ulados con el princ ipio de inde-
terminación ac ústico (véase el A pé nd ice 11) .
Patologías auditivas
Los efec tos del ruid o sobre el sistema aud it ivo humano se pueden di vidir en
des plazam ien tos tempora rios del umbral de aud ibilida d (p érdid as tem pora rias
11Il:l'cltl cn w de la sonoridad o reversibl es, TIs ) yen despl azam ientos perm anentes de dicho umb ra l (pér di-
das permanentes o irreversibles, PTS) .19 Estos últ imos pueden ser causados por
la destrucción inmediat a de las estr uc t uras físicas del oído, en cuyo caso esta -
I!ll co n rrnstc co n la redu cci ón de la sono rida d
. l '
ducid id
pro UCI a por SO Ill os pre sent
suuu rnneam enre co n el son ido de prueba (enm iento) I . es mos en presenc ia de un trauma acústico, o por el efec to ac umu lat ivo de suce -
asca ram len to os son idos qu e sivas expos iciones durante un per íodo relativamente pro longa do .
:Ip:lrl'cell a n tes del de prue ba pueden a veces produc í . '
. l i S' . ucir un mcremento en su so-
I H)I"I( al , I el pnmer estímulo es por ejernpl o 20 dB _ . I
1 l ' ' , mas mtenso qu e e segun -
1 o , os cxperune n ros muestran qu e este último pued . . 18 La palab ra "desborde" no es una traducción literal de "overshoo t" (exceder, rebasar, so-
I I . e m crementar su sonorlda d
J:lsla a eq uIvalente a un aume n to en intens ida d de 15 dB El e d brepasa r), pero creemos que describe mejor el fen óm en o alud ido.
. electo ec rece al 19 Del inglés Pennanent Threshold Shift.
76
77
Condición Umbral 50 .,-- - - - - - - - - - '71
40 horas semanales
durante 10 años
a) Bajo _ 40
en
:3-
ro
Alto 'g 20
E
ro
'C
e) - Bajo ~
o(J) 10
a.
Bajo
O-fC-- - - - ---r- - - ---;
80 90 100
Alto Nivel sonoro en dBA
Figura 16 . Pérdid a perma nente de aud ic ión para f = 4.000 H z

Fi¡:ura lS . So nog ramas esquemáticos de l efecto de overshoot. a) y b): situac ión b ásica : e )
" e}: efectos del anc ho de banda del ru ido y del retardo en el ataq ue O
- --- -
\
\ al 10
:3- 20
l'érdida /Jcm tancntc de sensibilidad ro
'6
ID
E
30
__ 5 años
,
ro 40 \
Las pérd idas auditivas permane ntes puede n dividirse en dos grandes grupos: 'C
~ 50 \
las cond ucti vas y las sensone uralcs (o percep tuales). Las co nd uctivas llevan a o(J)
a. GO
- - - 35 años ...
.. - - - - ~
1111 alimen to en el umbral más o menos parejo en func ión de la frecuenc ia,
70
mientras que las sensoneurales son más complejas . 125 250 500 1000 2000 3000 4000 GOOO 8000
El co nocimien to que posee mos del desplazamiento perman ente de l um- Frecuencia (Hz)
lirnl de audibilídad o PTS se basa en estud ios rea lizados en industrias y en ex-
Figura 17 . Pérdid a perm an ente de aud ic ión en fun ción de l período de exposic ión
peri men tos con ani males. De ellos se desprend e que existe una relación
aprox imada mente lineal entre las pérdidas de sensibilidad y el n ivel sonoro de
la ex posición por encima de los 85 dBA, ta l co mo se observa en la figura 16. la ene rgía en frecuenci as relati vamente bajas: las personas acude n al médico
Se considera que los n iveles infer iores a 80 dBA no prod ucen efectos nocivos. sólo cuando tien en dificultades en la comun icaci ón oral, etapa en la que el
La relación entre el tie mpo de exposición y la variación espectral de las proceso ya mani fiesta un gran ava nce .
pérdid as es más compleja. Es comú n que apa rezca dur ante los primeros años En las figuras 18 y 19 se pueden ver microfotografías de la membrana basilar
una disminución de la sensibilidad a lrededo r de los 4.000 Hz, ampliándose en las que se aprecia el deterioro que sufren las células de Co rti a causa del ruido.
co n el co rrer del t iempo ha sta oc upar la banda co mprend ida entre los 3.000 y
los 6.000 Hz. Este proceso se muestra en la figura 17. Reclutamiento auditivo
Vernos que las frecu enci as más altas (entre 3.000 y 4.000 Hz) son afecta-
das en los primeros añ os de exp osición, mientras que las men ores (entre 1.000 El reclutamiento auditivo ocurre cuando el umbr al de audibilidad de una perso-
y 2.000 Hz) son alcanz adas con pérdid as sign ificativas al cabo de 20 años o más. na está por encima del norm al, pero su audici ón es normal a altos niveles de
En los gráficos de las figuras 16 y 17 se ve con claridad que e l oído es má s sonoridad. En el sujeto con reclutamiento, la sonor idad aumenta más rápid a-
sensible, y por lo tanto más frágil, en la región de altas frecu en cias que en la mente con la inten sidad de lo que ocurre en un oyente con oído promedio - al
de bajas. Este he cho es el causante de la det ección tardía de la hip oacusia pro- men os en las frecuencias afectadas. Se podría asimil ar a una suerte de compre-
vocad a por ruido, dado que la inteligibilid ad de la palabra hablada depend e de sión del rango de sono ridad .
78 79
Moore relacion a el reclutamiento auditivo con un dañ o en las cé lulas ci- S. CODIFICAC IÓN DE LA INTENSIDA D
Ijadas exte rnas de la membran a basilar, que impid e la correct a cod ificación del
rallg(l din ámico del estímulo acústico (Moore , B., 1997).
El estudio de la codificac ión de la intensidad t ien e por objet ivo exp lica r la
fo rm a qu e tiene el oído de informarle al cerebro sobre cuán intenso es un es-
t ímulo. 0, más específicamen te, por la man era en qu e se configura la repre-
sentación mental de la int ensidad física de una seña l a partir de la ac t ividad
de las células nerviosas del siste ma audi t ivo. Se ha verificado que la cod ifica-
ción de la intens idad está vinc ulada di rectam ente co n nu estr a habilid ad pa-
ra discriminar entre estímulos de d iferente intens idad. Si podemos dis tingu ir
entre dos sonidos, la dife renc ia debe esta r representada en todos los n iveles
de la cadena aud itiva , desde la cóclea hasta los ce ntros superiores de decisi ón.
Los experimentos de d iscri minación de la intensidad son , por lo tanto, la he-
rram ienta base para c rear modelos de codificac ión de la inten sidad .
U n primer modelo, muy simplificado , establece q ue la int ens idad de un
\ est ímulo sinusoida l es codificada simplemente por la tasa de disparo de las fi-
hras de Co rti sinton izadas a la frecuen cia del est ímulo: a mayor inte nsidad ,
mayor cantidad de disparos por unid ad de tie mpo. Este modelo, sin embargo,
presenta var ios incon venientes.
El problema del ran go din ámico
JOi,:ura I H. Cé lulas de Con i en un o ído sano Co mo hemos visto, el sistema auditivo h umano es capaz de detectar diferen-
cias en la int ensidad de los estí mulos sob re un gran rango din ámico, ta n gran-
de co mo 120 dB en oyentes co n oído sano. La mayor ía de las células nerviosas
audit ivas, aque llas que present an una tasa de disparo relat ivamente alta, tie-
nen bajos umb rales de excitación y ran gos dinámi cos co mpara t ivamente pe-
queños. Casi todas se satu ran al llegar a una int ensidad de aprox imada mente
60 dB cuando son esti muladas a sus frecue nc ias característ icas. La proporció n
de fibras en e l nervio audi tivo q ue present an un amp lio rango di námic o (60
dB o más) es muy baja , de alrededor de l 10% del total. Por lo tanto, se supo-
ne que interviene más de un mecani smo dife rente en la discrim inaci ón de la
intensidad. Los cambios en intensidad pod rían ser codificados por cambios de
la tasa de desca rga de las ne uro nas que ocupan el ce ntro de l patró n de exc ita-
ción , por una extensión del patrón de exci tac ión (más neuron as entra n en
operación ), o por una combinación entre ambos mecan ismos. La sensibilidad
a la fase tambi én parece int ervenir en el proceso .
La importa nte Ley de Weber para ruido de band a anc ha, que cont inúa ac-
tuando para altas int en sidades, debe proven ir de la operación de l siste ma audi-
tivo, no de propie dade s estadísticas de l estímulo. Pero no se puede exp licar a
JOi,:u ra ) 1). C é llll:.s de Corri en un oído dañado por ruido
partir de la infor mación cod ificada por una sola neurona por los motivos antes
KO
81
apunt ados. Es nece sario enco nt rar un model o que combine la tasa de disparo las siempre en la zona de actividad, lejos de la saturación. Estamos famili ari-
de un número pequeño de neuronas, cuyos umbrales y cambios dinámicos es- zados con algo similar, el contro l automát ico de gan ancia en la vista, que nos
tén esca lonados de man era tal que permitan cubrir el rango dinám ico total del permite ver bien tan to a pleno sol como en la relati va oscuridad de un cine.
siste ma auditivo. La informació n de las neu ron as que respond en a frecuencias En el caso de la vista la recuperación es bastante lenta y necesitamos un buen
ca racterísticas similares podría combinarse y operar en un "cana l" indep en- tiemp o para adapta r nuestra sensibilidad al pasar de una situa ció n lumínica a
diente. La ley de Weber parece responder a cada un o de estos cana les, sinton i- otra diferente. En el caso de la audición, sin embargo, tenemos que ser capa-
zado a un rango de frecuencias dado y en paralelo con los demás. ces de procesar sonidos que varían dramáti camente en inten sidad sobre un in-
Buscando una respuesta a est e probl ema, C arlyon y Moore sugirieron que tervalo de tiempo muy breve: nec esitamo s disponer del ran go dinámic o
en la codificació n periférica intervienen neu ron as de diferente umbr al de dis- completo "a l instante".20
paro : a int ensidades moderadas int ervienen las neuronas de bajo umbra l, lue- La supresión es un proceso no lin eal en el cual un a inte nsa exci tac ión en
go éstas se saturan y son reemplazadas paulatinam ente por las de alto umbr al una región de la membrana basilar reduc e la excitación en las region es veci-
de disparo (C arlvon y Moore, 1984) . En la misma direcci ón , Delgut e indic ó nas. Al tener una con stante de tiemp o muy pequeña ocurre solamen te cuan-
que son pocas las neuronas necesarias para dar cuenta de la discriminación en do se presen ta n simultá nea mente el estímulo supresor y el suprimido. Es
inte ns idad (Del gute, B., 1987). Según este autor, el número requ erid o es de posible que el mecani smo que prod uce la supresión ac túe tam bién com o un
aprox imadamente 100 neuronas. Si se extiende esta conclusión a la totalid ad con tro l automáti co de gana ncia para est ímulos de band a ancha, y ayude a dar
de las célul as que oc upan la cóclea, la discriminación deber ía ser much o ma- cuenta del gran rango dinámic o del siste ma auditivo .
yor que la que ten emos (podría ser de menos de 0,1 dB a 1.000 Hz). De ser
cierta esta hip ót esis, la lim itación no depend ería de la información que tran s- Codificación por sincronización neural
porta el ne rvio audit ivo sino de los nivel es centrales de procesami ento.
Carlyon y Moore sugiriero n que, en ciertas circunstancias, la int ensidad pue-
Codificación por extensión del patrón de excitación de ser cod ificada por la estruc tura de seguimiento de fase en las cé lulas audi-
tivas: un incremento en la int ensidad de un est ímulo sinusoidal en presencia
Una explicación posible para la aparente paradoja es que, al men os para estí- de ruido puede gene rar un aumento de la ca nt idad de células sincron izadas
mulos de band a angosta , la información sobre la int en sidad se obtiene ta mbién con la estructura fina del est ímulo, diferente de la del ruido (C arlyon y Moo-
de las cé lulas auditivas sint on izadas a frecuenc ias por encima y por debajo de re, 1984) . Los experim en tos mostra ron , sin emb argo, qu e este mecani smo por
la frecuencia del estímulo. A pesar de que las células correspond ientes a la fre- sí solo no pued e ser respon sable del gran ran go din ámic o presente en el siste-
cuenc ia del estímulo se satu ren, las que tien en frecuencias centrales diferentes ma audi t ivo.
reciben men os excitac ión y continúan dentro del rango de funcion amiento. Se
ha sugerido que estas célul as "fuera de frecuencia" son las respons ables de la co- Modelos basados en funciones intensidad-tasade disparo
dificación a alt as intensidades (Zwicker y Fastl, 1990) . Sin embargo, los resul-
tados de los experimentos sobre enmascaramiento demostra ron que, a pesar de Una hipót esis diferente esta blece que las células de Cort i con altas tasas de
que la extensión lateral de la zona de excitación puede ayudar a discriminar a disparo son respon sables de la codificación a bajas intensidades, mientras que
altas intensidades, el sistema aud itivo puede codificar la int en sidad sobre un las cé lulas de Cort i co n bajas tasas de disparo se destinan a codific ar los estí-
gran rango din ámico emp leand o sólo la inform ación proveniente de una pe- mulos a altas inten sidades, por enc ima de la sat urac ión de las anteriores. Los
queña banda de frecuencias centrales en la membran a basilar. model os basados en esta hip ót esis se denominan modelos de doble población. La
principal dificultad que enc uent ran es la de explica r la constancia de la frac-
El papel de la supresión y de la adaptación
20Plack y Ca rlyon dan un muy buen eje m plo r. pode mos oír el grito: "¡El psicópata está
Una posible solución sería que el sistema aud itivo pudi era ajusta r el rango de bajando al co rredo r!", y a co nt inua ció n los débiles sonidos de sus pasos en la escalera
operación de las cé lulas de acuerdo al nivel de ent rada, de modo de mantener- (Moore, B., 1995).
82 83
ci ón de Weber a lo largo de casi todo el ran go dinámico . Esta d ificultad se in- Memoria de la intensidad
c rc rnc n ta al con stat arse que hay muchas más cé lulas con altas que con bajas
tasas de disparo. Muchos experimentos de discr iminación de la int ensidad emp lean secuenci as
En uno de estos model os de doble población se simularon las codificacio- en las que dos interva los de observac ión están sepa rados por un intervalo inter
ncs basándose en el núme ro de células necesarias para cubrir el rango dinámi- estímulo ( HE). La ausencia de un efecto sustancial de este interva lo en las ta-
co co mpleto a una frecuencia dada: co n sólo d iez cé lulas combinadas es reas de discrim inación ci tadas suste nta la hip ótesis de que los oyent es emplean
posible imita r al siste ma audit ivo (Vieme ister, N . E , 1988). Sin embargo , po- la memori a de largo té rmino para hacer las comparac iones ent re el prime ro y
sccmos más de 50 para la misma funci ón . Es decir, tenemos a la salida del ner- el segundo de los est ímulos. Un almacena miento en la memor ia de corto tér-
vio auditivo inform ación más que suficien te para cod ificar los est ímulos sobre mino debería decaer en el t iempo, generando un a gran dependencia con la du-
II n gran rango de intensidades. Qu izá la pregunta no deba ser, entonces, por ración del int ervalo inter est ímu lo. Como un eje mplo extremo , Pollack
qllé es tan buena la cod ificación a altas int ensidades, sino por qué no es me- empleó un HE de 24 horas y prácticamente no encont ró det er ioro en la tarea
jor de lo que es a bajas inten sidades. de discriminación de la int ensidad (Pollack , 1., 1953 ).
La memoria de largo término puede ser anu lada variando al azar, ent re
Límit es a la discriminación en intensidad pruebas, la int ensidad de los estímulos en los inte rva los de observac ión. C uan-
do esto ocurre, el éxito en las tareas de discriminació n de la in ten sidad baja
Hemos trazado los caminos que pueden servir para representa r la int ensidad notab lemente al aumenta r el HE. Por ejemplo, la fracción de Weber aumen ta
en el siste ma audit ivo periférico . A hora consideraremos el caso de los límites de 2 a 5 dB cuand o el HE crece de 250 ms a 8 s. Este ca mb io se debe, presumi-
impuestos por las transformacion es que ocurren en los ce ntros de procesa- blernente, al deterioro del almace na miento en la mem oria de corto término.
mien to neura!. En esta etapa debe incorporarse una descripción del mecan is-
mo que permite que las intensidades puede n ser almacenadas en la memor ia y Codificac ión de rasgos y codificación contextua l
de có mo [as limitaciones de la memoria afecta n los resultados en las tareas de
discrim inación . Durlach y Braida distinguieron dos modos dife rentes de operac ión de la me-
moria relacionada co n la discr imina ción de la int ensidad: la codificación de ras-
Limitaciones periféricas y centrales gos y la codificación conrextual (Durlach y Bra ída, 1969). En la primera son
almace nadas las sensaciones dire ctas -inmediat as- producidas por e l est ímu-
Los ex pe rimen tos reali zad os par a de terminar las car act er íst icas de la d is- lo, que tienden a decaer en el tiem po (son afectadas por la d uración del HE).
c riminac ión de la intensidad, para exc itac iones q ue ab arca n una so la fre- En el modo de codi ficación contextual, por otra parte, la int ensidad es codi-
cue nc ia ce n t ra l en la membran a bas ilar, arroja n resultad os contradi ctor ios. ficada en relación con una int ensidad de referencia exte rna o con relación a
Mie nt ras los modelos de doble pob laci ón sug iere n qu e la discr imi na ci ó n una referenci a int erna "fuerte", como el umbral de audibilidad o el umbral de
csl:í ca racterizada po r la fracc ión de Weber, los modelos fisiológicos predi- molest ia.
ce n mejor disc riminac ión a baj as y media s in tensidades q ue a gra ndes in - En ci rcunsta nci as norm ales la memor ia de rasgos es suficientemente rica
I e ns ida des. co mo para ser relativamen te inmune a la degradación con el tiempo. Pero si
La riqueza de la infor mación presente en el nervio auditivo y la falla de la información en la memor ia de rasgos es reducida gradua lmente, el sistema
los modelos de cod ificación basados en las propiedades de las fibras audit ivas, se apoya cada vez más en la codificación co ntex tual - aunque ésta no es efec-
en Sil intento por exp licar el éx ito de la Ley de W eber, implican qu e en algún tiva a intensidades medias debid o a la d istancia que separa al estím ulo de los
plinto del proceso neural central no se hace un uso completo de la informa- lím ites perceptuales de referen cia.
c i ón q ue circula a nive les periféricos (C arl yon y Moore, 1984) . Presum ible- Es evidente que el siste ma auditivo necesita cod ificar la int ensidad de
ment e, esta lim itación cen tral det ermina el dese mpeño de los oyentes en las modo relati vo en muchas ocas iones , simplemente porque los objetos aud itivos
ta reas de d iscriminación de la intensidad, y ev ita q ue el siste ma audit ivo ten - (co mo los fon ema s en el habla) se defin en por su intensidad relativa, ya sea
ga un rendimiento superior a bajas int ensidades. ent re co mpone ntes espec trales o ent re eve n tos sucesivos. La intensidad abso-
84 85
lula no afecta la identidad de los objetos auditivos en la mayoría de los casos
- juzgalllos que es e l mismo perro el que ladr a a Z o a 50 m de d istancia. Es ló-
gico pensa r, por lo tanto, qu e el siste ma aud itivo deba extrema r su eficienc ia
l'ar;1 las co mparacio nes entre est ímulos cerc an os en el tiempo an tes que para
1, IS separa dos por más de un os cientos de mi lisegund os.
_)~~
•
Estímu lo
~ -
. la función de
transferencia
d 1 ld
e 01 o .
externo/medio
I ,,
~
Filtro fijado a
'
Transformar
el espectro
en patrones q~
de excitación
Transforn~ar
la excítaci ón
en soncridad
especifica
"
-
Calcular el
área bajo
el palrón
lli
especr ~co
de sonoridac
• •
Figur a 20 . Mode lo de Moore en bloques para calcu lar la sonoridad
(l . M ODELOS DE PERCEPCIÓN DE LA SONORIDAD
Se han elaborado varios model os formale s que intentan describi r cuant ita t i- En la figura 20 se pued e ver el model o en bloq ues de Brian Moor e en su
v.nuc nrc la percepci ón de la sono ridad. Zwicker desarrolló un model o de so- versión de 1997 (M oore, B., 1997) . La sono ridad to ta l es proporcional al área
no ridad basado en la distribución del patrón de excitació n en la mem brana bajo un patrón de sono ridad específico. Este esquema se ha incorp or ado a cier-
hasilar (Zwicke r y Fastl , 1999). En su modelo el est ímulo es co nve rtido en un a tos med idores de sonoridad -no de inten sidad o presión ac úst ica-, y de ac uer-
.100 IOrit.1ad eS¡Jecífica por banda. crítica (N ') a través de un a ley de pot encia: do co n los informes parece que funciona razonabl emente bien .
Al gun os paquetes de software para acústica de salas emplean modelos si-
milares para brinda r inform ación sobre predi cción de sono ridad y con ellos es
posible ca lcular los ecog ramas en una esca la de sones. En la figura Z1 se ap re-
En la que N ' es la sonor idad por ban da crítica, E es la inten sidad de la exc i- cia un ejemp lo de esos ecogramas.
t ac i ón ,y C y o. son co nsta ntes con o. < 1.
Esrc model o fue modificado por Moore y Glasber g, qui enes asumen q ue,
Sa no
(l( Ir debaj o de 1 kHz, la forma del filt ro aud itivo es igual al contorno isofóni- e
Cll correspond iente a 100 fones, y que por enc ima de 1 kH z la form a de l filtro
('Sl;í determ inada por la inversión de la curv a umbr al de aud ibilidad (M oore y
_ _ ~_--+ _ _l_,~ _ _,
( Jlasherg, 1986).21 La exc itac ión es con vertid a en sonori dad específica por
hand a crít ica a partir de la siguiente expresión:
N' = e [(1señal)ll - (1 umbral )a J

Aquí I , d I" 1 C lu mbral son las inten sidades co rrespo nd ientes a la exci tac ión y al
umh rn] definido en el párrafo anterior. N ót ese que si 1señal = 1umbl<,l la sono ri-
dad especí fica es nul a, y que cerc a de l umbr al un pequeño ca mbio en la exc i-
tuci ón provoca un cambio proporci onalm ente grande en la sono ridad. La
sonoridad globa l se ca lcula integrando las sonoridades específicas positi vas a
III largo del patr ón total de exc itación . El éxito de este modelo al predec ir la Figura 21. Ecograma en sones simulado para un a butaca en la platea del Teatro Arge nt ino
va ri uc i ón de la sono ridad en funci ón de cambios en frecu encia, intensidad y de La Plata . La fuente ac úst ica emitió un impu lso de Dlrac virtual"
.mclu: de banda apoya la h ipótesis que esta blece que la sonoridad está relaci o- * En este caso se utili zó el paquete C ATI- Acoust ic v7.2.
uada co n la select ividad en frecuencia del siste ma aud itivo periféric o, y no di-
rec ta me nte co n la intensidad física del est ímu lo acústico .
1I En Moorc, B. (1995).
H6 87
Capítulo 111
El oído como analizador espectral
En los ca pítu los precedentes menc ion amos muchas veces las nociones de ban -
da crí tica, análisis en frecuencia, discriminac ión espectral y enrn ascaramien-
ro. Ha llegado el momen to de analizar estos conceptos con det alle.
La habilidad para separar o resolver los compone nt es espectra les de una
señal co mpleja es co nsecuencia de la capacidad de aná lisis en frecuencia del
siste ma aud it ivo. Por ejemplo, si dos flautas afinadas a dife rentes frecuencias
se soplan simultánea mente , es posible oí r a l mismo tiempo dos sonidos dife-
rentes. Se sabe que el aná lisis en frecuenc ia dep end e en gran medida de la ex-
plorac ión espectra l que oc urre directam ente en la cóclea . Toda seña l
compleja, como la que gene ra la voz human a o un inst rumento de música, es
procesada en esta temp rana eta pa de la cadena audit iva. Los comp on entes si-
nusoida les o de band a angosta son separados, cod ificados y tran smitidos de
modo ind ependi ent e por el nervio aud itivo . Más aún , esta etapa temprana del
aná lisis no puede ob viarse: todas las seña les sufren necesariament e dicho pro-
ceso. Por esto, la percepción de un son ido como un todo cohe rent e depende
del rearmado que tien e lugar en algún punto superi or de l sistema nervi oso.
1. D IFERENCIA APEN AS PERCEPTlBLE ( DAP) EN FRECUENCIA
U na de las preguntas ele men tales relacion ada co n el tema es la que inquiere
sobre nuestra habilidad para discriminar entre dos seña les cuyas frecuencias son
ligeramente diferentes. La respuesta , obtenida a part ir de un procedimiento psi-
cofísico clásico, int roduce el concep to de diferencia apenas perceptible ( DAP o
JND) I en frecuenc ia, o limen de frec uencia . Para medirla se realiza un expe ri-
mento en el cual los sujetos oyen alternat ivamente dos sinusoides de igual so-
norid ad; mientras una de e llas mantien e constante su frecuenc ia la otra la
1 En inglés, just noticeable difference.
89
modifica levement e. El objeto es dete rminar la mín ima diferencia en frecuen- Detectable Más dificil de detecta r Sin cambio
cia necesaria para distinguir ent re ambas seña les. En las figuras 1 y 2 se pue-
den ve r los va lores de la DAP en frecuencia en funci ón de la frecuenc ia de base.
El resultado puede sintet izarse diciend o qu e la DAP en frecuen cia se man -
t ien e ce rcana a 1 H z para frec uencia s por debajo de 1 kH z y que crece paula-
18 Frecuenc ia Frecue ncia Frecuencia
• Ruido enmascara nte de ancho de banda varia ble • Señal sinusoidal de prueba
16
,.
N 10
14
12 -
-
/ Figura 3. Esquema de l experi mento de Flet ch er
;S
''::¡ 8
b t iname nt e a partir de esta frecuencia. Por encima de 5 kHz la DA P aument a
--
)
más rápid ament e, y más allá de los 10 kHz, n uestra habilidad para discriminar
6 - _ o -
entre diferentes frecuencias prácticamente desaparece.
4 La c uest ión cambia si en lugar de sinusoides emp leamos seña les periódi -
.... . .,.. '
2 -
cas co mplejas. Tal como veremos en e! capítu lo v, en estos casos la DA P pue-
de llegar a ser tan pequ eñ a com o 0, 1 Hz.
64 125 250 500 1000 2000 4000 8000
Frecuencia (Hz)
2. B AN DAS CRÍT ICAS
Figura 1. DAr absoluta en frec uenci a; a ) obten ida a partir de seña les sinusoida les de inten-
sidades medias, ent re 60 y 80 d B, b) obten ida a part ir de seña les sin usoidales de int en sida- Ya a mediados de! siglo XIX a lguno s in vestigadores supo nía n qu e e! sistema
des ce rcanas al umbral de aud ibilidad (Wi er, [esteadt y G reen, 1977a ) audit ivo no func iona en bloqu e y q ue divide las seña les para su trat ami en to
de ta llado . Una hip ót esis tempran a planteaba la presencia de alguna clase de
0.9 aná lisis de frecuenc ia a niv el del siste ma aud it ivo periférico. Este proceso de
0.8, aná lisis en frec uencia se h a estud iado indirectam ente a part ir .del fenómeno
0.7
de en mascaramiento, que ocurre cuando un son ido en mascara o "tapa" a ot ro de
diferente frecuenc ia. El fenóme no de enmascarami ento se ana lizará con deta -
0.6
lle en e! punto 4 de este capítulo.
~
-<i 0.5
0,4 Experime nto de Fletcher

0.3
El exp erimento fund ac ion al en este campo lo rea lizó Harvey Fletcher en
0,2
1940. 2 Fletche r mid ió e l aumen to de l umbral de detección para una señal si-
0.1 nusoida l en funció n de un ruido en mascaran te con densidad de pote ncia cons-
ta nt e y banda pasan te variab le. El ru ido estaba centrado a la frecue ncia de la
64 125 250 500 1000 2000 4000 8000
Frecuencia (Hz)
2 Harvey Flercher (1884-1 981) , físico e ingeni ero estadou n ide nse . Fue uno de los más des-
Fi~ura 2. DA!' relativa en frecuen cia tacados inv estigadores en psicoac ústica du rante la primera mitad del siglo xx.
90 91
sinusoide y su potencia acúst ica se incrementaba a medid a que crecía el an- 76
cho de banda.
El expe rimento de Fletch er, que fue repet ido gran cantidad de veces des- 75
de entonces , reveló aspectos descon ocid os de nu estro siste ma audit ivo. En la ¡íJ
~ 74
figura 4 se aprecia un resumen de dicho experimento, realizado por Moore y ro
oc
su equip o en 1993 (Mo ore, B., 1997 ). En el gráfico se observa que el umbral al
lJ)
de detección para una seña l sinusoi da l de 2.000 H z aumenta al princ ipio a me- al 73
"O
dida que crece el ancho de band a del ruido, pero a partir de un va lor determi- ~
.o
E 72
nado -400 Hz en la figura- se prod uce un quiebre marcado de la c urva de :J
umbra l, que deviene práct icamente consta nte . 71
Pa ra dar cuenta de esta singular caracte ríst ica, Fletcher sugirió , si-
guiendo a Helmho ltz, q ue el siste ma a ud itivo peri fér ico se co mpo rta co mo 70
si estuv iera co mpue sto por un banc o de filtros pasaband a en pa ralelo ( lla- 50 100 200 400 800 1600 3200
mados filtros auditivos), c uyas bandas se tr aslapan. C uando trat am os de de- Ancho de banda del ruido enmasca rante (Hz)
tec ta r un a seña l en un ambien te ruidoso, usam os el filtro cuya frecuencia
Figura 4 . U mbral para una sinusoide de 2.000 Hz en función del ancho de banda del ruido
central ( Fe ) se acerca más a la frecu encia del est ímulo: la seña l pasa pe ro
en mascarante
ate n uamos gran parte de l ruido de fo ndo, corr espondie nte a los o t ros filtros.
Sólo la porción de ruid o que at rav iesa el filtro centrado en la seña l la afec -
ta sign ificat iva men te. Co mo es de esperar, si se increm enta e! anc ho de • C uando un oyen te intenta detecta r una señal en un entorno de ruido
banda del ruido a umen ta la po tencia de ruid o q ue pasa por ese filtro en par- emplea un filt ro aud it ivo centrado a la frec uencia de la seña l. En gene ral es el
t icular. Pero una vez q ue el ancho de banda del ru ido supera al del filtro a u- filtro que en trega una mayo r relac ión seña l/ruido de sa lida.
ditivo su capac ida d en mascara n te deja de crece r. La parte del ruid o q ue cae • So lamente una band a angosta de frecuen cias que rodea al estímulo,
fuera de! filtro sin to n izado co n la seña l no afecta nu estra habi lidad pa ra de- aquéllas q ue caen dentro de la oc, contribuye a enmascararlo.
tectarla. • El umb ral de detección de la seña l está determinado por la cantidad de
Se asume q ue el umbral de detección para una seña l sinusoi da l está deter- ruido que pasa por e! filtro audi t ivo correspond ien te . La pote nc ia del estí mu-
min ado por la ca nt idad de ruido que atraviesa el correspondiente filtro aud i- lo P divid ida por la poten cia del ruido dentro de la banda crítica es consta nte
tivo. Más específicamente, el umbral estaría vinc ulado a una cierta relación (k) .
señal/ruido a la salida de! filtro . Este modelo es co nocido co mo el modelo del
espectro de potencia, en el cua l los estí mulos está n representados por su espec- k =P /(\'(/xN o) IXI = ancho de la banda crí tica, en Hz.
tro de largo tiempo, sin fluctuaciones transitorias que invo lucre n camb ios en w = P / (k x No) No = densidad de potencia del ruido, en watts/Hz
las fases relativas. (la potencia en una banda de 1 Hz de anc ho) .
El térm ino banda crítica (Be), acuñado por Fletc he r, gene ralmente se re-
fiere a un hipotético filtro rectangular q ue simula el comportamie nto de los Mid iendo P y No es posible esti mar W. Según Fletcher, la constant e k vale
filtros auditivos rea les. El ancho de bandarectangular equivalente (ERB) es el an- aprox imadament e 1, aunque med icione s recientes la sitúan en 0,4. La d iferen-
cho de banda de un filtro rect an gular ideal que posee igual máxim o de tran s- cia tie ne que ver con el conto rno espec tra l del ERB equ iva lente , que no fue to-
misión que el filt ro real y por el que pasa la misma potencia total ant e un a mado en cuenta por Flet ch er.
entrada de ruido blanc o. Fletch er esta bleció las siguientes h ipót esis, que defi- Sa bemos qu e n ingun a de las h ipót esis an ter iores es est ricta men te co-
nen su modelo del espectro de potencia: rrccta : los filtros no son lin eales, los oyentes combi na n la información de
• El siste ma audi tivo per iférico cont ien e un banco de filtro s pasaba nda var ios filtros para aumentar la capacid ad de det ecció n y el ruido que cae fue-
lineales. ra de la banda pasant e del filt ro aud it ivo afecta a l umbra l de detec c ión. Pe-
92 93
ro estas imperfecciones no implican que la hipótesis ce n tral del modelo es- 5000
té equivo cada . De hecho, gran parte de los ava nces en el ca mpo se han ba-
sado en ella . Ñ
;S 2000
La forma rectan gular del filt ro audit ivo propuesta por Fletcher merece un o
co mentario aparte . Si el filt ro fuese perfectamente rect an gular el umbr al de ~ 1000
<;
ro
detección debería crecer a una tasa de 3 dB por cada duplicación de la band a "O
e
ro
de ruido . En la figura 4 se puede ver q ue la curva de crecimi ento tiene una .o
Q)
500
pend iente much o menor. Este desvío del va lor teórico se deb e probablemen- "O
O
s:
te a dos factores: el filt ro no es rect an gular, y las pequeñ as fluctu acion es del o
e 200
<l:
ruido afecta n la det ección de una man era apreciable.
100 1--- - - - .....-:- ~ - - - - - - 100 Hz
Refinamiento del modelo de Fletcher
0.05 0.1 0.2 0.5 2 5 10 20
Frecuencia (kHz)
El modelo del espectro de potencia se emp lea como punto de partida para el
desarrollo de modelos más precisos. S i el ruido en mascaran re se representa por Figu ra 5. A nc ho de banda crítico en func ión de la frecuencia central. Las líneas de puntos
su espec tro de pot en cia estaciona rio N(f) y la form a espect ral de l filtro audi- indican aproximaciones line ales pam baja y a lta frecuencia (Zwicker, Flottorp y Stevens,
t ivo por W(f) , la pot en cia de la seña l en su umbral P se puede ca lcular co n la 1957)
siguiente expresión:
P = k fo~ W(f) N (f) df En la figura 5 podemos aprec iar el anc ho de band a crítico en función de
la frec uenci a ce ntral de banda . Para frecuencias medias, la band a crítica t iene
Midiend o los ca mbios en el umbral de det ección de P en func ión del anc ho una exte nsió n de alrededor del 15% de la frecuenc ia central (corre spond e a
de band a del ruido, es posible eva luar la form a del filt ro aud it ivo W (f) . un intervalo musical a medio camino ent re un tono - segund a mayor- y un to -
En gene ral se elige n ruid os de banda angosta en vez de sinusoides co mo no y medio -tercera men or) .
en masca rant es a fin de ev ita r los batidos que se generarían co n la seña l en-
mascarada. Para ruid os de band a muy angosta, sin emb argo, apa rece n fluctu a- Método de supresión de bandas por cobertura
cio nes qu e pueden ser oídas . Otro motivo por el cua l se eligen ruid os de
band a co mo enmascarantes es que much as veces el filt ro aud it ivo que gene - Para sat isfacer las cond iciones impuestas por elmodelo de Flet cher es necesa-
ra la mayor respuesta es uno ce nt rado a una frecu en cia difer ente de la fre- rio, entonces, usar un ruid o en rnasca ran te que evite la aud ición fuera de fre-
cuencia de la seña l a detect ar. Esta importante ca rac te rística, en la qu e el cuencia, y que ade más limite el ran go alrededo r del cual la relación
oído exp lora el camp o audible "mov iendo" su ventan a espectral para buscar seña l/ruido mantien e valores sign ificat ivamente altos. El ruido en mascaran te
la mejor respuesta, se denomina audición fuera de frecuencia.3 Para desactivar diseña do por Patterson , cuyo espec tro se puede apreciar en la figura 6, cumple
este efec to se coloca ruid o a ambos lados de la zona de ex ploración con el mé- con ambos requi sito s (Patterson, R. D., 1976) . La forma del filt ro audit ivo
todo de supresión de bandas por cobertura de Patterson, que se descr ibe en el puede estudiarse midiendo el umbral de pot encia P para la seña l en función
apar tado siguiente. del ancho de la muesca en el espectro del ruido.
O tro métod o muy empleado para estudiar la selectividad en frecu encia El empleo de ruidos enmascaran tes de esta clase es muy común en el es-
del oído con siste en medir las curvas de afinación psicoacústica, en las que se tud io de seña les tran sitorias, pues las bandas lat erales "cubren" los puentes es-
emplea ruid o de band a angosta para evita r la int erfer en cia de los batid os. pectrales provocados por las transiciones rápid as de la señal, que aparecen
como consecuenc ia del princ ipio de ind et erm inación ac ústico (Basso, G.,
) Off-frequency Ustening en inglés. 1999, 200 1a).
94 95
+r-- - - - - - - - - - - - - - - - ---, Extremo basal
Extremo apical ]n
) .:::::.:::::;:¡:;:::::=~ .
'" Banda de ruido Banda de ruido
0~=========@
ri
Ul
enmascarante enmascarante
.~ 31mm 28 24 20 17 13 mm Dista ncia
.!!!. (¡j 1,0 al estribo
~
'c:"
' (3
"O
Ol :J
~ '[ 0,5
E
«
o Frecuencia (escala lineal) +
0,0 ~-'-~---':::::J..-....L.....1..-'-L---l~-I.-L..L.J....--+
20 30 50 100 200 300 500 1k 2k 5k
Figura 6. Esquema del ruido enmasca rante usado por Patt erson para est imar la forma
del filt ro aud itivo Frecuen cia (Hz)
Fi¡.:ura 8. Posición de l máximo de resonancia en la membrana basilar al ser estimulada

por una señ al sin uso idal de frecue ncia variab le (Bék ésy, G. Van , 1960 )
2000 .,.,.T7T-----,-r-r..,....rrrTr--..,....---.-..,.....,...,...~
N
E. 1000
_
e
Ol
.!!1 500
res la frecuencia central de la band a en Hz. Cada ERB corresponde a una distan -
Ol ",
"O> cia de alrededor de 0,89 mm en la membrana basilar. La conjetura de Gree nwood
m "S
"00"
c:W
se basa en las medic iones realizadas algunos años antes por Van Békésy.
'Ol" :;
~
.o ",
200
Si el filtro audit ivo fuese lin ea l su forma no ca mbiaría con la inte nsidad
~ g' 100 del estí mulo. Pero no es así: a bajos n iveles de excitació n es aprox imada rnen-
-5C:Ol
~ le simétrico, pero deja de serlo a medid a q ue aumenta la pot en cia de la señal.
« e:: 50
En el gráfico de la figura 9 se puede ver la forma del filt ro auditivo en fun ción
.~
ii: de la inte nsidad. En particular, la extensión de baja frecuenci a posee un an-
20 +rnr---....,..-"rrrTTT--.--.--,--,r-rr-rrl cho de band a mayor que la de alta frecuen c ia.
0,05 0,1 0.2 0,5 1 2 5 10
Frecue ncia central (kHz)
Está ace ptado que las band as críticas son continuas pues no ha y ev iden-
cia expe rimental de disco ntinuidad en tre e llas. Podemos hablar de la existen -
Figu ra 7. Estimació n del anc ho de band a del filtro rec tan gular equivalente en funció n cia de una banda crít ica alrededo r de cualq uier frecuencia audib le.
de la frecuenc ia ce ntra l A veces, es útil especifica r la esca la de frec uenc ias de un expe rimento to-
mando el anc ho de l filtro rect angular equivalent e co mo un idad:
Fonna del filtro auditivo N úmero de ERB = 21,4 10glO (4,37 f + 1)
Exper iment os com o los ant eriores, y otros similares, han llevado a los invest i- En la actualidad se puede predecir a parti r de qué n ivel una señal complej a
gadores a form ular que e l filtro rectangular equiva lente sigue aproximadamen- puede ser det ectad a en un amb iente de ruido ca lculando los umbrales de sus
te los valores de la figura 7. parciales más prom inentes. Para frecuenc ias med ias el crite rio dice que con
Greenwood propuso en 1961 que el ancho del filtro rect an gular equivalen- una relación seña l/ruido de -4 dB la seña l com ienza a oírse. Es dec ir, que el es-
te represent a una distan cia consta nt e a lo largo de la membrana basilar. La re- tímulo debe superar el n ivel a -4 dB del ruido de salida del filtro auditivo q ue
lación de G reenwood , corregida por G lasberg y Moore (1990) , es la siguiente: le corresponde. Un modelo que aplica co nside rac iones similares fue usado con
éxito en el dise ño de siste mas de co municación en aeropuertos, a medi ados de
ERB = 24,7 (4,37 f + 1) la década de 1990.
96 97
90
Suma toria de sonoridad
80 90
80
enol>
ro
~
60
g
e 70
u 60
ro'"
50
----
:2
s'"
u
(/)
e 50
ol>
u 40 o
(/)
a; ol> 40
> u
Z 30 a;
> 30
20 Z
20 dB
20
10
10
50 100 200 500 1000 2000
Ancho de banda (Hz)
Frecuencia (Hz)
Figura 10 . N ivel de sonoridad para un ruido de banda cen trado en 1.000 Hz en función
l : il~l1 f.'a 9. Formu del filtro audit ivo cen trado a 1.000 Hz en función de la intensidad
del ancho de banda
dd c-rfru ulo , de 20 a 90 dB en pasos de la dB
'" S ONO RIDA O ANT E ESPECTROS CO M PLEJOS

U mbral para est ímu los com plejos
El! el apartado 4 del capítulo 11 analizamos la infl uenci a de los factor es espec- C uando dos estímulos sinusoidales poco separados en frecuen cia se presentan
I rules qu e inte rv ienen en la percepción de la sonorid ad. Podemos ahora exa- jun tos, puede o írse son ido aun cuand o cada estímulo por sí mismo esté ubica-
minar el tem a desde otra perspectiva. do por debajo de! umb ral. Gassl er propuso que , dentro de una banda críti ca,
C onsideremos un a señal acúst ica de intensidad fija y ancho de banda va - las energías de los com ponent es de un est ímulo complejo se suman algebraí -
riable 'Y/o Mientras W se mantenga menor que la banda críti ca BC la sonori- camente.! Spie gel, por e l cont rario, sugiere que e! oído es cap az de integrar la
dad será más o menos independiente de W, e igual a la de un tono puro de energía sobre anchos de ban da mayores q ue una BC (Spiegel, M. E, 198 1).
igu;ll int en sidad situado en la frecuenc ia centra l de la banda. C uan do W su- Algunos experimentos rea lizados con sinusoides muy separadas confirman es-
pera la Be, la son oridad com ienza a incrementarse. Por lo tanto , para una to últ imo.
determinada cantidad de energía la sonoridad es mayor si la energía se repar-
l e s( .hre un número de bandas críticas, en vez de esta r contenida en una sola
Sensibilidad a la fase
de el las. En la figura 10 se aprecia el aumen to de sonoridad aludido. 4
Este efec to es muy importante en música ya que e! aume nto de sonoridad En un célebre ex per iment o real izado por Zwic1cer y repet ido casi medio siglo
\le pende de la suma de las sonoridades específicas en las diferentes bandas. Por más ta rde por Sek se emplearon dos seña les esta cio n arias, un a mod ulada en
e-jemplo , do blar un bajo a la oc tava es mucho más efectivo, desde e! pun to de amplitud con un índice de mod ulación m y ot ra mod ulada en frecuencia co n
vista de la sonoridad, que dob larlo al unísono aunque la en ergía física puesta un índice de modulación b (Se 1c, A. , 1994 ). Si se igualan los índices de mo-
en juego sea la misma , du lación (m = b) y b es pequ eño, el espect ro de po tenc ia de las señales es
I A lgunos au tores lo denominan "suma de sonor idad" (loudness summatio n ). I Gassler (195 4), en Moore, B. (1995 ).
99
idént ico . Las co mponentes de las señ ales sólo difi eren en sus fases relat ivas. 4. ENMASCARAMIENTO
El resultado de este experime nto muestra que so mos sensibles a las fases rela-
t ivas de una seña l estac ionaria cuand o las co mpo ne ntes caen dent ro de un a El enmascaramiento acústico es un fenómeno habitual en nue stra vida cotidia-
misma ban da crít ica. Por el contrario, cuando las co mpone ntes se encuen- na. C uando elev amos la voz para ser oídos en una reunión , cuando perdemos
tran separadas en frecue nc ia por una d istancia que supe re el valo r de un a part e de una conve rsación que es "ta pada" po r el paso de una motoc icleta con
banda crítica , las fases rela tivas dej an de pe rcibirse. Sólo en este caso parece d esca pe libre, o cuand o el ruido de una aspirado ra nos impide seguir un d iá-
válida la ley acústica de Oh m , que postu la la insens ibilidad a la fase del siste - logo en el te levisor, lo estamos experim entando. La cuestión puede plantear-
ma aud it ivo." se de la siguient e man era: si alguien está oyendo un son ido int en so a una
cierta frecuenc ia, ¿q ué int ensidad deb erá tener otro sonido, a una frecue ncia
Discrim ina ción de par ciales en sonidos complejos diferente, para que lo podamos perc ibir? El en mascaramiento se define co mo
I) el proceso que provoca un aument o de! umbral de aud ibilidad para la seña l
La ley ac úst ica de O hm ta mbién esta blece q ue el oído es capaz de percibir los enmascarada o 2) la ca nt idad de aume nto del umbral ex presada en dB.
compone ntes sin usoida les en un son ido complejo. Plomp encontró q ue esta Wegel y Lan e pub licaron el primer trabajo sistemático de invest igación
habil idad llega, según la frecuencia de la funda men tal, hasta el quinto u oc ta- " ,hre el en mascaramien to de un ton o por otro, pero sus resultados se co mpli-
vo parcial (Plomp, R., 1976) . Co n su méto do -diferente al de Flet ch er- esti- caron por la aparición de batidos entre las seña les (Wegel y Lane, 1924 ). Pa-
1: 1 supera r el problema en los experimentos recientes se emplea ruido de banda
mó un va lor para la banda crí tica algo menor a la medid a por el método de
enmascaramiento . Plornp int rodujo la hi pótesis ad iciona l de que un parcia l .mgosta tanto para las seña les enmasca rante co mo en mascarada.
puede ser oído en el entorno de otros parciales si se en cuentra separado de es- Los patrones de enm ascaramiento obten idos ex perimentalmente mues-
I mn una pendiente más abrupta en la zona de baja frecuen cia que en la de al -
tos últ imos por lo meno s en 1,25 veces el valor del ERB del filtro audit ivo que
1:1 frecuencia , tal com o se aprec ia en la figura 11.
le corresponde.
Los experimentos de Soderq uist parecen pro bar que los músicos poseen Los gráficos ant eriores ponen en evidencia e! uso simultá neo de más de
\1 11 filtro aud itivo. Una ex plicación posible es interpret ar esta for ma como un
band as críticas men ores a las de los no músicos (Soderquist, D. R., 1970) . Sin
embargo, Fine y Moore mostra ron que no hay ta l diferen cia (Fine y Moore, uulicador de l model o de exci tación de l ruido enmascarante: e! pat rón de en -
1993). La int erpretaci ón más aceptada es la que presu me la existencia de al- uursca ramien to sería paralelo al patrón de la exc itac ión , pero desp lazado ver-
I ¡,,:dmente una pequeña cantidad de dB. En la práctica la cuestión no es ta n
gún meca n ismo, más entrena do en los músicos, que actúa a niveles no pe rifé-
ricos en la de tecc ión de parci a les. "" lIcilla, pues también int erviene n los factores propi os de! mecanismo de "oír
IIl1 a frecuenc ia d iferente" y la det ección de los produ ctos de combinación en-
111' la señal y el ruido en rnascaran te.
Selectividad en frec uencia en oídos dañados
Moore y G lasberg describieron una for ma de derivar las curvas de enmas-
Hay co nsidera ble ev idencia de que la selectiv idad en frecue nc ia d ismin uye , :lIallliento usando el con cepto de filt ro audit ivo (figura 12), en la que supo-
111'11 que e! an cho de band a de los filtros aumenta al aumentar la frec uenc ia
por daño en la cóclea. U na consecuencia es la gran sensi bilidad al enmasca-
• \ ' 111ml FC (Moore y G lasberg, 1983).
ram iento que poseen las personas con lesiones cocleares, con la consiguient e
dificultad para oír en amb ientes ruidosos. U n imped imento ad iciona l aparece ¡\ la descr ipción anterior se le deb e agregar la acción de las ondas progre-
ante el análisis perceptual de sonid os comp lejos como la pa labra y la música, oIV:I:, en la membrana basilar según el esquema de Van Békésy. Una frec uen-
1. 1 ele vada produce un máximo de vibración en la mem bran a basilar cerca de
por eje mplo en la dismin ución de la habilidad para distin guir entre diferentes I
timbres. C on los audífonos con vencion ales no mejoran estas dificultades pues, LI ve n ta na oval, mientras que una de baja frecue ncia se esparce práct icame n-
aunq ue conv iert an en audibles las señales, no se recupera la selec t ividad en 1, I" ,r I oda la memb ran a. Esta característica de "enmasca rar ha cia las frecuen -
1.1', agudas" se puede ver en el gráfico de la figura 13.
frecuencia perdi da . I
( :II IIl O se observa en la figura 13, la segunda señal se perc ibe con facilidad
I u lrccuen cia está alejad a de la frec uencia de la señ al enmascarante, pero la
6 Ohm (1843) , en Moore, B. (1995) .
100 101
'/00 I---'---r--'---r---'---~~
100 -,-- -----¡-- - - --,---- - - , -- - - -,-- --.,
a Umb ral de audibilidad
so Intensidad del ruido
de banda angosta 80 b Aume nto del umbral cau sado
. . . . . por una banda de ruido
tn
~ 60_
.9 tn 60 e _ _ Aumento del um bral causa do
e ~ por una sinusoi de
<1l
E 40
eo
~ § 40
rl so
lj)
E 20 Q;
>
...................................
e Z 20
W ......
................................
. :.
250 500 1000 2000 4000 8000
400 800 1600 1200
Frecue ncia (Hz)
Frecuencia (Hz)
FiJ.:lIn1 [ lo I'ntrones de enm ascaram iento para ruido de banda angosta cen trado en 500 Hz
Figur a 13. C urvas de enmascaramiento: a ) umbral de aud ibilidad , b) aumen to de/umbral
causado por una banda de ruido \' e) aumento de/ um bral causado por una sinusoide
o
dificultad crece apreciable ment e a med ida que ambas señales se acerc an . Esto
tn -"10 no debería sorprende rnos pues sabemos que, si com parten una misma banda
~
g; crítica, dos señales se perturban mutuamen te y la más débil no se perci be a
¡¡= -20
Q;
el
menos que posea un porce n taje aprec iable de la ene rgía de la más intensa, al-
e
-o -30 go así co mo 6 u 8 dB por debajo de la erun ascarante. C uan do la segunda señal
'ü
¡¡; est imula una banda crítica dife rente, sin emb argo, e! estímulo llega al ce rebro
<1l
u -40 por un can al separado y todavía no ocupado: la señal enmascarada puede per-
e
O
Q..
cibirse estando aun 30 o 40 dB por de bajo de! ruido .
-50
0,5 1,0 1,5 2,0
Frecue ncia (I<Hz) R elación entre las bandas crí ticas y el mecanismo de enmascaramiento
O Hay much as semej anzas en tre las selec tividades en frecue nc ia med idas ta n-
to en la membrana basilar como a partir de experime ntos psicofisíol ógicos
-10
(Moore, B., 1995) : cad a an cho de ban da rectangular eq uivalente (ERB) co-
tn -20 - rresponde a alrededor de 0,9 mm en la membrana basilar, sin que importe
~
e e! centro de frecuenc ia co nsiderado . Sin embargo, a pesar de la bue n a co -
-o
'ü
s -30 rresponde n ci a en tre el comportamiento de la cóclea y la med ida de los
'ü
x ERB, es posi ble que exista un mecanism o de "afinac ión " del an cho de banda
l1J
-40 en et apa s superiores de proces amie n to . Esto pod ría lograrse a través de me-
-50
can ismos de supresión o inhibic ión la teral. Si la banda crít ica depende de
0,5 1,0 1,5 2,0 un proceso ne ur al inhibitorio, se puede esperar que el mismo de more algu-
Frecu encia (kl-iz) nos milisegundos en actuar: la banda crítica para señales cortas debería ser
mayor que pa ra señales largas. Los datos experim entales en este punto se
FiJ.:IIf'" 12. I ),' ri v:tC i"'1l de l I' :tl rón de enm ascaramiento seg ún Moo re y G lasberg
con trad icen.
102
103
Modelos de cobertu ra y sup resión la salida de un filt ro audit ivo centrado a la frecuencia de la seña l. En general,
se supone que la prest ación se basa en la salida del filtro que prove e la mayor
Ha y dos model os que explican el proceso de enmascarami en to . El model o de relaci ón seña l/ruido y que los umbrales corresp onden a una relación seña l/rui-
ClJ /Jertura involucra la saturación de la ac tividad neur al evocada por la señal. do consta nt e. Las fases relati vas de las compone ntes y las fluctuacion es de cor-
S i el ruido enmascarante prod uce una ca n tida d sign ificativa de act ividad en to tiempo del ruido enrnascaran te son igno radas. Este modelo funciona bien
la banda crítica que normalmente responde a la señal, ent onces la ac tividad en much as situac iones, pero no en todas. En particular, hay ev idencia de que
ugregada por la seña l resultará cu biert a y no se la podrá de tectar. Considére- los oyentes a veces realizan com paraciones entre d iferentes filt ros aud itivos.
se, por ejemplo, el caso de un tono junt o a un ru ido de banda ancha . El urn- Más aún , ciert as fluctu acion es temporales del ruido enmasca rante pueden te-
hral del tono está a -4 dS por deb ajo de l nivel del ruido en su banda crí t ica. ner efectos import antes.
La exc itación combi nada del to no y el ruido es 1,5 dS mayor que el ruido sa-
lo: 1,5 dS representa el incremento mínimo necesario para la detecció n del Re ducción del enmascaramiento por comodulación
to no (por ejemplo, si el ton o estuviera a -20 dS , el nivel total hab ría aumen -
tado 0 ,05 dS y no sería aud ible ). Hall de mostró que las comparacio nes entre filt ros auditivos puede n aumentar
El segundo meca n ismo posible, desarro llado por el model o de supresión, la de tección de seña les sin usoida les en presen cia de ruido (H all , D. et al.,
se basa en la hi pó tesis de que el ru ido en mascarante supri me la actividad ne u- 1984) . Para qu e ocurra este efecto debe ex istir una fluctu ación coh erente o
ral que la señ al pro duciría de estar sola. cor relaciona da entre diferentes band as del ruido enrnasca ran te , fen óm en o al
Por el mom ento no hay evidenci a fuert e q ue permi ta descartar alguno de q ue Hall llamó comodulación.7 En la figura 14 se aprecia el resultado de su ex-
los dos mecan ismos, aunque qu izá se combinen amb os. Sin embargo, el éxi- perimento.
to de los modelos lineales de combinación de filtros aud iti vos en la exp lica- Hall usó ruido de una banda de anc ho variab le. Tam bién se pueden em-
ció n del patró n de enmasca ramien to inclina la balanza hac ia los mecanismos plear dos o más bandas de ruido, incl uso una en cada oído, sin que varíe el re-
de cobe rtura, pues la supresión es un proceso a lta men te alineal. sultado.
Se asume usualm ente que la redu cción del en masca ramiento po r como-
Modelos temporales de en mascaramien to du lación depende de la comparación entre las salidas de diferentes filt ros au-
dit ivos. Sin emba rgo, tam bién se produc e un efecto similar cuan do la
Existen da tos que apoya n la hip ó tesis del uso de los patrones temporales de dis- fluctuació n cae dentro de una sola banda cr ítica , aunq ue en ese caso la dismi-
paro neurona l en el análisis de estímulos comp lejos (una sinusoide produce nución del umbral result e men or. La reducci ón de l enmascaramiento por co-
disparos neurales cuyo int erva lo temp oral es un múlt iplo entero de su perío- modulación es mayor cuan do la variación del ruido enmasca rante es lenta y
do). S i la regularidad temporal es men or q ue cierto va lor -como ocurre con el cuando éste cubre un gran anc ho de band a. Para seña les de hasta 100 ms de
ruido aleat or io- la sin usoide será en mascarada . El mecan ismo tem poral pare- duraci ón la reducción del en masca ramien to por comodulación pued e llegar a
ce efec tivo únic amente pa ra frecuenc ias por debajo de los 4 o 5 kHz y cabe su- 11 dS. Esta disminución alcanza los 14 dS en el caso de ruido enmascarante
pone r la acció n de un dispositivo sensible a la fase. de dos bandas cuando la banda agregada se ub ica cerca de la frecuenc ia de la
O tro ele ment o que posiblement e se emplee en la detección de un a señ al primera banda. También aumenta hasta llegar a un máximo de 16 dS cuando
sinuso idal en un fondo de ruido es e l cambi o en la envolvente de la onda com- hay más de dos bandas en juego. La magn itud de la redu cción del enmasca ra-
binada, que fluct úa menos en prese nci a de la señal sinusoidal. miento por comodulació n no ca mbia con la frecuen cia ce nt ral del estí mulo.
La co mparac ión entre las diferentes envolve ntes temp orales de los filtros
audit ivos parece ser un hecho co mún en el an álisis de los patrones audi ti vos.
5. A NÁLISIS ESPECTRO- TEM PORA L COMBIN A DO Apa rente men te juega un papel muy importante en la extracción de seña les
El model o del espectro de potencia asume que , cua ndo tratamos de detectar 7 Hoy se lo denomina reducción del enmascaramiento por co modulación o CMR (conmodu-
una seña l sin usoida l en presencia de un ruido en mascarant e, hacemos uso de /(l[ion masking release).
104 105
entre las señales qu e afecta a los sujetos co n poca prác t ica. De hech o, oye ntes
entrena dos -músicos y técnicos de aud io entre otros- obtie ne n mejores por -
iD 60 R
I
centajes de detección qu e los suje tos promedio. Por o tro lado , el en mascara-
:3. miento "ha cia del ante", con el ruid o en mascarante preced iendo a la señal, es
uno de los tres pro cesos qu e alte ran el um bral de una seña l qu e t ien e lugar des-
pués de otro son ido . Los o tros dos son la fatiga y la ada ptac ión . Se disti ng ue
de ellos po r estar limitado a seña les que apa rece n dentro de los 200 ms des-
pués del momento en que cesa el ruid o en masca rante.
El enmascar am iento hacia del ante tien e las siguientes particularida des :
1) es mayor cuanto más cerca en el tiempo se sucede n ambas seña les; 2) los
45 inc rementos en el niv el del ruido en masca ran te no co rresponde n a increm en-
L---'----'----'------'-_---''---¡fj--'--_--'
tos iguales en el umbral de la seña l (a diferenc ia del enmascaram ien to simul-
Ancho de la banda enmasca rante (kHz) táneo, qu e respond e a un a relación seña l/ruido constante), y 3 ) depende de la
relación de frecuencias entre ambas seña les (igual que en el en mascaram ien-
Figu ra 14 . Resultad o del expe rimen to de Hall . Los puntos marcad os "M" cor respo nden a to simultán eo) . Los procesos que dan cuen ta del enmascarami ento no simul-
los umbrales obten idos con ruido en mascarante mod ulado en amplitud con una se ñal irre- tá neo no se conocen co n exac ti tud, aunque prob ablemente sea n con secuencia
I~ u lar que varía lent amente de la co mbina c ión de varios a la vez. La superposic ión temporal de pat rones
de vibrac ión en la membran a basilar -una suerte de cola de resona nc ia o "rin-
ging"- parece ser imp ortante, así co mo la ada ptac ión de co rto té rmi no ta n to
de ambien tes ruid osos y en la discriminación en tre var ias fuentes ac úst icas .
en el nervio aud itiv o com o en los ce ntros neurales super iores.
Tambi én da cuenta, al menos en parte, del "efecto de cafetería" ("cocktail
pnrrv effecr").
Supresión lateral en el enmascaramiento no simultáneo
Hay dos clases de modelos qu e intentan ex plica r la reducción del en mas -
caramiento po r comodulación. Los qu e integran el primer grupo asumen qu e
Los expe rime n tos sobre en mascaramiento simultáneo puede n ser exp licados a
el siste ma audit ivo co mpara los pat rones de modulación de las envo lve ntes de
part ir de la superpos ición de filt ros audit ivos apro xi madame nte lineales. S in
las salidas de los diferentes filt ros aud it ivos: la presencia de un a seña l es rev e-
embargo, las respuestas neurales son marcadam ente alinea les. En particul ar, es
lada por la d isparidad en la modulac ión entre los filtros.
importante destacar el hecho de que la respue sta a una seña l puede ser supri -
Un segundo grupo de modelos sugiere qu e la fluctuación de las envolve n-
mida por otra de diferente frec uenc ia en el fen óm eno de supresión entre dos to-
tes a la salida de los filtros aud itivos indican los momentos ópt imos en los que
nos, que describe el hecho de qu e la respue sta ante un estím ulo sin uso idal
se debe escucha r la señal. Es decir, durante los mínimos de la envolve nte del
puede an ularse por la presencia de un segundo est ímulo. En la figura 15 se
cn masca ran te.
aprec ia este importante efecto.
Estos modelos no son mutuamente excluyentes y no parece que la reduc-
Los efectos de la supresión co m ienzan y cesan muy rápida me nte , dentro
C i<'1I1 del en masca ramiento por comodulación dependa de un único mecanis-
de unos pocos mili segundos luego del comienzo o fin del segundo est ímulo.
111 0 simpl c,
Para señales más complejas, el fenóm eno toma el nombre de supresión /a-
teral, en la que una fuerte act ivida d a una frecuenci a central puede suprimir
Enmascaramiento no simultáneo
una actividad menor a una frecuencia adyacente. Las crest as del patrón de ex -
citación son resaltadas por los vall es que las rod ean .
LlIs l'fecl llS de l tiempo sobre el enmascaramiento han sido estudiados en deta-
La pregunta es ¿po r qu é la supresión lateral no se revela en el en masca-
lle por IlIll11CroSOS investigadores. El enmascaramiento "hacia atrás", con la se-
ramiento no simultá neo ? Houtgast estudió extensamente el caso a partir del
ñul preced iendo a l ruido en masca ran te, parece provenir de una confusión
umbral de pulsación (Houtgast , T., 1972) . En el en mascaram iento simultáneo
l Oó
107
Enm ascarami en to binaural
80
El umbra l de enmascaramiento puede ser marc adamente menor cuando la se-
ñal se oye con ambos oídos. La diferen cia de nivel entre la audic ión b ínaural
50
y la mon oaural se conoce como nivel de enmascaramiento diferencial (MLD). El
ro MLD llega a ser de 15 dB para bajas frecuen cias y se reduce a sólo 2-3 dB para
E
a;
>
seña les de 1.500 H z. N o es casua l qu e el límite de 1.500 Hz sea el mismo que
Z 40 el de nu estra capacid ad para com parar las fases de las seña les entre los dos oí-
dos dur ante la locali zación espac ial. En la figura 16 se aprecia cualita tivamen-
te un experimento clásico en este ca mpo.
20 Para qu e el efecto ten ga lugar se debe agregar el mismo ruido a los dos oí-
dos (o al menos deben esta r correlacionados o provenir de la misma fuente) .
2000 5000 10k 15k Se ha observado enmascarami ento binaural en seña les sin usoidales, en clics y
Frecuencia de los esll mulos (Hz) en el hab la. En situ acion es rea les aparece cuando la seña l y el ruido provienen
de diferentes posicio nes en el espacio y se relacion a fuert emente con el efec-
Fi¡:ura 15 . Á reas de supresión de un estí mulo por otro to "cocktail party". La band a del ruid o enmascarante que act úa en las condi-
cion es de enmascaramiento diferencia l es la que cor respond e a la frecuencia
la supresión se man ifiesta porque cua lq uier reduc ción en la actividad del rui- de la seña l. Ha ll sugirió que los filt ros aud it ivos que interv ien en en la detec-
do cnmasca rante en la región de frecu en cias de la señ al se aco mpaña con un a ción mon oaural y bin aural son los mismos, pero que la det ección bin aural de -
redu cción similar en la ac t ividad de la seña l enmascarada. En otras palabras, pende de la salida de más de uno de ellos en paralelo.
la razón "seña l enmascara da /ruido enrnasca rante" no es afectada por la supre- La inteligibilid ad del habla en co ndiciones de ruido ambienta l mejora
si ón . En el en mascaramiento no simultá neo la supresión afecta al ruido enco n seña les an tifásicas , en espec ial a niveles cercanos al umbral. Las co nd icio -
mnsca rante pero no a la seña l. nes ant ifásicas no sólo mejoran la capacid ad de detecci ón de seña les, sino que
Otra diferencia importante es qu e la select ividad en frecu encia del enta mbién inc rementan la hab ilidad para discrim inar seña les.f Los procesos de
mascaramiento no simultá neo es mayor que en el simultá neo (med ido por en masca ramiento y de localización espacial, sin emba rgo, parece n procesa rse
eje mplo a partir de la curva de afinación psicofísica o PTs). de man era separada .
Los model os más recientes, como los de C olbum, S te rn y Trah iotis, asu-
Examen del perfil espectral men que las tasas de d isparo de los diferentes filt ros aud it ivos prove nie ntes de
los dos oídos son comp arad as por detectores de coinc idencia que proveen una
Grccn y sus co legas dem ostraron en 1988 que los oyentes comparan la salida especie de salida bidimension al, co n una dimensión caracterizada por las fre-
de diferentes filtros audit ivos para mejorar la detección de una señal específi- cuencias centrales de los filtros aud itivos y la otra por el retardo interaural
ca, :nín en los casos en los que el ruido y la señal fluctú an sincrón ica men te. (C olburn, H . S., 1995). Un co mplejo model o, el de Yoichi Ando, da cuenta
Sugiriero n que se percibe un cambio ent re el perfil espectral de l ruid o en precon bastante detalle del proc eso de evaluación interaural y fue utilizado en el
scnc in de la seña l y el perfil en ausencia de la misma. El an álisis es más efec- diseñ o de salas para música no amplificada (Ando,Y. et al., 1997a) .
1ivo cuando : 1) el ruido de fond o posee un gran ancho de band a; 2) hay varias
\.'t uuponcnrc s de la señal dentro del rango espectral del ruid o y 3) el ruido de
li nulo se co mpone de bandas de simi lar intensidad.
En IIn sentido e l examen de l perfil espectral no sorpre nde: la forma de l es- s U n parámetro uti lizado en el estudio de salas para música y palabra, el coeficiente de corre-
p( ' CII'O es uno de los factores relevantes a la hora de identificar una vocal o un lación cruzada interauTal ( IACC), cuanti fica la correlación existente entra las seña les que lle-
I imhrc musica l. gan a los dos oídos.
10H 109
a)~.~ resulta ntes, pero en la práctica son audibles solamen te los de men or frec uen -
cia. Se los puede clasificar de acuerdo con la cantidad de veces que aparecen
las frecuencias de los estímulos fl y fz en la fórmul a correspo ndiente. En la ta-
bla de la figura 17 se indica n los soni dos de combinación de men or orden.
b)~.~ En la tercera columna está n los armón icos de cada un o de los componen-
tes prim arios. Por lo general, los son idos de combinación de las dos primeras
co lumnas no siguen una estructura armón ica. 10
C)~. Sonidos de combinación de segundo orden
El espectro de los son idos de combinac ión de segundo orden o cuadráticos se

puede aprecia r en la figura 18.
d) Además de los armón icos de los compone ntes prim arios (2fl y 2fz), se ge-
ne ra un sonido diferencial (f2 - fl) y uno adicional (f , + f2) de gran amp litud . El
Fi~ura 16 . Enma scaramiento binau ral son ido ad iciona l es difícil de oír porqu e cae en una región espec tral en la que
existe n armón icos, si las seña les prim arias son complejas. Tamb ién es enm as-
carado con facilid ad por los comp on entes primarios f, y fz.
En cambio, el son ido diferencial se percibe con facilid ad , sobre todo
6. DI STORSIÓN A Ll N EA L Y SONIDOS DE COMB INACIÓN cuando su frecuencia es mucho menor que f l' Aunque la frecuenc ia result an-
te (f2 - f l) es la misma, no hay que confundir el sonido diferencial - producto
El vio linista ita liano Giuseppe Tartini observó en 1714 que al ejec uta r dos de la distor sión alin eal del oído- con e l batid o físico, que se origina en la in-
son idos muy intensos se gene raba un te rcer sonido , más grave, cuya frecuen- terfe renc ia entre seña les sin usoida les -un proceso line al.
cia correspo nd ía a la diferenc ia entre las frecu enc ias de los dos son idos or igi- Para un siste ma regular con distorsión cuadrática, el nivel del son ido di-
nales. La apa ric ión de dicho son ido diferen cial no deb ería sorpren de rnos ya ferenc ial sigue la siguiente ecu ación:
que sabe mos que el oído presenta co mportamie ntos alinea les en práctica-
mente todas las etapas de tran smisión y procesamiento de señal.? El t ímpa- NI (f2 - fl) = NI (fl) + NI (fz) - C 2
no, la cadena de hu esecill os y el oído interno contribuyen de man era variable
a la al inealidad tot al, aunque es muy difícil hallar el origen exacto de la dis- C 2 es una constante que depende de la profundid ad de la distorsión cuad rát i-
tors ión en cada caso . ca . Los experimentos psicoacústicos sobre el tema la ubic an en un va lor apro-
Un siste ma de tran smisión alinea l produce armó n icos cua ndo se lo exci- ximado de 130 dB. Es dec ir, con NI (f¡) = NI (fz) = 70 dB, el n ivel de
ta con una sinusoide pura (Basso, G. , 2001a ). Los product os de esta distor sión intensidad del diferen cial alcanza 10 dB y no se lo percibe en todas las ocas io-
armón ica son difíc iles de oír pues se confunden con los armón icos propios del nas. Pero con NI (f,) = NI (f2) = 90 dB el nivel de int ensidad del diferencial
est ímulo físico y se integran a la periodicidad definida por la fundamen ta l de llega a 50 dB y se lo percib e co n relativ a facilidad.
Fourie r de la señal. Pero si el oído es excitado co n dos seña les sinusoida les, la Se asume que la alinea lidad ca usant e de los son idos de combinación de
distorsión alineal produce una gran ca nt idad de artefactos que se perciben co- segundo orden se origina en su mayor parte en el oído med io, con un a parti -
mo sonidos resultantes o de combinación. En teoría, ex iste n infinidad de son idos cipación menor del tímp an o y ge l oído interno.
<} Aunque aquí adop tamos la denom in ación tradic iona l de sonidos diferenciales y de sonidos
de combinación, no los debem os confundi r con las seña les físicas que los causan ni con las 10 Una exce pción se da cuando una frecuencia primaria es igual o múltipl o de la otra. Por
frecuencias de dichas seña les físicas. ejemplo, fz = N t, (Basso, G., 200 Ia ).
110 111
Primarias r, t2 So n idos de co mbinación de tercer orden
Secundarias t 2 - r, t2 + t, 2t, . 2t 2 El espec tro de los son idos de co mbi nación de tercer o rden o cúbicos, gen e-
rados por un sistema regul ar con d istorsión cúb ica, se pued e apreciar en la
Tercer orden
2t , - t2 .2t2 - t , ar, + f 2 . 2t 2 + t, 3t, . 3t 2 figura 19.
Los son idos ad icio na les cú bic os de alta frecu encia (2fl + fz) y (2f2 + f ,)
3t, - t2 . 3t 2 - t, . 3t, + t 2 . 3t 2 + t, .
Cuarto orden son extrema da me n te di fíciles de oí r. Los sonidos d iferenc iales cúbico s (2f , - fz)
2t, - 2t 2 2t, + 2t2 4t, . 4t 2
y (2fz f, ) poseen e l triple de amp litud que los terceros armó n icos (3fl) Y(3f2)
... ... ... de los co mpo nen tes prima rios. En ci ertas circunst an cias el más bajo de ellos,
(2f1 - fz), es tan audi ble co mo el diferencial cu adrát ico (f2- f¡).
Figura 17. Frecuen cias cor respond ientes a los son idos de combinación de men or orden . Se Sin embargo, en este caso la rel ación entre niv el es de entrada y sono ri-
presupone f2 > f l dad percibida no sigue un a ley tan simp le com o en el caso de los son idos de
comb inac ión de segundo ord en. El difer encial cúb ico (2f, - f2) persiste a nive-
les de estímulo muy bajos y su aud ibilidad depende en gran medida de la fre-
cuenc ia de los componentes primarios. Por ejemp lo, dec rece rápidamente en
sono ridad cuando la d iferenci a entre fz y f l supera un valor ce rcano al 30 %.
Estos h echos revelan la ex istencia de un a alinealidad esencial, en la que el sis-
te ma no se puede apro xima r a un siste ma lin eal para pequ eñas amp litudes de
, 1
señal. Se sabe que el orige n de esta alinealidad ese ncial aparece más all á del
oído medi o. Se supo ne que surge de la activ idad de las células motoras en la
cóclea o en a lgún centro de procesami en to neural supe rior.
(2 - ( , (, (, 2f, (, + (, zr,
En la figura 20 se aprec ia el co mporta miento de los son idos di ferenci ales
Frecuencia
l11<l S audibles en fun ción de la difer encia de frecuencia en tre los compo ne ntes
Figura 18. Distor sión cuadrática pura a parti r de dos componentes primarios de frecuencia primarios y en la figur a 21 se grafican en notac ión musical apro x imada los di-
f 1 y fz ferenc iales cuad ráticos y cúbicos presentes en algunos interva los sencillos.
7. A LGORITMOS PSICO ACÚSTICOS DE COM PRESiÓN
El fenóme no de en masca ra m iento se emplea desde la década de 1980 en el di-

"O
:e seño de siste mas para co mpresión de arch ivos de audio de gran eficacia . Se los
a. den omina gené ricame n te algoritmos psicoacústicos de compresión y, de tod os
E
«
ellos, en la actua lida d el más difundido es el MP3. El obje t ivo prim ar io de es-
tos sistemas es el de redu cir el tam añ o de los archivos digitales de aud io que
r, (, 2(, +(, (,+2f,
en cod ificaci ón PCM estándar- ocupan alrededor de 10 Mb por minuto de re-
I:isrro y tienen una tasa de transmi sión de 1,4 Mbps. La compresión permite
2f,-(, 2f, -f, 3(, 3(,
IIIl aho rro de espaci o de almacen am ien to y una mayor veloc idad de transmi-
Frecuencia
sil'm a través de siste mas de red, A co ntin uac ión de scribirem os brevemente las
Figura 19 . Disto rsión cúbica pura a partir de dos compone ntes prim arios de frecuen cia fl ru rncterfsticas principales del códi go MP3 , que en principio no difi ere susta n-
y f2 d almen te de otros formatos de compresión de aud io menos difundidos.
112 113
Frecuencia En primer lugar, los arch ivos de audio, generalmente en dos cana les PCM de
44,1 kHz de muestreo y 16 bits de resolución , son transformados en frecuen cia
2f, . ----------------------- y separados en 18 sub-bandas por cana l. Ca da sub-banda reproduce aproxi ma-
Estímulo f2 damente el tamañ o de un anc ho de banda crít ico. La tasa de transmisión se fi-
(Frecuencia variable ) ja a un valor menor al de un cn de audio para limitar intencio na lmente la
3/2 f,
cantidad de bits dispon ibles y forzar la compresión. A part ir de un modelo psi-
Estimu lo f, coac ústico se exa mina cada sub-banda y se dec ide a cuá les se destina la mayor
f, (Frecuencia fija) cant idad de bits. Por eje mplo, las bandas que son enmascaradas por otras más
pote ntes reciben men os bits porqu e en ellas no se va a percibir el ruido de cuan-
fe l =f 2 - f , tizaci ón, prod ucto inevitable de la menor resolución. En otros térm inos, se re-
: Sonidos diferenciales
mueve la part e de la seña l que no vamos a poder oír al quedar enmasca rada .
le2= 2f, - f 2
A la salida del cod ificado r psicoacústico se agrega un codificador por re-
l- ~ - - + -- *-_. Frecuencia dunda nc ia, por ejemplo uno de Huffm an, que permite llevar la tasa de com-
r, 3/2 r, zr, del estímulo
Unisono Quinta Octava variable presión a un valor final de hasta 12:1 sin que se degrade sign ifica tivamente la
calidad de audio. En la figura 22 se puede aprec iar un diagrama en bloque s del
Figura 20. Diferenci ales cuadrát icos y cúbicos en función de la diferen cia de frecu en cia proceso co mpleto .
ent re los co mpone ntes prim arios (tom ado de Roed erer, 1997 ) La profundidad de compresión depend e de la calid ad de audio requerida
,
y del t ipo de seña l que se va a codificar. Por lo gen eral, una tasa de tran smi-
sión de 128 kbps se cons idera suficien te para alcanzar la ca lidad de audio de
:
un C D, al men os si se emplea un siste ma de monitoreo de ca lidad media y la
: : I
..a.
~?++ música no posee gran ran go d inámic o.
Es muy impo rta nte tomar en cuenta que la codificac ión MP3 y todas las
O- O-
que emp lean esta clase de procesami ento psicoacúst ico son técni cas a pérdida
~ ()
O
() () de informac ión . La seña l codificada no puede vo lver a su estado o rigina l una
vez fina lizado el proceso.
Figura 21. Notació n musical aproxi mada de los sonidos dife renciales más des tacados
Señal de Señal de audio

audio digital codificada
La sigla MP3 es una abrevia tu ra de MPEG-I Layer 3, un form ato definid o (PCM) ,--- ---.., L~--~----r--' 192 kbils/s
por el Moti on Picture Experts G roup ( MPEG). Es parte de un ex te nso progra-
ma destinado a esta blecer estánd ares para la indu stri a del cine, la televisión,
I
32 kblls/s
la música y de siste mas multimedia.!' El algoritmo de compresión/descompre-

sión (C odee) del formato MP3 comprend e dos eta pas principales. En la prime-
ra eta pa se remueve la parte inaudible de la señal y en la segunda se eliminan
las redundanci as del material reman ente.
11 La pa rte de audio de MPEO - l (norma ISO/lEC 15 11172-3) fue establecid a en 1991 y co n-

siste en tres modos de ope rac ión de co mplejidad crecie nte: Layer-I , Laver-Z y Layer-3 . En
el está nda r MPEG-2, sucesor del MPEG- l, se defin e el Advanced Audio Codi ng (AAC) qu e es-
roí reemplazan do al MP3 en muchas ap licacio nes. Fi ~ura 22. Diagra ma en bloq ues de un cod ificado r MP3
114 115
Capítulo IV
Procesamiento temporal de señales
Decir que los son idos del ambiente, de la música y del habla dependen , nece-
sitan y, en última instan cia, está n hechos de tiempo, es en unc iar una verdad
de Perogrullo. La nat uraleza del son ido es el devenir y el estudio de sus rasgos
esenciales ha planteado, y plantea, arduos probl emas filosóficos. De las mu-
chas experiencias que nombramos con el término "ti emp o", algunas invo lu-
cran nociones relacionadas con la sucesión, el presente, el pasado y el futuro.
O tras con las ideas de instantan eidad , simulta ne idad y duración . Tambi én es-
tán las que tienen que ver co n la flecha temp oral y la irreve rsibilidad del trán -
sito del pasado al futuro. De la noción de tiemp o se deriv an de form a más o
menos direct a ot ras co mo movimiento, velocidad, pulso o ritm o. La dificultad
del llamado probl ema del tiempo radica en art icular semejante variedad de fe-
nómenos y conceptos dentro un sistema coherente.
So n abundantes y variadas las soluciones propuestas ha sta ah ora para re-
solverlo. Pero es posible recon ocer en la h istori a del pensamiento dos grandes
tendencias. La prim era ---que cuenta en sus filas a Ari stóteles, Newt on y Eins-
tein- considera al tiemp o como un he cho físico al que se adapta la mente hu -
man a. La segunda supone que el tiemp o es un fen ómeno que pertene ce a la
mente human a y que el de los físicos es un constructo prov eniente de la idea -
lizac i ón de los co nte n idos mentales. Se pueden situar en esta últ ima línea a
pensadores com o San Agustín, Brentan o o Hu sserl. Para Paul Ricceur estas
opcio nes no se solapan por entero: a la perspecti va física le falta la capaci dad
de conce bir un presente a part ir del instan te, y a la perspectiva psicológica le
falta suste nto a la hora de explica r de forma sat isfactoria el dur ar.
En la actualidad, la mayoría de los investigadores conjeturan que el tiemp o
no responde a un modelo de tipo unívoco, sino que con stituye una ent idad que
se debe pensar desde varias perspectivas diferentes. Según Fraser (1992), existen
al menos seis categorías temp orales: 1. Atemporalidad: en un universo en el que
solament e hay radiac ión electromagnétic a el tiemp o no existe. La emisión y la
absorción de un fotón ocurren, en lo que se refiere al fotón , simultá neamente.
117
2. l' rot oternporalid ad: en un universo de partícu las elementales el tiempo tectar cambios en el estímulo a med ida q ue transcurre el t iempo. La otra, la in-
\'s fragmentario. N o fluye y carece de dirección . Los sucesos se pueden sit uar tegración temporal, es la capacidad de agregar informa ción a medida que tran s-
de forllla estadística porq ue la sing ularizació n de un instante concreto ca rece curre el tiemp o y permi te aumentar la capacidad de discriminaci ón ante un
de sigu ificado. estímu lo de larga duración . La mayoría de los estud ios psicoacús ticos se orien-
3. Eotempora lidad: en e! un iverso macroscópico de la materia dot ada de ta hacia temáticas relacionadas con la resolución temp oral. Sin embargo, la in -
Illasa el tiempo es continuo, pero in móvil y sin d irección. N o se le aplican los tegración temporal juega un rol dest acado en ciertos géneros y esti los musicales
co nceptos irreversibles de pasado, presente y futuro. Es el tiemp o de las leyes q ue emp lean la aliteración de son idos en los que algún parámetro deriva len -
de la mecánica clásica. tamente.' La mayoría de los autores concuerdan en que la resoluci ón tempora l
4. Biotemporalidad: es el tiempo de los an imales. Tiene dirección y existe dep end e principalmente de dos procesos afines. Por un lado se realiza un aná -
un pasado, un presente y un futur o, pero sus horizont es son limitados. Los bor- lisis del patr ón temp oral dentro de cada ca na l del filtro aud itivo y, por el o tro,
des del presente son estables y probab lemente caract erísticos de cada espec ie. se comparan los patrones temp orales correspondientes a cana les diferentes.
S. Nootemporalidad: es el tiemp o de la mente h umana. Existe una clara La mayor dificu ltad al int entar medir la resolución temp oral es consecuen-
noción de pasado, presente y futuro y sus horizont es son ilimitados. El presencia de la inevitab le relación entre tiemp o y frecuencia propi a de tod o fen óme -
le tien e bordes difusos, que varían según la ate nc ión . no ondulato rio, que depend e direc tamente de l principio de indeterminación
6. Sociotemporalidad: es el t iempo co lect ivo q ue regula el ritmo soc ial. acústico . Los camb ios en el patrón tempora l de una señal está n acompañados
Lo organ izan los relojes y los calendarios. generalmente de una modificación en su espectro. Por ejemplo, al interrum-
El esq uema de Fraser, aunq ue simple y parci al, sirve para entende r que pir brevemente una sinusoide aparece un espectro de banda ancha que se oye
el pro blema del tiempo no pued e abarca rse por completo desde una sola como un clic muy sonoro . En la figura 1 se aprecia n los gráficos temporales y
perspectiva. sonog ramas co rrespo ndientes.
A l margen de las espec ulaciones conceptuales, el tiem po es un parámetro Puede ocurrir que una aparente detección temp oral sea en realidad un a
acúst ico importante pues casi todos los son idos fluctúan durante su desarrollo. detección espec tral -por ejemplo, el espec tro de potencia de un par de cl ics
Miis aún , para sonidos que co nt iene n inform ación, co mo la palabra y la músi- muy cercanos en el tiemp o es diferente del espectro de poten cia de uno solo
ca, ésta aparece en los ca mbios antes que en las part es estables. En estos casos de ellos. Para ev itar esta clase de confusiones, en las pruebas exp erim enta les
es conven iente distingu ir algunas escalas tem porales diferentes: 1) la microes- se ado ptan dos estrate gias diferent es. La primera consiste en empl ear seña les
ca la, que va desde alguno s milisegun dos a varios cie ntos de milisegundos y que de espectro inv ariante ant e cambios en su pat rón temporal. El ruido blan co,
port a la estructur a fina del sonido ; 2) una esca la que contemp la los camb ios por ejemp lo, conserva el espectro plan o aunque se lo seccio ne repentinamen -
más lent os, caracterizados por las envo lven tes temporales de los parámetros te, ta l como se aprecia en la figura 2.
acústicos, que va desde un as décimas de segundo hasta algunos segundos; 3) La segunda estrategia emplea estímulos cuyos espectros se modific an al al-
otra que conten ga las estructuras compuestas que tom an varios segundos en terarse los patro nes tem porales -como ocurre con las seña les sin usoidales. Pa-
desarrollarse, como palabras y motivos musicales, y 4) la macroescala tempora evitar la confusión ent re detecci ón temp oral y espec tral, a la seña l de base
ral, q ue pued e abarcar minutos enteros y en la que se despliegan oraciones y se le agrega ruido de fond o a fin de enmasca rar las band as de frecuen cia qu e
(rases musicales. Esta últim a escala depende directamente de la memori a de surgen en cada tr ansición. El ruido de Patterson, ya visto en el punto 2 del ca-
co rto término. En los grandes desarrollos musicales, com o el de la forma sona- pítu lo 111, es un o de los más eficaces ya que no altera a la seña l en su banda
ta, tambi én juega un rol deci sivo la memoria de largo término. central (Patrerson, R. D., 1976) . En la figura 3 se puede apreciar la técnica de
Patterson para enmascarar las bandas lat erales que aparecen en las transicio-
nes en una señal sin usoidal.
I . R ESOLUCIÓN E INT EGRACIÓN TEMPORAL
Much as veces se confunden dos noc iones relacion adas con el procesamiento 1 Hay n umerosos eje mplos en la música de l sudeste asiático. En occident e. la integración
temp oral de seña les. Una de ellas, la resolución temporal, es la habilid ad para de- tempora l constituye un proceso cen tra l en el minimalismo.
118 119
+r-- ------------------,
ro
~'"
ro Banda de ruido Banda de ruido
~ enmascarante enmascarante
~'" Señal
ro
T;
c:
o'"
a.
o Frecuencia (escala lineal) +
Figura 3. T écn ica de Patrerson aplicada a un a sinusoid~
Efectos de la fre cu encia central en la resolución temporal

l'
I
Se ha sugerido que la resolución te mporal debería ser mejor a alta que a baja
frecuenc ia. Una d iscon t in uidad en una sin usoide causa una cola de resonan-
Tiempo (ms) cia ("ri nging"'e n inglés) en cada filtro auditivo , que se mantiene dur ante más
tiempo a medida que decrece el anc ho de banda del filtro auditivo correspon-
Figura 1. G ráfico te mpo ral y espectral de una d iscont inu idad en una sinusoide
die nte -por aplicación del principio de indeterm inación ac ústico. En la figu-
ra 4 se puede observar la mod ificación te mpora l ejercida por el filtro aud it ivo
centrado en 1.000 H z sobre un a señ al de entrada de 1.000 Hz.
N
Como las bandas más angostas se encuen tra n a baja frecuen cia, es lógico
~ suponer que en dicha región de! espec tro la reso lución te mpora l result e infe-
ro
'0 rior que en la zona de alta frec uen cia . Da tos exper imentales sugieren que, por
c:
a'"
~
encima de los 2.000 H z, el tiem po de respuesta de los filtro s auditivos es muy
u. pequ eño y no afecta significativa mente la resolución tem poral. Por debajo de
esa frec uenc ia la resol uc ión disminuye apreciablemente.
Tiempo (ms)
2. R ESOLUCiÓN TEMPORAL EN SEÑALES DE BAND A A NCHA
En general, los experimentos en los que se int en ta determinar el umbral de de-

tección de discontinuidades (gaps ) se basan en seña les de ruido de banda an -
cha. El método más ut ilizado es el de elecc ión forzada entre dos alternativas
(2AFc), en el que el sujeto debe dec idir cuál de los dos pu lsos sucesivos de rui-
do cont iene e! gap. El umbral de discon tinuidad medid o en esta clase de exp e-
riment os, por ejemplo e! realizado por Plom p, es de 2 a 3 ms (Plomp, R., 1976) .
Tiempo (ms) O tro grupo de experimen tos emplea seña les de band a ancha invert idas en
Figura 2. G ráfico tem poral y espec tra l de un a disconrinuidad en una seña l de ruido blanco el tiempo. Sabemos que el espect ro de pote ncia de largo t iempo de una señal
120 121
a)
"C
~~~~~~~ iD
E
"C
ro Señal de
"
"C
"C
.¡¡¡
c: I ¡ entrada
.¡¡¡
~
c:
~~~~~~~~
Q)
:g ¡ E
Tiempo (ms )
O 5 10 15 20 25 30
b)
~
"C
~~~~~~.~ m
E
"C
ro
ro Salida "C
.¡¡¡
"C
.¡¡¡ I
:
:: del filt ro c:
i
Q)
c:
s ¡ :g
E
~~~~~~~~ Tiempo (ms)
Tiempo (ms) F igu ra 5 . Seña les de banda ancha empleadas para det erminar el umbra l de det ección de
discont in uidades
Figura 4. Respuesta simulada de un filtro audit ivo de Fe = 1.000 Hz ant e una sinuso ide
secc ionada de 1.000 Hz
de corta duración no cambia si ésta es in vert ida temporalmente. Por lo tant o, D etección de discontinuidades en ruido de banda angosta
si la segunda señal es muy breve y se la distingue auditivamentc de la original
debe ser por la diferencia en su patrón temporal. El umbral de detección entre Para señales de banda angosta mod erada el paráme tro de comparaci ón es el
dos señales de banda anc ha que cambian de amp litud a la mitad de su desarro- anc ho de ba nda del filtro audit ivo que le cor respo nde . Ta l como hem os vis-
110 (de A a 2A ), pasadas al "derecho" e inverti das, es de 2 a 3 ms, valor que to, la detección de disconti n uidades debería ser peor a baja frecuencia por -
coinc ide con el ha llado por Plomp . Los sujetos no se dan cuenta del camb io de que en esa región espectral el ancho de banda de los filt ros aud it ivos es
ampl itud, pero percibe n un camb io tímbrico (oyen "tick" y "tock"). En el grá- menor. Los umbr ales de de tecc ión deberían dis minuir a medida qu e aum en-
fico de la figura 5 se puede n ver las señales ut ilizadas en el experimento citado. ta la frecuencia y por lo tan to el anc ho de band a del ruido, ha sta llegar a l
A lgunos autores ha llaron valores sign ificativamente menores para el um- va lor de la banda crít ica co rrespo nd ien te. A part ir de este punto , un au-
bral de de tección , entre 0,25 y 1,8 ms, pero no se conoce la causa de la discre- mento en el ancho de ban da no debería mej orar la detecci ón de la d iscon-
pancia entre ambos grupos de medic iones . t in uidad . S in e mba rgo, los da to s expe rim ent al es co ntrad ice n esta
afirmación : cuando se introd uce un a discontinuidad su gran des arro llo es-
pec t ra l afec ta sinc ró n icamen te a un a ca n t ida d de filtro s audit ivos - cosa q ue
3. RESOLUCIÓN TEMPORAL EN SEÑA LES DE BANDA A NGOSTA no oc urre co n las va riac iones de amp litud prod ucto de la alea toriedad pro -
pia del ruido . La exc ita ción en par al elo de vari os filt ros auditivos permite
Para seña les de banda angosta, la introducción de una discontinuidad implica que el umbral de detección resul te menor qu e el qu e se obte ndría si sólo un
"desparramar" el espec tro por efecto del principio de indeterminación acústi- filtro fuese puesto en juego . Las mediciones ex pe rimental es co nfirman esta
co. De todos modos, la situac ión es difere nte si se trata de señales de banda h ipó tesis, pues par a ru ido de ba nda angos ta, cuya frecue nc ia centr a l varía
angosta moderada o con espectro de línea, como es el caso de las sin usoides . en tr e 30 y 1.000 H z, los umbrales de det ección de discontinu idade s dismi -
A con tin uación se analizan. amb as posibilidades. nu yen desde un va lor de 40 ms hast a caer por debaj o de 10 ms. Este efec to
122 123
vx de gran impo rtanc ia par a exp licar la paradoja acústica temporal qu e ana-
lizaremos m ás adela n te .
Detecc ión de disco n tin u idades en sin us oides
('ar;¡ evita r la co nfusión en tre dete cc ión tempor al y espectral, las sin usoides se
presentan ju n to a un ru ido continuo co n una muesca espect ral sinton izad a a
la frecuencia de la sin uso ide (figura 3). De este modo se co nsigue en mascara r
la disp ers ión del espec tro ocas iona da en la discontin uidad .
En un cé leb re ex perime nto, S ha iler y Moore estud iaro n la detecc ión de
discontinuidades en sin uso ides en foca ndo la atenc ión en la fase de reinicio
de la señal (Shailer y Moor e, 1987). Explicaron sus resultados, que co ntradecían 10 ms
:1 la literatura sobre el tem a, sobre la base de la cola de resonancia ("ring ing" ) Figura 6. Tres condiciones de fase diferente s usadas en el experimento de Shailer y Mame
del filtro aud itivo: cuando la sinusoide cesa, el filtro audi tivo sin to n izado a su
frecu en c ia continúa respo nd iendo por un t iemp o. S i el re in icio de la señal
co inc ide en fase co n esta respuesta del filtro, la det ecci ón de la disco n ti n ui-
dad es más d ifícil. En las figuras 6 y 7 se mu estran las seña les emp leadas y las Señal con discontinuidad Salida del filtro auditivo
respuestas del modelo an te discontinu idades de d ifere nte d uración.
En ·Ios casos en los qu e la seña l "e nga nc ha" en fase co n la respu esta del
nitro aud itivo , Sh ailer y Moore midi eron umbra les de 4,5 ms, co ns iderable-
ment e mayores a los 2 o 3 ms esperados.
AJvdJ'v - AJ\fvvvvv\NV
~-rvvvvwvvvv
4. M ODELOS DE RESOLUC IÓN TEM PORAL
La resp uesta del filtro a ud itivo a n ivel coclear es muy rápid a para altas fre-
f\Jk;!\fv - W\JVVVV\M
~ - W\JVVVV\M
cuenc ias y, por lo tan to , se supo ne q ue debe exis ti r un limitador a otro ni vel
de procesamiento n eur al, En general, se asu me q ue los ca mbios ráp idos so n
suav izados en alguna de las etapas superio res del proc eso . Casi todos los mo-
delos elaborados para dar cu enta de la reso lución tempora l co nstan de cua tro
l'lapas, similares a las qu e se ap recian en la figura 8. ~ - W\JVVVV\M
• En primer lugar aparece un filt ro pasabanda que corresponde a cada uno
dl' los filtros aud itivos co nectados en paralelo.
• A co n tin uac ión, la seña l es procesada po r a lgún d ispositi vo n o lin eal.
• Luego pasa por un in tegrado r tem poral , que puede caracterizarse como
~ -rvvvvwvvvv
1111 f¡ It ro pasabajos.
• l' o r últ imo , el producto de los primeros tre s bloqu es entra a un módulo
~- AJ\fvvvvv\NV
de dec isi ón que det erm ina qué es lo que se va a perci bir ante la d iscontinuidad .
Figura 7. Salida de un filt ro aud itivo simulado con Fe ; 400 Hz en respuesta a una sinu-
ES I·os bloqu es co rrespo n de n a d iferentes pro ce sos q ue tr ansforman la soide, con d iscontinuidades de 1,2 a 3,7 rns en la condició n de fase está ndar (experim ento
se ña l del cst ím u ]o. De tod os ellos , el módu lo de decisión es quizá el más de Sha iler y Moore)
124 125
S. OTROS PROCESOS T EMPORALES
Estimulo
Discriminación en secuencias de Huffman

Figura 8 . Diagrama en bloque s de un mode lo de reso lución tem poral
C reen estud ió la discriminación temporal en seña les que t ien en el mismo es-
pect ro de largo tiempo -a gran escala- , pero distintos espectros de corto tiem-
po - a pequeña escala- (O reen , D. M ., 1973 ). Son son idos breves de banda
.g r--- _ anch a -parecidos a clics- excepto que la energía de ciert as regiones es retra-
~ sada con 'relación a la de otras regiones. La frecuencia central, la cantidad del
2'"
.S retardo y el ancho de banda de la región con reta rdo pued en variarse indepen-
o
"5
:g.---- dien temente. Estas señales se denom inan sonidos de Huffman. El experimen to
E de Oreen post ulaba que si los sujetos not aban deferencia entre dos son idos de
Q;
u
ro
:2
Huffman diferentes, quedab a demostrada su sensibilidad al patrón temporal.
ro
(IJ . - -.,---_ _ . El resultado confirmó la hip ótes is: el umbral de det ección del retardo de la re-
gión bajo estud io fue de Z ms, resultado independ iente de la frec uen cia cen -
o 5 10 15 20 25 30
tral de las señales ut ilizadas. Los sujetos percibieron las diferen cias en el
O 5 10 15 20 25 30 O 5 10 15 20 25 30
TIempo (ms) TIempo (ms) TIemp o (ms ) patrón te mpor al como cambios en la calidad del son ido.
Estimulo Filtro auditivo Módulo integrador
Detección de asincron ías en el ataque y la extinción de señales comp lejas
Figura 9. O peración del módulo de dec isión en el modelo de Shaíler y Moore para estímu-
los de d iferen te frecuen cia
La asinc roní a de co mponen tes de una seña l co mpleja es detectada co n ma-
yor fac ilidad en el ataq ue que en la ex tinción de la señ al. Para señales ar mó-
co mplejo y su configuració n varía según la tarea que se le asigne. En uno de n icas se perciben dife renc ias en el at aque de los armónicos de menos de 1 ms
los modelos más desarro llados, el de Sha iler y Mo ore, la seña l es procesada (co n umbrales algo mayore s,para componentes de alta frecuen cia) , mientras
por un mód ulo de de cis ión co n las característ icas que se apreci an en la fi- que el umbral en la ext inc ión va desde valores comprend idos en tre 3 y 10 ms
gura 9. En este modelo el integrad or temporal es un a ventan a tempo ral no - cuando el compo ne nte asincrónico cesa después que el resto de la seña l
rcc tan gular. compleja- hasta valore s entre 10 y 30 ms cua ndo éste cesa antes que la señal
Se obser va claramente que la detección de la discontinuidad resulta inde- de base. El resultad o de estos ex peri me ntos es consistente con la importancia
pend iente de la frecuencia cen tral del filtro aud itivo inv ol ucrado. perc ept ual del ataque de un son ido. Tamb ién está estr ec hamente relacion a-
do con la adaptación audit iva y con la percepción del t imbre instru mental.
H ipótesis del banco de filtros de modulación Los umbrales de detección de asin cron ías para señales no armó n icas son
de Z a 50 veces mayores que para señales armónicas. Este hec ho es expl icable
A lgunos investigadores ha n sugerido que el análisis de los son idos que son mo- en términos de agrupamiento perceptual: es más difícil establecer la sincronía
dulados en amplitud depende de una parte especializ ada del cerebro que con- de ataq ues de señales que parecen provenir de fuen tes diferentes.
tie ne grupos de neuronas afina das cada una a una tasa de modulación dada.
C ada neuro na pued e ser considerada como un filtro en el dominio de la mo- Discriminación de la duración
dulación y el conj unto de neuronas se conoce como banco de filtro s de modula-
c¡(in . Este modelo es todavía controversial, pero podría expli car la eficaci a de Varios estud ios revelan que , para valores de duración del estímulo T super io-
ciertos parámetros de predicción de la in tel igibilidad tales com o el ST l o el res a los 10 ms, el umbral diferencial de dur ación L'lT se in creme nta con T y
IZASTI, que trataremos en el capítulo IX. es aprox imadamen te independiente de las características espectrales de la se-
I Zó 127
iia !. Esta regla se cu mple tan to para la d iscriminac ión de la dur ac ión en son i- que esgrime pa ra defender dicha hipótesis es la del des plazamie nto temporal
d"s co mo en silencios en tre son idos. Valores típicos de ~T son de 1,7 ms pa- de est ímulos ac ústicos extremos: tom an do la sec uencia [al - b - azl en el t íem -
ra T = 25 ms y de 15 ms para T = 32 0 ms (Di ven yi y Danner, 1977 ). La />0 físico t, si el est ímulo central b tie ne un a frec uencia que difie re de forma no-
fracción de Weber, ~Trr, decrece levem ente al aumentar T. Como con cas i rab le - por eje mplo cuatro octavas- de los estím ulos laterales y escogemos
I"dos los paráme tros qu e cuantifican la discriminación aud iti va, se encontró estímulos muy breves -del orden de los SO m ilisegundos- , lo que se oye en el
que ~T aumen ta a intensidad es próximas al umbral de audíbilidad. tiempofenoménico T es un a sucesión d ist inta [Al - A z - B], Los sonid os más agu-
Estos va lores se correlacionan con los de integración temporal de la sono - dos se oyen seguidos y el sonid o intermedio, más grave, se ve relegado a l final
ridad , en part ic ular con el postulado de Henning que establece qu e, al eva luar de la sucesión (V icario, G . B., 1997). En la figura 10 se puede ver un esquema
la sonoridad en est ímulos de corta duración, prevalece la cantidad to tal de de l experimento. La dife rencia entre las frecue ncias de al Y az corresponde a
energía en lugar de la intensidad de la seña l, tema q ue tratamos en el capítu- un intervalo de segunda mayor desce ndente.
lo 11 , pu nto 4 (Henning, G . B., 1970). Vicario co mpro bó q ue en el caso de que los estímulos al Y az sea n nota-
bleme nte más exte nsos q ue b el fen óm en o se hace más ev ide nte, incl uso de -
saparece la noción de "local ización temporal" de b, que parece flotar sob re los
(l. JUICI OS SOBRE EL ORDEN TEMPORAL dos son idos agudos . Llega a la co ncl usión de qu e las sec uenc ias de estí mulos
no hom ogéneos son más propi cias para la producc ión de despl azami entos
La habilidad para juzgar el orden tempora l en una sec uencia de sonidos dep ente mpo rales.
de en gra n med ida de la tar ea asignada al sujeto : una cosa es la identificación El desplazami en to tem poral no se puede atribuir a ni ngún proceso fisioló-
de l orden que ocupa cada son ido dentro de la sec uencia y otra la discrimina- gico y no parece senc illo exp licar de qué modo relacion es específicas no tem -
cirín ent re secu enc ias con distinto orde n, sin q ue se pueda precisar la ubic a- porales -como semejanza o disim ilaridad- pueda n interaccionar con relacion es
c ió n de cada son ido en el co nj unto. temporales ta les co mo antes/después. La exp licación más d ifundida supone que
En el caso de la identificación del o rde n temporal, Hirsch encontró q ue la posición de los son idos en el tiempo feno ménico se decidiría luego de ha-
sujetos entrenados ne cesitaban al men os 20 ms por son ido para det erminar el ber o ído todos los estí mulos. La operación , preconscien te , tendría lugar en el
orden en una secuenc ia (Hirsch, 1. J., 1959) . En el caso de la discriminación lapso de aproximadamente 200 ms que va desde la llegada de las seña les al
en tre secuencias la reso lución es más fina, y se neces itan entre 2 y 7 ms por tímpano y la pe rcepción consciente de las mismas (Frai sse, P., 1967).
so n ido. Estos valores son de gran importancia para com pren der el desplaza-
mie nt o ac ústico temporal, que prese n tamos a co n tinuación.
El desplazam iento acústico temporal
Las pruebas exp erimentales refer idas a l desplazamiento entre el tiempo físico
y el feno mén ico fueron ini c iadas por Whilhem Wundt y co n t in uadas luego
por Edga rd Rubi en, qu iene s logra ron tran sform ar un fen óm eno de simu lta ne i-
O
I
a , =1.800 Hz
I
80
b =66 Hz
Tiempo (ms )
I
160
a, = 1.600 Hz
l.
240
dad física en un a sucesión psicológica. Varias hipótesis fuero n propu estas por
en tonc es para dar cuenta del fen ómeno, y ent re ellas prevalec ió la q ue supo-
¡lía que la hetero geneidad de los estímulos const ituye el factor responsable de A, A,
le IS desplazamientos temporales. B
En la década de 1970 el psicólogo ita liano Giov anni Brun o Vicario desa-
rrolló una serie de trabajos sobre el fenó meno del de splazamiento tempo ral en Tiempo
la aud ición, en los q ue plantea la imposibilidad de est abl ecer un a correspo n-
den cia biun ívoc a entre el tiempo físico y el psico lógico. Una de las ev idencias Figu ra 10 . Esquem a Jet exp er imento de Vicari o
128 129
Límites de validez delfenómeno a)
U na cond ición neces aria para la ocurrencia del desplazami ento temporal es
que las dist intas seña les no deb en conec ta rse espectralmente en las tran sicio-
nes. De hecho, la reproducción literal del experimento de Vicario no da el re-
sultado espera do. El mot ivo h ay que buscarlo en el perfil d inámico de las
señales: si las transicio nes son bruscas (figura 11a) aparece un gran anc ho de
banda q ue destru ye la separac ión espec tral est ipulada en la hip ótesis origina l.
La aparente anomalía se debe simplemente a que no puede ser quebrantado el
límite imp uesto por el princ ipio de ind eterminación acústico . El efecto se
aprecia claramente en el diagrama tridimensional de la figura 11 b.
Si se suav izan las tran sicione s en tre las señales, por eje mplo con ventan as Tiempo
te mpo rales gaussianas, se eliminan los puentes espectrales que conec tan la re-
495 ,92 ms
gión aguda con la grave y el fenómen o de desplazamiento temp oral se percibe
520,23 ms
con claridad . En la figura 12 se observa la señal de prueba modificada y el efec- : . . . . - - - - 544,54 ms
to espectral derivado. Se ve cla ramente la mayor independ en cia (separación
espec tra l) entre las seña les al Y a2 con respecto a la seña l b, que corresponde
Frecuencia (Hz)
a la condición de no homogeneidad de los est ímulos postulada en los trabajos
in ici ~ les (Basso, Guillén y Liut , 2000). Figu ra 12. a ) Deta lle de la secuenc ia te mporal con transiciones gaussianas largas. b) Gr á-
fico TEF de la misma secuencia
a)
A plicación musical
"O
ro
"O
.~ o Estas experiencias controladas --como reco nocen casi todos los invest igadores
'"
E que parti cipan de ellas- , por su simplicidad d istan basta nte de lo que sucede
en la vida cotidiana . Es posible, sin embargo , encontrar en muchas obras de
música el uso -inten cion al o no- de alguna de estas peculi ar idades de la per-
cepció n audi tiva. Por trat arse de situac iones musicales reales (esto es, dentro
del con texto de un a "puesta en obra") no tienen la in ten sidad y la claridad
b)
que se puede lograr en el marco ascét ico de un laborat orio.
De ac uerdo con sus objetivos y con los presupuestos est ilísticos involucra-
Tiempo dos, un compositor puede decidir el modo de aplicació n del desp lazamiento
~_ O , O m s
acúst ico temp oral. Si su int ención es ind ependizar y desv inc ular difere ntes ele-
57,32 ms
mentos de un conjunto, la estrategia planteada permite desdoblar la estructura
171,97ms
en dos tramas temporales separadas y autó no mas. U n eje mplo que ilustra esta
téc n ica se enc uent ra en la pieza para orq uesta reducida Homenajea GarcíaLar-
344 689 1033 1378 1722 2067 2411 2756 ca (1936 ) de Silves tre Revueltas, en la que la misma melodía se interpreta en
Frecuencia (Hz) paralelo con una tuba y una flaut a piccolo a distancias de cuatro y cinco octa-
FiJ.:llra 1 l. G r ñflco temporal y tie mpo-e nergía-frecuencia (TEF) de la seña les de la secuen- vas. Aunque el paralelismo absoluto de alturas y duracion es debería ayudar a
d a original fundir perceptualmente los instrum entos, la eno rme separación de los registros
130 131
Capítulo V
Tiempo
Percepción de la altura tonal
._ 15.06 ms
> - - - - - 1,391 s
Frecuencia (Hz)
Figura 13. G ráfico T EF del fragrnento citado de Homenaje a Garcfa Larca de Silvestre
La altura tonal se define técn icamente co mo "aquel atrib uto de la sensación
Rev ue ltas audit iva en té rminos del cua l los sonidos puede n ser orde nados en una escala
musical" (A merican Sta nda rds Associati on , 1960) .1En otras palabras, una se-
cuenc ia de sonidos que varían de altura to na l t iene el carác ter de una melo-
y la ausencia de puentes espectra les rompen la relación temporal entre ellos. A l día . Un ejemplo quizá ayude a delimitar este conce pto .
oí r el pasaje se percibe una ambigua sensación de "desajuste", provocado por el Si se alte ra la ec ualización en un siste ma de audio cam bia el brillo del so-
dcsfasaje ent re tie mpo físico y psico lógico prop io del fen ómen o bajo aná lisis. nido y, en cierto senti do, algún aspecto relacion ado con su altura. Pero hay
En la figura 13 se puede ver un gráfico TEF de dic ho fragmento. otros elementos que no se mod ifican , pues el ca mbio en la ecualización no ha -
Por el contrario, si el propós ito de l auto r se dirige a la fusión de estructu- ce que el Do de una flauta se sustituya por un Re, n i que el fragmento module
ras, el fenó meno de desplazamiento temp oral debe ser evitado. Ad emás de re- a otra to na lidad. Estas características -que perman ecen invariantes frente a los
ducir la distancia espectral que separa a los estímulos, es necesario agregar dato s cambios en la distr ibución de energía del espectro- definen la altura to na l pre-
espectrales que sincro n icen las secuencias en las zonas de tran sición . C iertas ar- sente en los son idos llamados tónicos (Sc ha effer, P., 1966) . La tonicidad de un
ricul aciones y ataques destruyen la paradoja tem poral, sincronizando el tiempo sonido es el rasgo perceptua l que permi te que se lo ident ifique con un o de los
físico con el psicológico. Aquí una cu idadosa elección de los medios instru- grados de la escala musical. Lo que cambia al modificarse la posición de los cur-
mentales, que incluye tan to los instrumentos mismos co mo las demás var iables sores de un ecualizador es la distribución de energía en el espec tro de la seña l.
invo lucradas -registro, mati z, art iculación , etc.- result a decisiva. Esta distribución de energía se asocia con la percepción de la altura espectral del
son ido: dos guitar ras que emiten la misma not a, una de son ido met álico y la
otra de sonor idad oscura, producen la misma altura tonal pero distintas alturas
espec trales (es habi tual decir que la primera es "más aguda" que la segunda ).
El grado de to n icidad varía de un son ido a otro: una flauta genera son idos
muy tóni cos, una marim ba son idos de to n icidad intermedia y un tambor ge-
nera seña les de ton icidad nul a. En una primera aprox imació n podemos esta -
blece r qu e el grado de tonicidad guarda relación con el anc ho de ban da de la
seña l física: a mayor anc ho de banda menor tonic idad, y viceve rsa. El princi-
pio de indet erminación acústico gob ierna la relación frecuencia/du ración en
los casos anteriores. La altura ton al se conside ra co mpleta o "fuert e" cuand o
permite la form ación de aco rdes y funciones tonales, e incomp leta o "débil "
I En la lite ratura en inglés se la denomina pitch chroma.
In 133
l'u:lIldu no lo hace. Por ejemplo, co n tres torn-toms de band a angosta se pue- o . 1__ _
.-_.. __._._-
........
-6
d(' gene rar una secuencia melódica Do-Mi -Sol, pero si se los ejecuta sirn ult á- -12
-18
nc.uucntc no se forma el aco rde de do mayor: los torn-torns poseen altura -24 - -í - -- - --- ,-,-- - -' ..
tUl d incomp leta (Basso, G., 2001a ). -30 _ _ 1_ _ _ __-
al -36
En general, las seña les per iódicas son perc ibidas como son idos tóni cos, a ~ -42
-e -48 ::.L -'
l, .s que se puede asigna r un valor de altura to na l definido que se correlaciona - -
=ª
~-
-54
ií
d irectamente con la fund amental de Four ier de la seña l. Se presenta aquí una E -60
<t: -64
de las propiedad es más notables del sent ido de audición: percibimos con una -72
·78
nltlira tonal úni ca los son idos ca usados por est ímulos periódicos, al margen de -64
la co mplejidad armón ica que posean . En la figura 1 se pued e ver el espec tro de -90
-96
un son ido de violonce llo. 500 1k 2k 5k 10k 20k
100 200
La ca ntidad de armón icos es aquí muy grande. Sin embargo, se oye clara- Frecuencia (Hz)
mente una sola altu ra to na l. En estos casos el sistema auditivo presta más aten-
c i ón a la salida de un hi potético centro de procesa miento de la altura (que Figura 1. Espectro de un son ido de violonce llo
se ñala una úni ca sensac ión de altura to na l) que a las características de la altu-
ru espectral o prim aria del son ido. Si se desea oír en det alle cada comp onente
nisludo es necesario inhibir el mecani smo anterior, ope ración que dem and a un bilidad a la fase del siste ma auditivo- Co mo esta sensibilidad desaparece para
t icmpo considerab le y que exp lica la dificul tad de percibir por separado los ar- frecuenc ias por encima de los 5 kHz, la teoría tem poral no explica la percep-
iu único s superiores en los son idos de corta duración. Se deno mina audición ció n de la altu ra tona l a altas frecuencias.
mlCllítica a esta última forma de oír y audición sintética a la pr írnera.?
A lgunos auto res, entre e llos Terhardt, sugieren q ue la capacidad para sin-
t ctizar gran cantidad de armónicos en una únic a altura ton al se aprende du - 1. PERCEPCi ÓN DE LA ALTURA T ONAL EN SINUSO IDES
run rc la primera infan cia a partir de la reit erada. exposición a sonidos
peri ódicos, en especial la voz humana (Terhardt, E. et al. , 1982). A comienzos del siglo xx el psicólogo Hermann Ebbinghaus postul ó que se de-
A lo largo de este capítulo nos enco ntraremos constantemente co n dos be remover toda la inform ación superflua en el estudio de los estímulos y sus
teo r ías que trat an de explicar la percepció n de la altura tona l. Una de ellas es respuestas psíquic as. A partir de esta regla, que mezcla principios to mados de
la rcorfa del lugar (véase cap. 1, apartado 4) , que parte de dos postulados distin- las ciencias físicas y una mala lectu ra del teorema de Fourier, se impu so una
lusoEl primero esta blece que el oído efectúa un aná lisis espectral en el interior tradici ón en la que se emplean casi exclusivamente seña les sinusoidales para
de la c óclea: diferentes frecuencias excitan diferentes lugares de la membrana los experimentos de psicoacú stica. En con secuencia, también se utili zaron es-
hasilar, en una especie de organi zación ton ot ópica. El segundo postul ado afir- tímulos sinusoidales para estudiar la percepci ón de la altura tonal. Sa bemos,
lila que la altu ra to na l se relacion a con el patrón espac ial de excitació n produ - sin emb argo, que las sinusoides son seña les de prueba inadecuadas porque la
cido por el estímulo. La primera hip ót esis es aceptada por la casi to talidad de altura to na l se asoc ia en gran medida a la per iodicidad de los est ímulos armó -
I, .s invcst igadore s, mientras que la segunda todavía es mat eria de discusión . nic os complejos, qu izá por nu estra capacidad para agrupar los diferentes com-
U nn Il'oría alte rna t iva a la teoría del lugar es la teoría temporal, que sugiere que ponentes espec trales presentes en la voz human a. La altura to na l origina da en
la alllira se relacion a con el patr ón temporal de los impulsos neurales origina- una sinu soid e result a imprec isa e inestable, como puede comprobar cualquier
dos en e l est ímulo. C omo los disparos de las células nerviosas tienden a ocurrir oyente ante una melodía realizada con tonos puros -habituales en las seña les
('1\ una parti cular fase de la forma de onda, intervien e nec esariamente la sensi- de espera de los contes tadores telefónicos.
Ad emás, cuand o los estímulos son simples y poseen solamente un a sola
¡ I'.. r "¡" lIIplo, ( j"rard l orisey tuvo que ralentar las masas sonoras en Pan iels, compuesta en
frecuencia destacada, la altu ra tona l se confunde en part e con la altu ra espec-
1')71, para "u.. s(· pudier a o ír la evolució n de cada co mponente (parcia l) aislado. tral. En cierto sentido, un a sin usoide contiene su propio tim bre , ya que al rea-
135
IH
Iizar un barrido ascen dente en frecuen cia del úni co armón ico presente (la si- lo largo del tiempo. Para la teoría del lugar ambas habilid ades están relacion a-
nusoidc misma) se excitan sucesivamente zonas adyace n tes en la memb ran a das, pues dependen del filtr ado en frecuencia de la cóclea. Para las teorías
hasilar. El resultado perceptu al es un glissando aco mpañado de un ca mbio temp orales la relación no es tan marcada.
co ntinuo del co lor ton al. Un ejemplo tradici on al de esta confusión entre al- El limen -mínima variación dete ct able en frecuencia- permite evaluar la
I m :1 rona ] y espec tra l lo brinda la escala de altura, ex presada en mels, que se discriminación en frecuenc ia y crece mon ótonamente con el valor de la fre-
muestra en la figura 2. cuenc ia del estímulo slnusoida l.' En las figuras 3 y 4 se pueden observar sus va-
Los valores de altura en mels, elaborados a partir de estím ulos sinusoidales, lores absolutos y relati vos. El valor relativ o del limen, expresado en relación con
d ifieren notablemente de los obten idos a partir de seña les armónicas complejas. frecuencia central Fe, tiende a ser men or a frecuen cias centrales y aumenta a
Para algunos auto res, la escala en mels describe simplemente el brillo tímbri co medid a que el estímulo se desplaza hacia los extremos del espectro audible. Por
de los son idos simples y no es aplicable a la altura to na l ta l como se la entien- ejemplo, el limen absoluto es aprox imadamente Lif = 2 Hz para una frecuencia
de en la práct ica musical. A prin cipi os de la década de 1970, Fred Attneave y central de 1.000 Hz y corresponde a un limen relativ o de 0,2%.
IZich ard O lson postularo n que para estudia r las escalas musicales se deben Es habi tu al realizar las ex per iencias de med ición del limen a part ir de dos
emplear las seña les complejas q ue se usan en la prácti ca musical concreta métod os: la variación en frecuencia de sin usoides aisladas y la var iació n en
(A rrneave y O lson , 1971) . Los experimentos que realizaron a part ir de este frecuenc ia de la señal mod ulador a en un dispositiv o de frecuencia modul ada
postu lado diero n resultados mejor cor relac ionados con un vínculo logar ítm ico ( FM DL).4 Los resultados de las experiencias de FMDL se utili zan, por eje mplo, en
cutre la frecuenc ia del estímulo y altura tonal que la escala de mels, al men os el cálcul o de los índices de inteligibil idad de la palabr a en siste mas de co mu-
dentro del rango de las frecuen cias fund amentales que se emplean en música. . nic ación. En el capítu lo IX desarrollaremos este tópico.
C ontrar iamente a lo predi ch o por la teoría del lugar, el DLF no varía con
Discriminación en frecuencia la frecuencia del mismo modo que la band a crítica y dism in uye al aumentar la
sonor idad del estímulo. A partir de estos dato s la mayor ía de los investigado-
( :OIll O ya señalamos, es ne cesar io dist inguir entre selectividad en frecuencia, res se incl inan por las teorías temporales al propon er sus model os, aunque los
q ue es la hab ilidad para d ist inguir com pone ntes en un son ido complejo, y dis- result ados experimentales sugieren que existe un mecani smo temp oral para las
crilll inación en frecuencia, la capaci dad para de tec ta r ca mbios de frecuencia a bajas frec uencias y un mec ani smo to no tópico para altas frecuencias.
Zwicker y Henning crearo n un model o mixto que produjo result ados con-
3000 .-----.--.----r-,---r--.----r---,----" sistent es con los valores medidos de DLF y de FMDL (Zwicker y Fastl , 1999). Es-
te modelo esta blece que el limen está det erminado por la información temp oral
2500 -l , ¡ ; , (sen sibilidad a la fase) para frecuen cias de hasta 5.000 H z -la sensibilidad a la
fase decrece al llegar a 2 kHz y desaparece a 5 kH z. Por encima de 5.000 Hz
2000 tanto el DLF y como el FMDL parecen respond er a una suerte de teoría del lugar.
(j)
ID
E
-; 1500 Variación de la altura tonal con la sonoridad
.3
<i:
1000 Stevens constató en 1935 , a partir de est ímulos sin usoida les, que la altura to-
nal varía con la sonoridad del estímulo (Steven s, S. S., 1935), En la figura 5
500 se muestran los resultados del experimento origina l.
1() 20 50 100 200 500 1000 2000 5000 10000 J Se la co noce co mo DLF por sus iniciales en inglés (difference limen in frequency) y, como
Frecuencia (Hz) tal, pertenece al con junt o de parám etros de discr imin ación agrupados como "m ín imas di-
feren cias perceptibles" (JND, de jusr noriceable difference).
Fi¡:ul'a Z. 1 ~ ( 'I : l(" i l 'J1 \ vn rrc alruru (m edid a en mels) y frec uenc ia 4 FMDL (difference limen in modulation frequency),
I \(\ 137
15 -T--~--~-~---,---~-~~
100,0 ..+ t+ ..·,·· ·+..· ·· !· ..· · ·..· + i - .._ + /c, ¡ j 8000!Hz
;
5600 Hz
50,0 -+ ++ + + ¡- ·_¡· ·..;······..·/~ ·¡ ..·.._ - _ · · ·,i.._·· j 10 ~ _ ; ¡..¡ ··················t
¡ ¡
1 .
~ 5
...................i
10,0 -+ ._... + ;... + + _ ¡ f ''.:j) ,.: ¡ ........... L + j ! !
~
"-
5,0 -+ ++ +· ·;;···..· ·.. j,.-<·.., ·· f · ·¡·· ·· _L _ .; j
~ .........! .....1000..~z.....
0 +'~~=--r---+---+--=;k1~:t!=l
1
<l ~
~
1,0 -.j + ¡ ;/'- ~ -5 -l + ¡ l'--"' ¡:~;;;:.
0,5
+.. . + Shower y Biddulph (1931)
· 1O ~ ¡ ¡ ¡ ·.. ¡ "k
100 Hz
-15 +----+--;.......--+---',--+---+----l
o 125 250 500 1000 200 0 4000 6000 8000 12000 40 50 60 70 80 90 100
Nivel son,?ro (to nes)
Fre cuencia (Hz)
FiJ.:lIfa 3. Limen abso luto en frecuencia para estímu los sin usoid ales. En la medici ón de Figura 5 . Variaci ón de la altu ra co n el ni vel son oro
Shower y Bíddulph se emplearon FMDL
Aunque los datos actuales son menos profundos que los medid os por Ste-
vens , el fenómeno ocurre y, para señ a les alejadas del centro del espec tro audi-
ble, la vari ac ión en a ltura tonal puede superar el 5%. Este fenóme no no tiene
aún exp licació n teór ica.
La variac ión de la altura tonal con la sonor idad desapar ece cuand o el es-
.~ 0,02
tímulo está cons tituido por señales armónicas complejas y no es, por lo tanto,
e LRF (DLF)
Q) apreciable en la mayoría de los son idos que se usan en música.
::>
o LRF FM 10 Hz(FMD LF)
~
.!l1
ro 0,01 ....
e
-o 2. PERCEPC iÓN DE LA ALTURA T ONAL EN ESTlMULO S A RMÓNI COS COMPLEJOS
.~ . 'o,
c.
fe?
c. 0,005 A pesar de la gran cantidad de estud ios realizados a partir de est ímulos sinu-
e
Q)
soidales, la altura to na l es un rasgo propio de los son idos tón icos der ivados de
.~
ro señales periódicas complejas, cuyo espectro es aprox imadamente arm ónico.
~
e El nacimiento del concepto de altura tonal está asociado al desarrollo his-
Q)
:5 0,002 tórico de los modelos exp licat ivos de la relac ión frecuencia-a ltura y del per-
250 500 1000 2000 4000 8000 feccionam iento de los métodos de medici ón en psicoac ústica, En el siglo XIX,
Frecue ncia central (Hz) Fechner llegó a la idea de q ue existe un a transformación logar ítmica del estí-
mulo físico a part ir del uso de métodos diferenciales para sus experimentos. A
Fi¡:U r:l 4. Limen rclutivo en frecuencia para estímu los sinusoida les. El FMDL se o btiene con
mediados del siglo XX, Stevens compa ró las alturas tonales provenientes de es-
un a ruod ulac i ón en frecu en cia
t ímulos sin usoida les y prop uso la esca la de mels . Sus resultados difie ren de los
de Fechner, en particu lar en los extremos de l registro. Más tarde , Sheppard
11H 139
sostuvo que amb os métodos resultan incorrectos a la hora de eva luar y da r res- similar al aná lisis clásico de Fourier, para determ inar las compo nentes sinusoi-
puesta a la cuestión de la alt ura tona l, y que se debe centrar el estudio en la dales de la seña l compleja. La segunda etapa consiste en el reco nocimien to de
tasa de repetición de Fourier de la señal acústica . los esquemas o pat ron es que det erminan la altura ton al conforme a la salida
Sin duda, hayal menos dos diferentes clases de altura tonal: la que deri- de la primer a et apa.
va de est ímulos diacrónicos o sucesivos y la que proviene de estímu los sincró- En el año 1962 Schouten realizó un a expe riencia que provocó la apari -
nicos o simultáneos. Aunque la esca la de mels no es una escala apropiada para ció n de gran ca ntidad de modelos teóric os que inten taron dar cuenta de los
usos musicales, captura sin emb argo algún aspecto importante relacionado resultados (Schouten ,] . F. er al. , 1962) . A partir de sinusoides modul adas en
con la altura tonal de los son idos diac rónicos. A lgunos datos estadísti cos, co - amplitud gene ró, en primer térm ino, seña les co n tres co mpone n tes de 1.800 ,
mo la mayor cantidad de intervalos cerrados en e l rango central de frecuen- 2.000 y 2.200 H z. La altura to na l percibid a co rrespo ndía, como era de espera r;
cias, están relacion ados con la escala de mels. También tiene algo que ver con a la de un a sinusoide de 200 H z, funda mental de Fouri er del trío de armón i-
el liril ]o de los son idos, tal como comentáramos antes. cos anteriores. Luego gene ró otra seña l co n compone ntes de 1.840, 2.040 y
La teor ía del lugar clásica tiene dificultades a la hora de describir la per- 2.240 Hz (qu e son los armó nicos 46, 51 y 56 de un a fundamen tal de 40 Hz).
cepción de seña les comp lejas ya que, por lo gene ral, la altura ton al no co- Los oyentes, sin emb argo, percibían un son ido co mpuesto cuya altura tona l
rrespo nd e a la posición de l máxim o de exc itació n en la membran a basilar. predo mina nte era similar a la de una sinusoide de 204 Hz, junto a dos alturas
U na demostr ación co ncl uyen te la provee el fenómeno de la fund amental re- secundarias que se podí an asocia r con sin usoides de 185 y 227 H z. Ni nguno
const ruida o fantasma, descrito por Schouten en 1940 com o e l "residuo" de de los sujetos que parti ciparon de la experiencia percibió la altura cor respon-
batido de un grupo de armó n icos co nsecut ivos.5 La perc epci ón de este resi- diente a la fundamental de Four ier de 40 H z.
duo no requi ere ac t ividad en el punto de la MB que responde a un a sin usoi- El mod elo propu esto por Wa lliser, en 1969, para ex plica r estos resultados
de de altura similar. Tiemp o desp ués, Lickl ider (9 56) dem ostr ó que la co nsta de dos pasos: 1) se ca lcula la altu ra det erm inada por la diferencia de
a ltura del residu o persiste aún cuando los ca na les en la MB co rrespo nd ientes frec uenc ia en tre parci ales vecinos (la tasa de repet ición de la env ol vente) y
a la fund amental de la serie armó n ica se en masca ran con ruid o de baja fre- 2) se busca el subarmón ico del compo ne nte de men or frecuen cia que mejor se
cuenc ia: los son idos de baja frecuenc ia qu e se perciben, asoc iados al resid uo ajuste a la frecu en cia encont rada en el paso primero ." Este modelo aplicado al
de bat ido, apa rece n a partir de los ca na les exc itados por los componentes de ex perimento de Sch outen da 200 H z en la primera operación (1) y 204, 4 H z
med ia y alta frecu en cia de la seña l. (1.840 Hz / 9) en la segunda operac ión (2). Esta últ ima es la frecuenc ia que
Varios mode los fueron propue stos par a explic ar la inc ide ncia de la fun - det er mina la altura to na l.
da mcnta l reco nstru ida en la percepción de la altura ton al. Una primera cla - En 1972 Terdhardt sugirió, inspi rado en el model o de Walliser, que la al-
se de model os, los llamados modelos de reconocimiento de patrones, asume qu e tura residual es un subarmón ico de un compone nt e dominante y discrimina-
la alt ura de un son ido com plejo se de riva de las seña les neurales corre spon - ble, sea o no el de menor frecuencia. C uando los parciales está n muy próx imos
clientes a los estí mulos primarios en la membran a basilar, por ejemplo las fre- en frecuen cia no pueden discriminarse y resulta imposible oír la altura resi-
cucnc ias de los parciales ind ivid ua les. La segunda clase de modelos sost iene dual. Estimó que los parciales dominantes caen en la región espectral com-
que la percepc ión de la altura tonal se asienta en la eva luació n de int erv a- prendida ent re 500 y 1.500 Hz.7
los te mpora les. Veam os cada un a con det alle . Unos años después, Terdh ardt sugirió que la capacidad necesar ia para ha-
ce r uso del mecani smo propuesto en su model o apare ce en una fase tem pran a
Modelos de reconocimie n to de patrones del aprendizaje, en la que esta mos expuestos sobre todo a los son idos del ha-
Los modelos de recon ocim iento de patrones dividen el proceso de percepción

de la altura ton al en dos etapas. La primera con sta de un aná lisis en frecuencia , 6 Walliser ( 1969) , en Moore (1995) .
7 Terh ardt llama subarmónicos al conjunto de las fundamenta les de Fourier cuyas series ar-
món icas inclu yen el compo nente del est ímulo en cuest ión . S us frecuencias co incide n con
r, La fundame nta l recons truida correspon de a l primer armó n ico en el desarrollo de Fourier los submúlt iplos de la frecuencia del componente. No se los deb e confund ir con el prod uc-
de una seña l periódica. Véase el A péndice I. to de una h ipot éti ca reson an cia inferior.
140 141
bla (Terdha rdt, E., 1974) . Afirm ó que apren de mos a asoc iar la frecuenc ia de a) 1 2 3
un compo ne nte del estímulo con los subarmón icos del mismo: la estimulación
de un solo armón ico produc e alturas probab les a las frecuen cias de los subar-
m ónicos, C uando un comp lejo armón ico se presenta, la mayor cantidad de
coincidencias a la frecuenci a de la funda mental determina la altura ton al de l
son ido. Para son idos no armónicos (como el de la expe riencia de Scho uten )
no hay coincidencias exactas y la sensació n de altura no resulta tan precisa.
b) l' 2' 3'
Q ueda claro que este modelo requiere del aná lisis de más de un parcial de la
seña l de ent rada.
Más o men os en la misma época , Goldstei n prop uso un modelo en el que
- V
la altura tona l de un son ido comp lejo es derivada por un procesador centra l
que recibe información sólo de la frecuenc ia de cada component e, soslayando
la información aportada por la amplitud y la fase (Goldste in, J. L., 1973 ). El
procesador presume que todos los est ímulos son periód icos y que todos sus es- Figura 6 . For mas de onda de dos seña les mod uladas en amplitud. En el primer caso, la
pectros comprenden armón icos sucesivos. Los errores de estimac ión de la fun- port ador a (2.000 Hz) es un múlti plo exacto de la modul adora (200 Hz) y el período entre
damental ocurren al estimar el número de armón ico apropiado . Ap licado al picos correspond ientes ( 1-1', 2, 2' ) es de 5 rns, En el segundo la frecuencia de la porta dora
experimento de Schouten, los armón icos de 204 Hz exp lican razon ablemente aumenta a 2.040 Hz y el int ervalo ent re picos es algo menor a 5 ms
bien los com ponentes de 1.836, 2.040 y 2.244, pero no dan cuenta con igual
exac titud las frecuencias de 185,5 Hz y de 226,7 Hz - cercanas a las de 185 y
227 Hz percib idas en el exper imento original. en la estructura fina de la onda en la membran a basilar (Sc houten registró la
Los modelos de recon ocimi ento de patrones depen den de la resolución seña l en el pun to de máxima oscilación en la MB) . Si hay más de un interva-
espectral de la memb ran a basilar, pero no implican necesar iamente el uso de lo temporal posible, la altura tonal corresponde a la cresta más prominente. Si
información tonotópica per se como una med ida de la frecuencia. se considera la representación de la seña l a nivel neural adquiere sign ificación
el intervalo temporal ent re los disparos nerviosos similares. Si el sistema '.'con-
Modelos temp oral es tase" simplemen te la cantidad de disparos por segundo, el modelo de Schou-
ten no podría funcionar.
Para dar cu enta de su célebr e experime nto, Sc houten prop uso un modelo
basado en el patrón temporal que desar rolla la onda del estímulo en la mem- Evidencia experimental rel evante a cada modelo
brana basilar. Segú n su model o, la altu ra tonal es det erminada por la perio-
dicid ad de los parciales involucrados en la determ inac ión del residuo. El peso La región de existencia de la alturaresidual
relati vo de cada parci al depende de su capacidad para atraer la ate nc ión del
oyente, ya sea por sono ridad o por co ntraste con est ímulos previos. De acuerdo con la teoría de recon ocim iento de pat ron es, la altura residual só-
La gran difere ncia ent re los modelos temporales y los modelos de recono- lo se puede perc ibir cuando al men os uno de los componentes sinusoida les del
cimiento de patrones es que estos últimos requieren que más de un parcia l sea estímulo puede ser oído en forma separada . Es decir, que necesita ser discrimi -
discriminable del co mplejo para que se perciba la altura del residuo, mientras nable. Si el estímulo posee únicamente armón icos muy altos no resoluble s la
que los primeros sólo piden que los parciales int eractúen, no que sean discri- altura residual no debería percibirse.
min ables (no es nece sario que sean perc ibidos separados). Ritsma enco nt ró que el carácter tonal de la altura residual existe ún ica-
En la figura 6 se muestran los resultados tem porales del experimento de mente dentro de una región de frecuencias limit ada, que llamó la región de
Scho uten, existencia (Ritsma, R., 1962). C uando el núm ero del armón ico es muy grande
La altura residual se deter mina por el int ervalo temporal ent re máximos (por enc ima de 20 O más) se oye un zumbido de altura indefinible. Tiempo
142 143
después, Plomp hall ó que la a ltura residu al puede percibirse para tasas de re- Evidencia del rol de mecani smos centrales de procesamiento
petición de hasta 1.400 Hz, dato co mpa tible - aunque no idéntico- co n la pro-
puesta de Ritsma (Plornp, R., 1967) . Houtsma y G old stein encontraron q ue es posibl e percibir alturas residuales
A co ntrapelo de las h ipótesis anteriores, Moore esta bleció qu e para armó - cuand o los armó n icos sucesiv os se presentan alte rna dos entre los dos oídos,
nicos de orde n elevado h ay un ran go de te rminado en el cua l se puede oír una por eje mplo los armónicos pa res al o ído dere ch o y los impares al izqu ierdo (es-
a ltura residu al aun cuando ninguno de los armón icos pueda oí rse po r sepa ra- tímul os d ic óticos): este hecho no puede ex plica rse co nforme a los modelos
do (Moore, B., 1995 ). Los mod elos de reconoci miento de pat rones no puede n que requ ieren la interacción de los co mpone ntes en la mem bran a basilar co -
dar cuen ta de este hech o. De tod os modos hay que apuntar que los soni dos ge- mo e l de Sc ho uten (Ho utsma y Goldste in, 1972) . Implican necesariam ente la
nerados ún icam ente a partir de armó n icos elevados no defin en tan claramen- ex iste ncia de un proceso neural ce ntra l. Los mod elos temporales pueden, sin
te la altura residua l como aque llos qu e co ntiene n armó n icos más bajos. embargo, explicar el recon ocimiento de la altura residu al a partir de secue n-
A unque la altura residu al se perc ibe mejor en presencia de gran cantidad cias de disparos neuronales en lugares de procesami ento superiores, más allá de
de compo ne n tes armón icos, Houtgast reportó qu e si el contex to lleva al suje- la membran a basilar, en los qu e se enc uentra la inform ación proveniente de los
ro a centrar la atenc ión sobre alturas de un ran go particular, aun un solo armó- dos o ídos .
nico es capaz de evocar la percepción de un a altu ra residual grave (Houtgast,
T., 1976) . C uando la información senso rial se vuelve ambigua, como ocurre en Alturas tonales basadas únicamente en información temporal
presen cia de ruido, esas alturas potenciales se perciben con más facilid ad .
En un experimen to secuenc ial de H all y Peters, en el qu e tres armó n icos Mill er y Taylor inv esti garon la sensac ión de altura to na l provocada po r seña -
sucesivos de 40 ms de dur ac ión se presentaban separa dos por 10 ms de silencio, les de ru ido blan co qu e se co necta n y desconec tan periódi cam ente, cuyo es-
los son idos se o ían disoci ados en cond icio nes de labor ator io (Hall y Pet ers, pectro asoc iado no posee máxim os n i m ínimos destacados (Miller y Taylor,
1981) . Pero en presencia de ruido la altura residual asoc iada, correspondiente 194 8) . Encont raro n qu e para un a frecu encia de co n mutac ión co mprendida
a los armónicos en presentac ión sinc rón ica, se vo lvía perceptible. Parece ser entre 100 y 2.000 Hz la mayorí a de los sujetos per cibi eron un a cie rta altura to-
que el ruido hab ilit a la aparición de un mecan ismo sintético de perce pción de nal. Llegaron incl uso a const rui r melod ías reconoc ibles.
la altura. Estas experiencias demu estr an la exis tenc ia de mecan ismos tem porales en
la percepción de la altu ra to nal, pues los modelos de recon oc im iento de pa-
El principio de dominación tro nes no puede n dar cue nt a de sus resultados.
De acue rdo co n la teoría de reconocimiento de pat rones, los armó nicos d is- Modelo de Brian Moore de l mecanismo para la percepción
c riminables de menor frec ue nc ia so n los más impo rta ntes para det erm inar la de la altura tonal en sonidos complejos
a ltura to nal. En ca mbio, para las teo rías te mpo rales los más imp o rtantes so n
los de mayor frecuenc ia. La a ltura residu al se h a observad o úni cam ente La evi de nc ia experime ntal revela qu e la percepción de un a altura to na l parti-
cuando los armó n icos est án presentes a frec ue nc ias por debajo de 5.0 00 Hz, cular no depe nde de la ac tiv idad locali zada en un lugar específico de la mem -
región qu e coincide co n la efectivida d del procesam iento de la información bran a basilar, o de la act ividad de un único grupo de neu ron as periféricas. Se
te mpo ral. sabe que la altura to na l induc ida por est ímulos complejos armó n icos es obte-
Ri tsma sugirió que los arm ónicos 3, 4 y 5 dominan la sensación de altura n ida, en gene ral, a partir de la interacció n de los armó n icos más allá de la fun -
to na l en la región de 100 a 400 H z (Ritsma, R., 1967) . Plomp coincidió en da mental de la serie. Por lo tanto , es posible pe rcibir alturas to na les sim ilares
parte con este postulado, pero consideró qu e la región no se define en cu anto provenientes de patrones espectrales diferentes, que co mpro meten distintos
al número de armó n ico, sino que es fun ción de la frecuencia absoluta (P lornp, esquemas en la act ividad basilar o neural. Para estí mulos peri ódicos que con -
R., 1967) . Para altu ras tonales agudas son importantes los prim eros armó n i- tiene n un gran rango espec t ral los primeros arm ónicos, hasta el quinto , tien-
cos , mientras qu e para alturas tonales graves cobran importancia los armón i- de n a dom inar el perc ep to aud itivo. Dichos armón icos cae n en un a zona en la
cos por enc ima del qu into. que es posib le discriminarlos - reso lverlos- por separado y el proceso puede ex -
144 145
plicarse sobre la base de los modelos de reconocimiento de patrones. Sin ern- ci ón corresponde a la que se enc uentra en la entrada. A modo de ejemplo, en
hargo, se puede percibir un a altura residual aun cuando los componentes son la figura 8 se aprecia la salida de diferentes filtros auditi vos ante un tren de im-
demasiado altos co mo para ser discriminados por separado. Este hecho no pue- pulsos de 200 pulsos por segundo.
de ser explicado po r los modelos de reconocimiento de patron es, pero sí por La segunda etapa consiste en la transducción de la salida de los filtros an-
los modelos tem porales, ter iores en impulsos nerviosos.
Parece que n inguna de las teorías expuestas hasta aquí pucde dar cuenta La tercera etapa defi ne un disposit ivo ca paz de ana lizar los interva los en-
por sí sola del conjunto de datos experimenta les. Brian Moore propuso un mo- tre máximos a cada frecuen cia central Fe (véase la figura 8 ).
delo cualita tivo que combina elementos tanto de la teoría de recon ocimiento En la cuarta etapa se comp aran los int ervalos temporales presentes en los
de pat ron es como de las teorías temporales (Moore, B., 1997) . Otros modelos, diferentes canales y se buscan los patrones comunes a varios de ellos. Este cir-
co mo los de Van N oordem (1982) , Patterson (1987) y Mcddis y Hcwitt (1991) cuito ta mb ién debe int egrar la inform ación a través del tiemp o. En general, el
ta mb i én comb ina n aspectos de las dos teo rías, aunque los algoritmos rnatern á- intervalo temp oral más frecuente corre spond e a la compo ne nte fund amental.
ricos difieran signi ficat ivamente en cada caso. El modelo de Moore (esquema- En la quinta etapa los va lores de los intervalos temp orales más prom inen-
rizado en la figura 7) consta de cinco etapas. tes llegan a un mecan ismo de decis ión q ue seleccio na un o de ellos. Este cir-
La prim era et apa está definid a por los filtros audit ivos en la membran a ba-
silar. Responden a los armón icos que son aproximada mente sinusoida les en su
[orrna y que pueden resolverse. La respuesta de los filtro s a los armón icos más Hz
altos co mbina varios de ellos por band a crít ica, y no pueden discr iminarse. 6400 1-.. -..
~ ~
.--
Aunq ue la form a de onda de salida de la etapa es co mpleja, la tasa de repet í- 5080
4032 ~" ~"
Entrada
3200 ~
acústica
2540
lA,
rv v
"
'v
,
banco de 2016
filtros
pasabanda 1600
1270
Transducci6n 1008
nerviosa
800
Análisis de los 635
intervalos
entre picos 504
400
Combinaci6n de
intervalos con 317
frecuencias centrales
252
200
Selecci6n de los
intervalos más 159
prominentes
Tiempo
Altura Figura 8. Simu lación de las respuestas de la MB ante un tren de impulsos de 200 pps.
tonal
Los nú meros de la izquierda indican cada una de las frecue ncias centra les FC,
Figura 7. Modelo esquemático para la percepción de la altura tona l de Brian Moore que correspon den a las formas de onda de salida de cada filtro
146 147
cuita incorpora la memori a y la atención , y puede ser influido tanto por los es- 3. L A A LTURA TONAL COMO UN MEDIO MO RFOFÓRICO
tímulos inmed iat amente precedentes como por el contexto y las 'condiciones
genera les de presentación. La altura to na l final (señal de salida del model o) A principi os de la década de 1970 A ttneave y Ol son estableci eron un nu evo
cor responde al int erv alo seleccio nado. criterio que permite clasificar de manera diferente los parámetros del son ido .
El model o de Moore explica satisfactor iamen te gran ca n tidad de eviden - Aunque existe n otros atributos para la organ izac ión de los son idos -com o el
cia expe rimental. A cont inuac ión mencion aremos algun a de las situac iones timbre, la sono ridad y la local ización espacial- sólo la altu ra tonal y el tiem-
que logra resolver. po const ituyen medi os capaces de portar formas, o medios morfofóricos8 (A tt -
• C uando la altura residual se obtie ne a partir de unos pocos arm ón icos ele- ne ave y O lson , 1971) . De acuerdo con los auto res, e l espacio visual es un
vados (por ejemplo, el 12, 13 Y 14) que no pueden resolverse por separado, resul- medi o morfofórico: un tri án gulo se puede trasladar --o rota r- y sigue siendo el
ta débil y ambigua. Este hecho explica por qué los primeros armón icos tiend en a mismo tri án gulo , su identid ad se mantiene bajo ciertas ope rac iones de tran s-
dominar en la percepción de la altura. La altura asociada a los armón icos supe- formac ión. De man era similar las estruct uras generadas a partir de la altura
riores se hace más clara si aumenta el número de armónicos presentes. to na l, tales como melod ías o funcion es armónicas , pueden ser transportadas
• Un pequeño grupo de armón icos muy altos no genera la sensac ión de al- hacia arriba o hacia aba jo y aún ser reconocid as co mo las mismas: la infor-
tura to na l, hech o que se puede exp licar en términos del limit ado ran go de in- mación estruc tu ral que poseen result a invari ante frent e a los tran sportes en
te rvalos temp orales que pueden ser ana lizados por el grupo de neuron as de cada altura ton al." El tiemp o tambi én es un medio morfofóric o poderoso. Pero
frecuenc ia cen tra l. Para armónicos por enc ima del 15, el int ervalo te mpora l co- otras di mens iones ut ilizadas en música (como la sonoridad, el ti mbre y la lo-
rrespond iente a la fund amental cae fuera del ran go que puede ana lizar el cana l ca lización espacial) no lo son . Por ejemplo, no se logra el mismo grado de
que respond e a esos armó n icos (este dat o es muy import ante en el model o de preserv ación de la informac ión estructura l ac tuando sobre la sono ridad. En el
Moore ). siglo xx va rias co rrient es musicales inten taron co mpone r piezas a partir de
• C uan do los armó n icos supera n los 5 kH z la estructu ra fina de la form a esca las de sonor idad, de ataques o de otros par ámetros sonoros , pero fracasa-
de onda a la salida del filtro de la primera etapa no se preserva en el pat rón ron en el intento de equi parar su ca pacidad est ruct ural a la de la altura to na l
te mpora l de los impulsos nerviosos. o e l tiemp o. !O
• La altura de est ímulos que no presentan picos espectra les, co mo el rui- En la misma línea, el psicólogo cogni tivi sta Michael Kubovy distinguió
do blan co interrump ido per iód icamen te , se percib e en el model o a través de entre atributos dis¡Jensables e indispensables (Kubovy, M., 1981) . En visión la I
los int erv alos temp orales present es en los ca na les de altas frecuencias centra- posición espac ial es un at ributo ind ispensa ble, mientras que el co lor es dispen-
les FC, que posee n mayores anc hos de banda y por lo tanto mayor definici ón sable, hecho relacion ado con su incapacid ad an alítica frente a los co lores: al
te mpora l (preserv an la estr uctura temporal fina de la forma de onda). La altu- mezclar azul y amarillo vemos un nuev o co lor, el verde, pero no sus co rnpo- I
ra ton al de estos estímulos es débil. ne n tes ini ciales. En audición la altura to na l es un atributo ind ispensable,
• Si se incorpora un mecani smo co mparado r central de la informac ión mientras que la local ización espacial no lo es. La "ind ispensabilid ad" del espa- I
proveniente de ambos oídos luego de la tercera eta pa, se pueden interpretar cio en visión y de la altura tonal en audición es para lela al hecho que ambos
los fen óm en os dic óticos, son atributos correspondientes a medi os morfofóric os. Ent on ces el parámetro
El modelo se parece al de Terhardt en el tratami ento de los primeros armó- aná logo del espac io visual no es el espac io auditivo, sino la altu ra to na l. En la
n icos, pero este últim o no puede explicar la altura producida por los armón icos figura 9 se grafican las diferencias ent re atributos dispensable s e indispen sable s
superiores no discriminables. En el modelo de Moore los son idos de combina - en visión y en la figura 10 en audi ción.
ción juegan un rol en la determin ación de la altu ra. El más import ante (2fl - f2)
se percibe aun a bajas sonor idades y puede actuar como un armón ico inferior 8 Morphophoric medium en inglés.
m ás fácil de discriminar que algunos compone ntes del espectro de entrada. 9 El eje mplo clásico co nsiste en tran sportar un fragmenro musical un cieno int ervalo, por
ejemplo una quinta justa ascende nte .
El model o de Moore se utili za act ualmente en el diseño de tradu ct ores de
la Pode mos c itar aquí la pieza para piano Modes de valeurs et d'inrensirés, compuesta en 1949
altura to na l para sistemas codific ados a número ún ico, por ejemplo para dise- por O livier Messiaen (1908 -1992) , que emplea por primera vez la técni ca serial no sola-
ñar conversores de altura tona l desde una guita rra al siste ma MlD!. mente para las alturas sino tamb ién para las durac iones, los ata ques y las intens idades .
148 149
La 1 La 2 La 3 La 4 La 5 La 6
En la perce pción visual el color es dispens able , la posición no
Figu ra 9. A tributos d ispensables e indispensab les en visión 55 110 2 20 440 880 1.760
11 12 13 14 15 16
11 11x2 12x2 13x2 14x2 15x2
Frecuencia (Hz)
Mi)) Do+Mi ~ Re)) Re))
Figura 11. Representación logar ítmi ca un idi mension al de la altu ra to na l
.&. .&. &.&.
Sin emba rgo, una esca la logarítm ica un idim ension al no refleja el he ch o
de que ciertos int ervalos, co mo las oc tavas y las quintas justas, poseen carac-
terísticas espec iales. Ciertos estudios etno musicológicos hasta pret enden de-
mostrar que dichos intervalos son culturalmente un iversales, pero el deb ate
sobre el punto sigue lejos de alca nzar una conclusión def ín ítíva.l-
Escucha dos Escucha dos Escucha una A med iados del siglo XIX Drob isch co nci bió un a representación tr idi-
notas: Do y Mi notas: Do y Mi nota: Re
mension al en form a de héli ce que distingue en tre la altura unidimensional
En la percepc ión auditiva la altura es indispe nsable, (a la que llamó pitch height) y la altura to na l (pitch croma según Drobi sch l.U
la posición es dispensable
En la figura 12 se puede aprec iar la versión de Shepard de la hélic e de alturas
Figu ra 10. Atributos d ispe nsab les e ind ispensab les en audic ión to na les.
En el esquema los son idos de cada familia ton al (por ejempl o tod os los la
a distancia de octava ent re sí) se hallan enco lumna dos: el La5 queda más cer-
ca del La4 que del Mi5, disposición que cor respo nde a la proximid ad según la
4. R EPRESENTA CIÓN GRÁFICA DE LA ALTURA TON A L consona ncia musical, al menos en la música to na l tradici on al.
Si se desea suprimir la altura ton al (croma) sin eliminar la altura unidi-
La represe ntación gráfica trad icion al de la alt ura ton al emplea una esca la lo- mensional (height) lo más senci llo es reempl azar las seña les armóni cas origina -
garítmica un idimens iona l de frecuencias que preserva los intervalos musicales les por ruido de banda angosta . En o tras palabras, se remu even los elem en tos
bajo diferentes tran sformacione s, pero no alcanza a describ ir las co mplejas re- que aporta n to nicidad y se dejan solament e los que cor responden a la altura
laciones que operan entre los intervalos musicales. En la figura 11 se puede ve- espectral del son ido . En ese caso la hélic e se redu ce a un solo eje vertical, el
rificar que las octavas ocupan segmentos de la misma lon gitud a lo largo del que defin e la altura unid imension al.
espectro audible. Lo mismo ocurre con el resto de los in terv alos.!'
. , 12 Como co ntraejem p lo, Unernoto co me nta q ue no existe un a palabra en el id iom a jap o-
11 Estr icrame n te , la represe ntación tradicional no descr ibe alturas ton ales sino las fr~cuen nés para design ar el interva lo de octava (Unernoro, T., 1989) .
c ias de los est ímulos asociados. l3 Dro bisch (1855 ), en Cook, P. (1999) .
150 151
LaS
La4 ~;t==========~MiS
Parcial
Do #
La
Do
L Desplazamiento
Ancho de banda
Sol# Fa#
Sol
Frecuencia (escala logarítmica)
Figura 12. Hélice de alturas rona les
Figu ra 13. Se ña l de Sheppard
En cambi o, si se quiere suprimir la altura unidimension al (height) y dejar

sólo la altu ra tonal (croma) , es necesario generar una señ al que obligue a la hé-
lice a colapsar en un círcul o co mo el dibu jado en la base de la figura 12. Ro-
ger She ppard publicó en 1964 un trabajo en el que descr ibe la construcc ión
de seña les capaces de suspender la percepción de la altura unidimension al, en
las que la altura ton al parece ir hacia el agudo (o el grave ) indefinid amente
(She ppard, R. 1964) .14
Son idos de Sheppard
Los sonidos de Sh eppard co nsiste n en una gran canti dad de compo ne ntes si-
nusoidales a distan cia de octava que abarcan por completo el ran go de fre-
cuencias audibles, modul ados en amplitud por un a envo lvente espec tral en
forma de campan a que tiend e a cero para altas y bajas frecuenci as (Risset , ].
~ Croma ~
c., 1978b) . La figura 13 muestr a el espectro de una seña l de Sheppard.
A medid a que transcurre el tiempo, la frecuencia de cada parcial se va co- Figura 14 . Toroide que permite representa r las relacion es de oc tava y de qu ima
rriend o h acia arriba, en un a suerte de glissando en octavas paralelas, mientras
que la amplitud es controlada por la envolvent e en forma de camp an a. Nue-
vos parciales ingresan en la parte grave del espectro a medid a que superan la tes, pero se percibe un incremento con tin uo de la altu ra ton al. Los son idos
barrera de l umbral de audibilidad, a la vez que los más agudos se reduce n has- que desciend en indefin idament e se obtienen de manera similar, desplazando
ta desaparecer. La cantidad de parciales y la energía de la seña l son constan - hacia abajo la frecuen cia de los comp on entes.
Una ilusión equiva lente a la de los son idos de Sh eppard se puede obtener
H Se puede hallar un par alelo visual en el grabado "Asce nd iendo y descendiend o'; de M. con el otro medio morfofórico conocido, el tiempo. Ligeti y Risset emplearo n
C. Escher, procesos de este tipo en varias de sus co mposiciones.
15 2 153
Percepción de intervalos musicales
Noam C ho msky distinguió entre competence (h abilidad para reconocer las re-
glas qu e gobiernan la lengua) y performance (habilida d para realizar un acto de
habla) en su teor ía de la gramá tica y la sintaxis. Aunque tengam os almacena-
das internamente las reglas de la len gua, deb ido a nuestr as limi taciones para
procesar y emit ir sentenc ias co mp lejas, much as veces no las aplica mos co rrec -
tame n te al oí r o produ cir frases completas. Del m ismo mod o, las reglas qu e go-
bie rnan las rel aciones interv álicas en mú sic a de be n se r co noc idas e
intern alizadas (es decir, "natural izadas") por los oyentes . Veam os algunos ca -
sos propi os de la música occide ntal tradicional, en la que dich as relaciones ya
han sido largam ente naturalizadas.
Dos sonidos cu yos est ímulos está n sepa rados por un intervalo de octa va
Figura 15. Hél ice toroida l que permite representar la altura to na l, la altura (heighr)
y las relac ione s de octava y de qu inta suena n , en algún sentido, de manera similar. En muchas culturas se les den o-
mina con el m ismo nombre dentro de la esca la musical (son, por ejemplo, los
son idos de la familia del Do ). Desde el pu nto de vista del estí mulo, la frec uen-
A unque la hélice de She ppa rd de la figura 12 preserva la relac ión de oc- cia de la segunda seña l se ajusta a un valor cerca no al doble de la frecuencia
tava, no registr a la importancia que posee n los interv alos de q uin ta en la mú- de la frecue nc ia de la prim era señal. En otros té rm inos , si la relación de fre-
sica ton al tradicion al. El toroid e de la figura 14 sí lo hace, pero pie rde la cuenc ias fund amentales es aproximadamente fl = 2 f1 se pe rcibe un inter valo
capacidad de grafica r la altura unid imensional (height). de oc tava. O tros interv alos puede n definirse tambi én a part ir de relac iones si-
Para repr esentar al mismo tiempo la altura unidimensional (height), la al- milares. A sí, un a quin ta justa corresponde a la relación fz = (3/2) i, y un a cuar-
tura tona l (croma) y las relacio nes especia les de oc tava y quinta es necesario ta justa a fz = (4/3) f l' Las relaciones son solamente aprox imadas pues la
un espacio de ci nco dimensiones. La hélice toro idal resultante sería similar a defin ició n de los interva los dep end e de gran ca ntidad de factor es, la mayor ía
la rep resentada en la figura 15. culturales, alguno de los cu ales verem os más adela nte.
S i ade más deseamos representar los interva los de ter cera mayor y tercera Las relac ion es an te riores , sin embargo , sólo se perciben claram ente
men or, impr escind ibles a la hora de definir la mod al idad de un aco rde, la fi- cua ndo las dos frecu encias se ubica n por deb ajo de 5.000 H z. Exist e gran
gura se co mplica hasta el punto de resultar impos ible de dibuj ar: So lame nte se ca ntida d de ev ide nc ia ex pe rime ntal qu e indica qu e los estímulos cuyas fre-
puede n -plan tea r las ec uaci ones algebraicas que co rrespo nda n a cad a mod elo. cue nc ias fund am entales (las que decid en la peri odicidad de la seña l comple-
ja ) supe ran el va lor de 5.000 H z no de finen la altu ra to na l. Por ejemplo, un a
secue nc ia de son idos no produce la sensación de mel odía por enci ma de los
5. ALT URA TONAL E INTERVA LOS MU SICA LES 5 kH z. Y los sujetos co n oído abso luto fracasan repetidam ente a altas frecuen-
cias . Estos dato s son consis te ntes co n el hech o ya visto de qu e a alrededor de
Un desarrollo qu e intente ex pone r la complej idad de la percepci ón de los in - los 5 kH z cambian los mecani smos de percepción de la altura: un mecani smo
rcrva los y de la generació n de escalas musicales requiere por lo menos un li- temporal ac túa a bajas frecue nc ias y un mecanismo to no tó pico lo hace a altas
hro completo.'> Aquí intentaremos presentar los tópicos más rele vantes sin frec uencias. Tanto el sen t ido de la altura to na l com o la sensibilidad a la fase
adentra rno s en el est ud io complet o de los pormenores propi os de la práctica se pierden más allá de los 5.000 H z.
mu sical. Pued e ser interesante rep asar el rango de frec uenc ias funda me n ta les qu e
aba rca el tecl ad o de un pia no mod erno: la frecu en cia más alt a no llega a
1I Este libro , en este moment o simple ex presión de deseo , tendr ía nat uralm ente un lugar en 4.200 Hz (véase la figura 16).
la co lecc i ón Música y Ci encia.
154 155
Frecuencia (Hz)
Interva los sincró nicos y diacrón icos
I
1 Los dos mecani smos que actúan en la percepción primaria de la altura, el ton o-
1 I
3729
4186
3951
008
Si7 tópico y el temp oral, se manifiesta n de man era diferente si se presenta n inte r-
3322 3530 La 7 valos sucesivos o diacrónicos o intervalos simultáneos o sincrónicos. C uando los
2960 3136 Sol 7
2794 Fa 7 est ímu los son diacrónicos, la sucesió n de inte rva los posee carácter melód ico.
2637 Mi7 La evaluació n de la diferen cia de altura ent re est ímulos --el in tervalo diacrón i-
2489
2218
- 2349
2039
1976
Re 7
00 7
Si 6
co- puede derivar únic amente de la evaluación de la distancia que existe ent re
puntos de vibrac ión en la mem brana basilar. Si los est ímulos son periódicos,
1865
1661
1480
= 1760
1568
La 6
Sol 6 con espectro armónico , se eva lúa la distan cia ent re los dos pat ron es de exc ita-
1397 Fa 6 ció n. En estos casos el mecan ismo ton ot ópico es el único que puede ac tivarse
1244 ,5 13 18,5 Mi 6
1108,7 1174,7 Re6 porque, al no actua r los dos estímulos al mismo tiempo, no es posible el aná li-
1046 ,5 00 6 sis tem poral simultáneo ent re ambos. En la figura 17 se aprecia un gráfico tem-
932 ,3
830,6 - 937,8
880
Si 5
La 5
poral de las seña les que indu cen un intervalo diacrón ico de quinta justa.
Juzgamos los intervalos sucesivos casi de man era táct il, comp arando el
740
- 784
698 ,5
Sol 5
Fa 5
622 ,3
554 ,4
- 659 ,3
587 ,3
Mi5
Re5
punto de máxim a exc itació n del segundo estí mulo con el rec uerdo del punto
de máx ima exci tac ión de prim ero. En este caso , el rol de la memor ia de co rto
523,3 0 05 tér mino resulta det erm inant e. Si ade más ac túa la memoria de largo térm ino,
493 ,9 Si 4
466, 2
415 ,3
370 - 440
392
349 ,2
La 4
Sol 4
Fa 4
hecho que ocurre en alrededor del 1% de la pobl ació n, se dice que el oye nte
posee oído absoluto . El oídoabsoluto es la habilidad de reco nocer la altu ra to-
na l de un sonido sin compararla con una referen cia ce rcana en el tiemp o.
3 11,1
277 ,2
- 329,6
293,7
Mi4
Re4 En cam bio, cuand o los estí mulos se presentan de man era sincrón ica, la
26 1,6 00 4
246,9 Si 3 manife stación simultá nea de dos o más son idos posee ca rácte r armó n ico. 16 La
233,1
207 ,7
185 - 220
196
174,6
La 3
Sol 3
Fa 3
eva luac ión de la diferencia de altu ra entre estímu los --el in te rvalo sinc rón ico-
155 ,6 164,8 Mi 3
138,6
- 146 ,8
130,8
Re 3
00 3
La Mi
116,5
103,8
92,5
- 123 ,5
110
98
Si2
La 2
Sol 2
iD
~
"O
ro
"O
87,5 ' iij
Fa 2 c:
77,8 82,4 Mi2 Ql
E
69 ,3
- 73,4
65 ,4
61,7
Re 2
00 2
Si 1
58,3 55 La 1 nempo (ms)
51 ,9
46 ,3 49 Sol 1
~
43 ,7 Fa 1 Figura 17 . S~ña les asociadas a un interva lo diac rónico de quinta justa
38,9
34,7 - 41,2
36,7
32,7
Mil
Re 1
Do 1
29, 1 30,9 SiO 16 El término "ar món ico" se emp lea aquí en un sentido amplio y sign ifica ocurrenc ia simul-
27,5 La O tánea. De manera similar, en el párrafo anterior se habla de carácter melód ico para desc ri-
bir la ocurrencia sucesiva. Se pod ría trazar un correl ato con las estructuras verticales y
FiJ:ura 16. RanJ:ll de frccucnc ias fundamenta les de un pian o modern o horizontales en una partitu ra o en un sonograma.
15CJ 157
L_lj il-- jJjJ~ _¡_~LLLh
! !!
-[ ,-,-,-C
i
-;_.-~ lh-- _.--;- -+r-J_i

!
l---t~! ~1 __.~_
- ;- , 1-·,
-.-~ -4 -1 -i~
_J+-
--¡-_!+--±J --r-
I
l ' ~
1I
-- - i
-:~ _! --- _L-.. -' I-~-U--._- __

: -l-i -1-- --_~I
h
iD
" _.- -,-I L ·;
----t--
~ I -t-
t 1-= ~-j =r~l- ~~
I ;
"O - ¡ -; ~ -- - - - ~-E
ro
"O
.¡¡; -!~!- - -;- -0--.
!
~-,
I I
e
Q)
E I I
- 1-- ,1
1- -·--1- :--;¡ l-I --
Figu ra 19 . Espectro de Fou rier asociado a un intervalo sincr óni co de qui nt a justa
Tiempo (ms)
Figura 18 . Seña les asociadas a un int ervalo sinc rón ico de quinta justa
puede derivar en este caso tanto de l mecani smo tonot ópico anterior co rno de l
aná lisis temporal simultáneo de las dos seña les. En este último caso la apari-
Figura 20. Espectro de Fou rier asociado a un intervalo sincrónico de qu int a justa desafinado
ción de batidos y son idos diferen ciales prevalece co rno cr iterio de consonan-
cia y correcta afinaci ón, al menos en la música to nal occidental.
Torne mos co rno eje mp lo un inter valo sincró nic o de qu inta justa. Ca- 1.320 Hz) y el segundo armón ico de Mi5 (otro Mi, pero esta vez de f 2 = 2 x
da vez que la se ñal más grave, un La4 de f = 440 H z co mp leta dos ci clos la 662 Hz = 1.324 Hz) con un período de batido de fb, = 4 Hz. El siguiente oc u-
más aguda , un M i5 de I> 660 H z completa 3, tal co mo se aprec ia en la fi - rre entre el sexto armónico de La4 (f6 = 2.640 Hz) y el cuarto armón ico de
gura 18. MiS (f4 = 2.648 Hz). A hora el período de batido es fb2 = 8 Hz. La secue ncia
La exacta coi nc idencia de fase cada dos ciclos del La4 -o tres del Mi5- continúa hasta, teóricamen te, alcanzar el límit e del rango audib le.
impide la apa rición de bat idos y diferenciales. El gráfico espect ral del int erva- En la música occi de nta l tradicion al, conso na nc ia armón ica y correcta afi-
lo anterior es el que se muestra en la figura 19. nación de acor des significa n mín imo batido. Por este mot ivo, para eva luar los
¿Q ué ocurre si desafin amos un poco esta quinta justa, por ejemplo, au- inte rva los sincrónicos preva lecen los crite rios temp orales -que aseguran el
mentand o la frecuencia del MiS apenas 2 Hz para llevarlo a 662 Hz? Ap are- control de los posibles batidos- sobre los criterios to no tó picos. Hay que acla-
cen necesariamente bat idos de primer orden que crecen en frecuencia a rar que en la música de much as culturas el bat ido ent re son idos no es consi-
medida que aumenta el orde n de los armón icos invo lucrados. dera do un elemento negativo o dison ante, sino que se lo int egra como part e
El batido más grave se da ent re el tercer armó n ico de La4 (un Mi6 de f 3 = de la textu ra del son ido.
158 159
17'. 17'. 17'. del marco cultural de referencia. Dichos intentos de universalizar el concepto
~
o de consonancia son rebatidos al confrontarlos con la gran cant idad de lengua-
- e :;t: e jes musicales no occidentales en los cuales no se cumplen . Inclu so dentro del
área de la música occidental misma se crearon, a partir de fines del siglo XIX y
o principios del xx, sistemas que redefinen complet amente la noción tradici on al
Figura 21. Oc tav a diacrón ica ejec utada con un violín de cons onanc ía.F Un estudi o exhaustivo del tema necesariamente debería
contemplar el desarrollo contextua] e h istórico de cada lenguaje musical parti-
cular. Dicho estudio no podrá soslayar el aná lisis de las comb inacione s de altu-
17'. ~
~
ras tonales, de sus camp os de acción y de las jerarquías relativas que ocupan en
O
los diferentes sistemas musica les. En otras palabras, el estud io que imagina mos
e e tendría que enc arar ampli amente un análisis escalíst ico completo de cad a sis-
o tema musical.
Figura 22. Oc ta va sincróni ca ejecutada con un violín
Un ejemplo práctico para demostrar la diferencia ent re un a octava dia -

crón ica y otra sinc rón ica se puede realizar con un instrumento de arco, por
ejemplo un violín. Primero se toc a la tercera cuerda al aire (Re4), se hac e un
pequeño silencio y se toca en segunda cuerda la octav a (ReS) del sonido an-
terior, buscand o la mejor afina ció n posible. A continuación se co mpara esta
últi ma not a con el segundo armó nico de la tercera cuerd a (ReS): el ReS en se-
gun da cuerd a es casi siempre más agudo que el armó n ico. '
¿Qué ocurre? La octa va diacrónica fue afina da de ac uerdo con la memo-
ria aud it iva y no pudo controlarse por batid o. Por lo general se la afina un po-
co más grande que la que corresponde a la relación 2: 1. A su vez, la frecuencia
del segundo armó n ico, si la cuerda es de buena ca lidad, es casi exact amente el
doble de la frecuencia de la cuerd a a aire.
En cambio, si la octava an terior se int erpreta sinc rón icamente (un bicorde)
es posible llevar el batid o entre ambos son idos a cero. En este caso la altura del
ReS en segunda cuerda y el armón ico en tercera son de la misma altura ton al.
Consonancia y disonancia
Los conceptos de consonancia y disonancia son, obviamente, culturales y de-

pend en del con texto h istórico, del género, del estilo y ha sta de las característi -
cas particulares del compositor de cada pieza de música. En muchos textos se
leen frases del tipo: "cuando los son idos musicales relacion ados por una razón
simple suen an simultá nea ment e el son ido es agradable" o "la dison anci a puede
ser expli cada en part e por el batid o entre comp onentes en la membrana basi- 17 Qu e alguno de los sistemas experimenta les que aparecie ron en el siglo xx hayan sido acu-
lar", que pretenden establec er causas perceptuales primarias e independ ientes sados de "axiomáticos", y hasta de "te cnocrát icos", no invalid a la afirmación ant erior.
160 161
Capítulo VI
Timbre
Ap rend imos en nu estra eta pa esco lar q ue el son ido t iene por atr ibutos la altu-
ra, la int ensidad , la dura ción y el timbre. El tim bre se refería a c ierta cualidad
del son ido que nos permite recon ocer los instrumentos de una orquesta o dis-
tinguir entre son idos diferentes. Pero, a diferencia de la altura, de la inten si-
dad y de la dur ación , el timb re no es un atr ibuto perceptual de descripci ón
senc illa.
Ent endemos la perce pció n co mo un proceso en el que usamos la inform a-
ció n prov ista por nu estros sent idos para arma r representacio nes mentales de l
mund o que nos rodea. U na parte import ante en esta tarea es deci dir q ué par-
tes de la est imulación sensorial co rresponde n a l mismo objeto o eve nto físico,
y cuáles no. La necesidad biológica del timbre tam bién puede ser co mprend i-
da desde una perspect iva evo lut iva, a partir de la ada ptac ión del sent ido del
oído para proporci on ar inform ación sobre la base de las vibracion es mecáni-
cas del aire.
Bregman opina que el timbre surgió de la necesidad de dist inguir ent re dos
objetos auditivos cuando éstos no pueden identificarse a partir de parámet ros
simples (Bregrnan , A., 1994) . Si un rasgo audit ivo se mantiene dentro de lími-
tes un idimensiona les, como ocurre con la altura to na l, podemos ope rar hasta
una cantidad máxima de cinco o seis ele mentos indiv idua les a la vez. Para ma-
neja r simultá nea mente una mayor cant idad de unidades de informac ión se re-
quieren más dimension es y el tim bre apo rta ría esas dimensiones adic iona les.
Según Shepard , el sistema percep tual de los ani males nace co n la incor-
poración senso rial de las regularidades propi as del ambiente en el cual han
evolucionado. ' Por ejemplo, somos muy sensibles a ciertos aspectos del soni -
do que no se modifican dura nte el recorrido entre la fuente y el oyente, como
la altura tonal. Por e l contrario, somos práct icamente insensib les a las carac-
ter ísticas que varían de man era aleator ia co n el contexto, como la fase y la in-
I Shepard (1981), citado en McAdams y Bigand (l 994).
163
tensidad relativa de los componentes en una señal compleja. De acuerdo con acústica . Hasta se podría dudar de su competencia en tanto definición . Impli-
esta concepción , sostenida por gran cantidad de investigadores, los parámetros ca, por ejemplo, que los sonidos a los que se le puede asignar timbre poseen al-
"fuertes" que determinan el timbre de los sonid os est ar ían relacion ados con las tura tonal; luego, los sonidos no tónicos -com o los de un platillo o de un
ca racteríst icas de la seña l acúst ica que resisten la distorsión propi a del med io tambor-, ¡no poseen timbre! Sól o nos qued an dos posibil idades: desistim os de
que nos rodea. estudia r más de la mitad de los son idos que nos interesan , o buscamos otra de-
fin ición . C omo veremos más adela nte, este enunciado está profun damente in-
fluido por el model o acústico clásico de timbre.
l . DEFIN ICIONES DE TIMBRE Además, ¿q ué sign ifica "dos son idos similares"? ¿Alcanza esta semejanza a
la ubic ación espacial, o a la tasa de repetición si existier a ? ¿Difiere el timbre
El primer probl ema que aparece al estudiar el concepto de timbre es la vague- de un registro estereofónico de un a trompet a si uno intercambi a los can ales
dad y ambigüedad del término. Rep asemos las dos definicione s más utili zadas. derech o e izquierdo ? ¿Es dist into el timbre de dos notas de una flaut a del t im-
1. Una man era clásica de defin ir timbre es asociándo lo a las fuent es acús- bre de tres notas del mismo instrumen to ? Son demasiadas preguntas sin res-
ticas de origen. En música, los nombres de los instrumentos se usan como eti - puesta, y qu izá co nvenga aquí repet ir la opin ión de Bregman sobre el pun to:
quetas para denotar los timbres, por ejemplo "timbre de flauta " o "timbre de "Creo que la definición de timbre de la ASA deb ería ser la siguien te : 'No sabe-
violín" . Si uno desea comunicar la impresión general dada por un son ido, este mos cómo definir el timbre, pero no es ni la sonoridad ni la alt ura tonal'"
métod o de nombrarlo puede ser adecuado. Las etiquetas nominales actúan de (Bregman, A., 1994).3
modo aná logo a los nombres de los colores: el término "rojo" es suficiente pa- Una posible explicació n del lugar especial que ocupan la sono ridad y la
ra pedir un to mate madu ro en una verdulería, pero result a dem asiado amplio y altura ton al en la definición acadé mica es que ambos parámetros son unidi-
vago para describir los miles de "rojos" que se usan en la industria gráfica . Del men sion ales y de fácil control en los exp erim entos de ac ústica y psicoac ústi-
mismo modo, hablar de "sonido de flaut a" no nos sirve para diferenciar entre ca. Otro moti vo es sin dud a el lugar preponderante que ocupó [a a ltura ton al
los son idos de dos flauta s diferentes, ni para distinguir los son idos que obtienen en las inve stigacione s acústic as aplic adas tanto a la música occide ntal como a
dos flautistas del mismo instrumento. C omo ejemplo, podem os mencionar la la no occiden tal, al men os hasta la década de 1980.
mutación que ocurrió con el concepto de ruido blanc o: en principio describe Sin duda, el timbre es más que un simple cat álogo de son idos o que lo que
una característica físico-m atemática de una señ al acústica de 'espectro plano, qued a de un son ido al quitarle la sono ridad y la altura ton al. Necesitamos, por
pero se convirtió ent re los músicos electroacúst icos en una nue va un idad cul- lo visto , una nu eva definici ón . Sería con veniente que esta nu eva definici ón
tural, el "ruido blanco" como un timbre más de su repert or io. contemple una descripción sencilla de los elem entos que usamos para perci bir
Como veremos más adelante, el uso del timbre a man era de et iqueta im- el timbre y que, en lo posible , se relacione claramente co n las seña les acúst i-
plica el reconocimiento del son ido sobre la base de un esquema previo en el cas que lo causan. Hace años que los investigadores en ac ústica y los músicos
que la memoria auditiva juega un papel central. electroacústicos trabajan para desarrollar una colección ordenada de términos
2. La definición académica de timbre se puede enc ontrar, por ejemplo, en tímbricos descriptivos, aunque con resultados inciertos.
el apartado sobre terminología acústica del ASA. Es repetid a hasta el can san cio Las definicion es tradic ion ales de timbre presentan otra dificultad. Un
en multitud de normas y textos, y dice men os de lo que no dice: "timbre es el eve nto físico puede comprender m ás de una ocurrenc ia: los pasos de un a per-
atributo de la sensación auditiva en términos del cual un oyente puede juzgar sona, la lluvia sobre un a chapa, los sonidos granu lados que se usan en elect roa-
que dos son idos similares, con igual sonoridad y altura to na l, son d íferentes't.? cústica, varios instrumen tos de música toc and o una secuen cia isorrítmica, etc.
Ésta es, quizá, la definición menos comprometida de toda la historia de la Todos estos ejemplos se oyen com o unidades aca badas pues forman parte de
una representación perceptual coherente, pero no se adaptan con facilidad a
la noción limitada de sonido que aparece en las definiciones de timbre. El con-
2 Am erican Sta ndar ds Association (1960) , traducción de GB. Esta definición es defendida,
ent re otros, por Cro wder, aunque impone una restricción tempo ral que se suma a las co n-
dicion es origina les (Crowde r, R. G., 1989). Otros auto res (Plomp, R., 1976) restringen la 3 Miche l C hion es más sarcástico: U[OO .) 'altura, int ensidad, duraci ón, timbre' equiva le a 'al.
definición a la clase de los sonidos complejos estacion arios en el t iempo. tura, peso, edad, fison omía genera l' loo.)" (C hion, M., 1998) .
164 165
cc pro de objeto auditivo, que ana lizaremos en detalle en el capítulo VII I y que recen proven ir) de la misma fuente acúst ica y descubrir las propied ades que fa-
comprende la fusión de las diferentes ca racterís t icas de la seña l de entrada en cultan la categorización tímbrica de los objetos audit ivos. .
una ún ica imagen cohe rente, resulta much o más adec uado en estos casos. En lo que sigue presentaremos algunos de los model os explicativos más
destacados sobre el timbre. Al final de esta part e resum iremos las ca racterísti -
cas que, a nuestro juicio, sintetizan el estado actual de la cues t ión.
2. EsTUD IOS y MODELOS EXPLICATIV OS SOBRE EL TIMBRE
El modelo clásico
El t imbre de un sonido es un rasgo perceptua l de naturaleza diferente a la de
los otros rasgos ya ana lizados, co mo la altura to na l o la sono ridad. Porejern- El model o clásico empleado para explic ar el timbre -al men os en los instru-
plo, no es posible ordena r los sonidos de men or a mayor en una sola dim en- mentos de música- establecía que, así como la frecuencia fund amental det er-
sión tímbrica: e l timbre es, en consecuenc ia, un rasgo mul tidimension al. min a la altura percibida y la intensidad física la sono ridad , el timbre tiene
Durante los últi mos dosc ientos años se estudió co n cie rto detalle el tim- origen en la amp litud y distribució n del espectro pro medio de la señal acúst i-
bre de los sonidos. Se realizaron gran cantidad de estudios expe rimentales y se ca . El modelo esta ba basado en la ley acústica de O hm, enuncia da en 1843,
propusieron una pluralid ad de model os exp licativos , tan to desde el punto de según la cual el oído es ca paz de discriminar los armón icos que compo ne n un a
vista de la seña l ac úst ica co mo del de las represent acion es psíquicas de los so- seña l periódica, pero no puede percibir las diferen cias de fase entre los com-
n idos. Cas i todas las expe riencias se dedicaron al estudio del timbre en los ins- pon entes. En la figura 1 se pueden ver los oscilogramas de cuatro seña les pe-
tru mentos de música. En la mayoría de los estudios el tim bre no es riódicas con igual espectro de pot encias y diferentes fases relati vas ent re
considerado como un objeto de est ud io en sí mismo, sino como una ca racte- armónicos . Si pudié ramos oí rlas no enco nt raríamos diferencias apreciables.
rística perceptiva que permite identificar una categoría particu lar de fuentes De modo más preciso, la ley ac ústica de O hm estab lece que un oyente
sonoras. no puede distinguir ent re dos seña les con la misma distribución de frecuen-
Las seña les preferidas en los est udios de laborator io son mayo ritariamen- c ias y amp litudes en los armón icos, pero co n un a distri bución de fases dife-
te estac iona rias en el t iemp o - sinu soides o co mbinac iones de sinusoides-, rente. En este model o el timbre depende úni camente del espec tro de
pues son fáciles de producir, de controlar y de medir. Aunque las seña les esta- po te nc ias de la o nda, que es sólo un a part e del aná lisis completo de Fouri er
cio na rias son muy raras en la naturaleza, los ca ntos y gritos de much os an ima- (Basso, G., zooio.
les se les pueden aproximar por tramos. Los sonidos generados por algunos Según la tradición , el defen sor más destaca do del modelo clásico fue Her-
instrumentos de música también poseen segmentos que se puede n equipa rar a rnan va n Helmholtz. Sin emba rgo, Helmholtz tuvo la precaució n de limitar su
ondas estac iona rias. O tros grupos de est udio emplean pulsos de ruido, blanco alcance a las seña les estaciona rias: "Ciertas caracte ríst icas particulares de los
o rosa, en vez de seña les estac iona rias de te rmin istas. De nu evo la elección reson idos de varios instrumentos depend en del modo que co mienzan y cesan
cae sobre un artefacto técni camente simple. Aunque los pulsos de ruido son [oo .]", de man era que estudió solamente "[...] las peculiaridades de los son idos
más habituales en la naturaleza que las seña les estaciona rias, ocurren muy ra- musicales que continúan uni form emente"." Los seguidores del model o -casi
ramente en estado puro. Como sabe mos, el uni verso acúst ico que nos rodea es todos los físicos, ac ústicos y músicos hasta bien ent rada la década de 1960-,
muy complejo y todo intento de simplificación imp lica riesgos recon ocidos. no tu vieron la prud encia de Helmholtz y proclamaron resuelto el asunto.? A
Muchos de los desvíos y desajustes que apa recen entre los modelos acús ticos lo sumo, recon ocían que la teoría estaba limitada a las ondas estaciona rias pe-
sobre el timbre y la realidad ambiental -o musical- tien en su orige n en un a riód icas que, según ellos, compon ían la mayor parte de las seña les de los ins-
extrapo lación incorrecta de los resultados de los ex perimentos de laborator io trum en tos de música.
a situaciones acústicas rea les.
A l margen de las h erramientas metodológicas adoptadas, la mayoría de los
4 Helmholt z, H. von (1885-1954) . Trad. de GB.
modelos y teorías sobre el timbre int entan vincular ciertos parámetros de la se- 5 Sin inte nción de agotar la lista , esta posición se puede ver reflejada en los trabajos de Ray-
ña l acúst ica con las consec uencias perce ptua les asociadas, co mprender nuestra leigh ( 1945), C ulver (1947), Olson (1952), Benade (1960), Beranek (1962), Backus
capacidad para asigna rle un idad a los diferentes son idos que provien en (o pa- (1969), Feyman (197 1) y Sundbe rg (199 1).
166 167
a) o
~ Vv ~ ry y
o
"O Flauta
-20
:E -20
Ci
E -40
«
-60
Tiempo
iD
llu
:3. -20
b)
ª
"O
Ci
E
-40
«
~
Frecuencia
Figura 1. a) Osc ilogramas de cua tro seña les periódicas con igual espec tro de potencias y
d iferent es fases relati vas; b) espect ro de potencias de las seña les anteriores
Frecuencia (kHz)
Llevar esta teoría a la realid ad no fue tarea simple. Se sabía desde princi- Figura 2. Espectros de sonidos de diferentes instru mentos según Wedin y G oud e (H andel ,
S., 1995)
pios del siglo XX que los espectros de los sonidos varían en el tiemp o, así,que
la pregun ta cent ral fue: ¿cuál de todos los espectros sucesivos debía tomarse
para determinar el timbre del son ido? La respuest a la dio Hall en 1937 al es- bre a medid a que ca mbiaba de frecuencia. La conclusión del experimento es
tablecer que se debían promediar temporalmente los espectros, y que el resul- categóric a: no existe una relación uno a un o entre form a de onda y timbre.
tado de est e promedio er a el responsable del t imbre.P Un ejemplo Uno de los pilares del model o clásico se desmoronaba.
representati vo de estudio experimental basado en el model o clásico se puede Otra cue stión que generó un intenso deb ate fue la de la invarianciadel
apreciar en la figura 2. timbre an te un cambi o de frecuencia. Para que el timbre no varíe, ¿deben con-
Si el timbre es consecuencia de la distribución de los armón icos o, ex- servarse las relaciones de amplitud entre armón icos para preservar la forma de
puesto de otra manera, de la forma de onda estacion aria, un a señal cuya for- onda escalada, o deben conservarse las posiciones absolutas de la envolvente
ma se mantiene no debería sufrir mod ificaciones tímbricas. Pero un o de los temporal ? El model o clásico sosten ía claramente la primera opción. En un cé-
experimentos acúst icos más simple s contradice esta afirm aci ón." La form a de lebre tr abajo, Slawson dem ostró que el model o también fracasaba en ese pun-
onda de una sinusoide no cambia al cambiar su frecuencia, pero si se gen era to (Slawson , W., 1968) . En la figura 3 se pued en ver las dos opciones . Los
un glissando que recorra buena part e del ran go aud ible pocas personas dirán oyentes juzgaron que la alternativa 1 cons erv a mejor el timbre que la alterna -
que el t imbre perm anece inmutab le. En realidad, a bajas frecuenc ias la sinu- tiv a 2 -defendida por el model o clásico.
solde suena blanda y oscura, mientras que a altas frecuencias parece dura y bri- Durante el año 1926, en pleno auge de la teoría clásica, Metfessel publicó
llnnrc." [La sinusoide, el "ladrillo" con el que se pretendía construir el edifici o un artíc ulo en el que ponía en dud a la simplista prop osición "forma de onda es-
del rimbre poseía, a su vez, un timbre particular! O peor aún, mut aba de tim- tacionaria igual timbre" (Butler, D., 1992) . La inversión temporal de una seña l
de audio -posible desde la aparici ón del registro magnético durante la segunda
guerra mundial-, en la que se mantiene sin cambios el espectro de potencias
t,Hall ( 1937) , en Cook, P. (1999).
'1El cxpcrimcnro fue realizado por prim era vez por Koh ler en 1915 (Risset y Wessel, 1999) .
promed io pero se alteran las fases relati vas, demostró que había algo más que
H Q ue en un rexro sobre el timbre este mos usan do palabras como "duro", "oscuro " o "bri-
distribu ción espectral en el tema del timbre (cualquiera puede comprobar el
llant e", to madas en préstamo de otros sent idos, demu estra lo lejos que estamos de tene r re- cambio dramático que se oye al invertir temporalmente un registro de piano,
suc ito e l asunto, por ejemplo medi ante el uso de software de audio en una computadora) .
168 169
a)
1 3 45 678 9 10 Número de armón ico dos y para predecir o crear otros nunca experiment ados. Durante el siglo pa-
"O
IJ··jlj !
ro
"O
sado se potenció la necesiclad de ap licar las n uevas tecnologías a la co nstruc-
'iij
e
Ql 1.. I ·.. Espectro original
ción y a la simulación de instrumen tos musicales. La llegada de la en ergía
E 1 ..
eléctrica primero, del con tro l electró n ico después y, por último, de la síntes is
I l"k digita l, permitió grad ualmente la construcció n de son idos a parti r de la des-
cripción física de las seña les asociadas a tales son idos. El mayor esfuerzo tec-
Frecuenc ia (Hz)
nológico se apoyó en los tratados de ac úst ica que repet ían , obv iamen te, el
b) 2 3 4 5 Número de armónico model o clásico. En la mayorí a de los casos el prod uct o de la sínt esis instru -
"O
ro ! mental se parecía muy poco al instru ment o or iginal. Los son iclos resultaban
"O
'iij
e
Ql
•• •• 1
I Alterna tiva 1
Conservación de las
apagados, carentes de identidad y de in ter és." La con clusión fue entonces evi-
E '. I rormantes espectrales
dente: la descr ipción física de la ca usa del t imbre era inadecuada, pues fallaba
"'r Frecuencia (Hz)

en el decisivo test de la sín tesis ac ústica. Este fracaso puede descr ibirse como
una auténtica "catástrofe del timbre" de la ac úst ica del siglo XX. El model o clá-
sico deb ía ser reem plazado por o tro.
e)
5 6 7 8
, I Análisis mu ltidimensional
Alternativa 2
Conservación de la
estructura de arm ónicos La falla pr incipal del mode lo clásico fue, sin duda, q ue en su formu lación sos-
....-i- -r . layaba completa mente la import anci a de los facto res tempo rales. Helmhol tz
ya había sospechado que el ataque y la ex t inción de ciertos son idos co nt enían
Frecuencia (Hz) informac ión relevante para la deter minac ión del timbre. Y resultaba ev idente
que la correspondencia entre los dat os físicos y los rasgos percibidos no era
Figura 3 . Experiment o de Slawson sobre la invarian cia del t imbre ame un ca mbio de simple y lineal como, por ejemplo, en la relación frecuencia-altur a.
frecuencia, a) espectro origina l, b) alterna t iva 1: frecuencias fijas o co nservaci ón de las Para no repetir el error co metido du rante el apogeo de la teorí a clásica,
formam es espectrales; e) alterna tiva 2: frecuencias relat ivas o conservación de la en el que se inten tó impon er un co nce pto físico para explica r la percepci ón ,
estructura de armónicos durante la década de 1960 se idearon y rea lizaron gran ca nt idad de cx pericn -
cias psicoacústicas. Las moti vaban la necesidad de encontra r los datos físicos
empleados efect ivamente en la percepci ón del timbre, comp rend er la estruc-
¿Por qué continuamos reconociendo la fuent e acúst ica al oír música en tu ra de las representacion es psíquicas del t imbre de un son ido y hallar una co-
una peq ueña rad io, o cuando oímos un instrum ento en un a sala con una res- rrespondencia entre datos físicos y representaciones ment ales.
puesta en frecu en cia irregular ? En ambos casos el espec tro de pote nci as origi- A unque parece haber una gran cantidad de man eras de describir la form a
nal se alte ra profundamente y tambi én deber ía a ltera rse, de acuerdo con el en q ue un sonido se dist ingue de otro, la psicoacústica necesita encont rar las
model o clásico, el timbre q ue percibim os. más senci llas para simplificar el prob lema. Es int eresante aquí comparar el es-
Hemos examina do var ias de las dificul tades que en contró la teoría clási- tudio del tim bre con el del co lo r. Un color está det erminado físicamente por
ca del timbre desde su en unciación a mediados del siglo XIX. Aunque no daba un espec tro de luz caracte ríst ico. Existen infinidad de espec tros posibles y po-
cuen ta de numerosos hechos, seguía siendo conside rada correct a por la mayo- demos perc ibir miles de colores. Sin embargo, todos los colores pueden descri-
ría de los especialistas, quienes supon ían que solamente restaba realizar algu- birse con sólo tres dim en sion es: dos de ellas definen la cromaticidad y la otra
nos ajustes. Esta situación se mantuvo hasta la década de 1960 , cuando la
aparición de la síntesis acúst ica por computador a terminaría definiti vamente 9 Al gunos de estos instrumentos, sin embargo, lograro n imponerse co mo generadores de
con el model o. C omo sabemos, un modelo sirve para explicar hech os conoc í- t imbres originales y novedosos. Tal es el caso del órgano Hammon d.
170 171
el br illo. ¿Es posible de scribir las diferencias de timbre entre los sonidos a par- breo La hipótesis principal establecía que los oyentes emplean la correlación
tir de un número pequeño de dimensiones, como ocurre con elcolor ? Para entre diferencias espectrale s para percibir el timbre de los son idos. Aunque
responder a est a pregunta se emplea el métododelanálisis multidimensional, me- Plomp permite la apari ción de nuevas dimensiones perceptuales en casos par-
diante el cual se procesan estadísticamente los juicios de los oyentes sobre el ticulares (por ejemplo, la "tasa de ruid o" es decisiva para evaluar el sonido de
grado de similitud entre dos sonidos elegidos de un conjunto restringido. La un cascabel) , sugiere que siempre se reducen en última instancia a no más de
hip ótesis de trabajo del método afirma que ex iste un número limitado de di- tre s. Simplemente, cada son ido polariza el ca mpo perceptual de acuerdo a sus
mensiones capaces de describir la totalidad de los timbres posibles. Si dos so- características particulares.
nidos t ienen un valor cercano en una dimensión, son sim ilares en esa Aunque el modelo de Plomp introduce el análisis multidimensional en el
dimensión aunque no lo sean en las otras. Bregm an lo explica de la siguiente estud io de la per cepción del timbre, sigue fiel al modelo espectral estát ico de
man era: "Cuando comenzamos a pensar en las sim ilitudes entre cosas, inme- la teoría clásica. Quizá por eso su mej or resultado se ha obten ido con sonidos
diat amente no s damos cuenta que un a cosa puede parecerse a otra de mane- cuyo cuerpo es muy est able en el tiempo, como lo son los que generan los tu-
ras diferentes. Una pelota se pare ce a algunos juguetes en su redondez, a otros bos de órgano. En la figura 4 se aprecia un dia grama bidimensional en el que
en su color rojo , a otros en su tamaño, [oo .] el hecho de que algo pued a pare- se comparan los ju icios sobre los son idos de los tub os reales con sus simulacio-
ce rse a otras cosas de diferentes maneras llev a naturalmente a la idea de la ne s espectrales. La dimensión vertical describe la cantidad de arm ónicos supe-
existenc ia de dimensiones de sim ilitud'U? rior es (de men or a mayor cantidad), mientras qu e la horizontal es producto de
A continuación de scribiremos tres de stacados estudios de análisis multi- un a combinación complej a de propiedades espectrales.
dim ensional sobre el timbre. Una de las críticas más importantes que se le han hecho a este tipo de aná -
lisis es que dep end e fuertemente del conjunto de sonidos elegidos. En ciert a me-
Estudios de Plomp. En 1967 Re in ier Plomp de scubrió que las diferencias tírn- did a, para cada conjunto de datos se obtiene n resultados diferentes. Ad emás, las
bricas se correlaci onaban bien con diferencias en el espectro cuando se co nsi-
deraban los niveles de 18 bandas de tercio de octava, apena s mayore s que las
bandas críticas. Dicho de otra forma , el t imbr e se relacion arí a con el patrón o Órgano
espectra l de excitación del sonido. C omo hay 37 bandas críticas cubriendo to- o-« A Sintetizador
do el rang o audible habr ía que considerar otras tantas dimensiones. Para co- Regal
rroborar est as conjeturas decidió reali zar un estudio sistemático. Los primeros
trabajos de evaluación multidimensional fueron reali zados entre 1960 y 1976
Tr~ 1 Cromome
(Pl omp, R ., 1967 , 1976) . Emple ó como datos de partida son idos de violín,
viola, violoncello, oboe, clarinete, fagot , trompeta, corno francés y trombón. Lengüetas ~pasón4'
Jl
Determinó que los juicios sobre diferencias entre los son idos podían resolver- J.
se con sólo tre s dimensiones perceptuales. .!p~
I
En una segunda etapa intentó detectar la cla se de información acústica Q1Diapasón 8'
usada para determinar el timbre. Analizó físicamente las señales de los instru- f:/aUfas
Diapasón
mentos filtrándolas en 15 bandas de tercio de octava, siguiendo aproximada- GedaC~
Octava 2'
mente la distribución de las bandas críticas en el o ído. A partir de la conjetura
Waldllute
de que las 15 bandas no eran totalmente independientes unas de otras, redu-
jo tod a la informaci ón espectral a cuatro dimensiones básicas. La intención de
Plomp era rotar y acomod ar estas cuatro dimensiones físicas para ajustarl as a R:!e
las tres dimensiones perceptuales deriv ada s del análisis de diferencias en tirn -
Figura 4. Repr esentac ión bid ime nsion al del timbre de son idos de órgano (círcul os) versus
10 Bregman, A. (1994) . Trad . de GB. son idos de órgano sinte tizados (tri án gulos) (Rasch y Plomp , 1999)
172 173
Espectro
diferenc ias en el timbre "estát ico" de Plomp no son suficientes para definir un ang osto
objeto audi tivo, en part e porq ue la seña l acústica puede ser alterada espect ral-
ment e por las reflexion es en una sala. En la época de los trabajos citados se sa- 1
bía que el recon ocimien to de los instrum entos musicales, por ejemplo, depend e
~
con fuerza del ataque y de la estructura temp oral de la envo lvente din ámica del ü
al
a.
son ido.' ! Sin embargo, Plomp no incorporó factores temporales en su modelo. '"
y ~
-o
'0
Modelo de Grey. Entre 1975 y 1979 [oh n G rey realizó una serie de experien- :::l
.J:J
'C
cias te ndientes a construir un espacio tím brico vec to rial, similar al que se em- 1ií
i5
plea para describir los colores. En la prim era de cllas empl eó dieciséis son idos
de la misma altura , intensidad y dur ación , prove n iente s de 12 instrum entos
Espectro
tónicos (es decir, de altura ton al defin ida) . Digitalizó las señales, las simplifi- ancho
có reemp lazando las microvariacion es tempora les por secc iones rectilíneas, y
se las presentó de a pares a veinte oyent es. Los sujetos debían cuant ificar la si-
militud ent re los son idos de cada par med iante el uso de una escala graduada
- -
de uno a treinta. G rey interpret ó que las distan cias psicológicas se pod ían co -
Figura 5. Represen ración tridim en sional de similirudes t írnbricas. O boes (0 1, 02 ); corno
rrelacionar negativamen te con las similitudes percib idas. En otras palabras, a
inglés (EH) ; fagot (BN) ; c larinete airo en Mib (C l ): c larinete bajo en Sib (C2); saxofón
menor similitud , mayor distanc ia tí mbrica. Los resultados de esta experiencia alto mf (X l ): saxofón airo p (X2); saxofón soprano en Sib (X3) ; flaura (FL); trom peta
fuero n graficados en el espac io vectorial tr idimen sion al de la figura 5. Ca da (TP ); corn o francés (FH ); tromb ón co n sord ina (T M ), violon cello sul ponricello (SI) ,
dim en sión , aunque obte n ida por aná lisis multidimen sion al, representa. los norm al (S2) y sul casto (S3) (Grey, J., 1975)
atributos físicos q ue G rey con sideró mejor apareados con las respuesta s per-
ceptuales obten idas (G rey, J., 197 5) .
~ \
ro
@> .9 'ü
La dimen sión vert ica l (Y) representa la distribución de la energía en los '"
o
c:
Q)
:::l
~@" Q't
el
oQ)
parciales armón icos de la señal. Se trata principalmente de una dimensión es- c:
" .... <{
.:
ro
[Jectral. Se puede pen sar en ella como representando el grado de "brill o" del so- 'ro
ID
nido, y en los aná lisis tradicion ales queda definid a por la envo lvente espectral. ro
'0
La dimensión horizontal (X) representa en parte el grado de fluctuación de la
10> c:
Q)
ro c:
~
:::l
envo lvente espec tral durant e el desarrollo del son ido y en parte el grado de sin- -, o "§~
~ e
~
Q)
cro nismo en el ataque de los diferent es armón icos. Es una dimensión espectro- c: Q)
® al w E
~~
"O
,~
i5
temporal, den ominada "flujo espectral" por Krumh an sl (McAdams y Bigand , o
Ol
c:
1994). Permite distinguir ent re son idos de evo lución estática y son idos de evo- ro
o:: ro
lución dinámica. La te rce ra dimensión (Z) representa la presencia de vibracio- ~ ' 'ü
c:
Q)
:::l
nes inarmón icas prev ias a la part e armón ica prin cipal del sonido. Se puede @' ' o o
.. @ s:
o ~
hablar de una "calidad de ataque" y es esenc ialmente una dimensión temporal. e
-c J!!
«
En una publi cación de 1977, Grey ilustró dos de las proyeccion es bidi -
mension ales de su espacio tridimension al con los diagr amas tiemp o-energía-
frecuencia (TEF) de las señales de los instrumen tos (figura 6 ). Sincrónicos
Parciales
Asincrónicos
•
Dimensión 2
11 El ejemplo clásico en esa época co nsistía en inverr ir tem poralmen te un registro de audio:
Figura 6. Ejemp lo de una proyección bid imen sion al del espacio de tim bres
la envolvente espectral pro med io no ca mbia, pero el timbre sí lo hace. -r
(los instrum entos son los mismos de la figura 5) (Grey, J., 1977)
175
174
Las conclusiones que el auto r extrajo de este estudio, y de otros similares, diciones diferentes: señ ales complet as, sólo los prim eros milisegund os de las
fueron muy valiosas. En primer lugar, con stat ó que la repre sentación mental señ ales (ataqu es) y señales completas menos los ataques (es decir, el cuerpo y
del co njunto de t imbres es relativamente esta ble y más o menos id éntica en- la extinción) (Iverson y Krumhan sl, 1993). C omo en el estudio de Grey , los
tre un suje to y otro. Se comp robó que un ca mbio en una dimensión física par- sujetos juzgaron la similitud de cada par de instrumentos tomados de un total
ticu lar (por eje mplo en la envo lvente espec tral) provocaba un desplazami ento de 16. Los juicios de similitud fueron no tabl emente consiste ntes en las tres
en la di mensió n perceptiva correspo ndie nte ("b rillo" en este caso) . En ciertas condicion es impuestas. Los autores graficaron parte de los result ados en el es-
ocas iones se producían tamb ién desplazam ientos en otras dim en sion es. Quizá pacio bidimen sion al de la figura 7.
la conclusión más controvert ida esté relac ion ada con la co nt inuidad de las La d imensión perceptual horizontal está relacion ada con las diferentes
tra nsicio nes tímbri cas: "N o hay front eras perceptuales marcadas en la identi- en volv entes de amplitud . Los instrumentos de ataque rápid o, como los de per-
ficació n en tre dos son idos int erpo lados [...]la ausenc ia de límites abruptos y cusión , se enc uentran a la izquierda, mientras que los de ataque gradual, como
la sens ibilidad al contexto sugiere que, definidas estrictamente, las tran sicio- los de vie nto, a la derecha. La d imensión vert ical está asoc iada con la env ol-
nes no se perciben ca tego rialmente".'! vente espectral (el br illo aumenta hacia arriba). lverson y Krumhan sl sostie -
De acuerdo con las expe riencias de Grey, es probable que ex ista n distin- nen que los oyentes basan sus juicios en las prop iedades acústicas que se
tas estrategias perceptuales asociadas a la d iscriminación tím brica, que se acen cuentran en la tota lidad del desarrollo del son ido . El proceso físico de ge-
tivan en funci ón de la ca racterística particular más pronunciada - te mpora l o neración vincula fuert em ente las diferentes part es entre sí. El ataque, el cuer-
espec tra l- del son ido en cuestión. Qui zá estas diferencias en las respuestas es-
tén fundamentadas en la polari zación de la ate nción hacia lo que los oyentes
I~ o6
selecc ionan, en un proceso precon sciente, como la caract eríst ica tí mbrica dis- Alaques
tintiva en cada caso.
Frecuencia Tonos sin ataques
Se puede pone r en dud a la h ipót esis de G rey según la cual son idos extre-
Perfil espectral
mada mente complejos no difieren entre sí más que en ciertas di mensio nes más ancho
subyacen tes co munes. Es posible que algunos timbres posean caract~rísticas
]
únicas no codi ficables en dimension es co nt inuas. Un buen eje mplo se en -
cuentra en la preeminencia de armón icos impares en el clarinet e, que contri-
buye a su ide ntificación más que otros dat os acústicos específicos co mo la
envo lvente de amplitud , En ca mb io, en los sonidos en los que la envolven te Perfil espectra l
más angosto
de amplitud posee características destacadas, co mo en el trom bón o la flauta,
ésta prima en la identificación por sobre la estruct ura armón ica.
Co n tod o, la más profunda de las objeciones a los modelos basados en es-
pacios vectoriales ataca direct amente su naturaleza: un espac io vectori al es
ID Frecuencia
Envolvente de amplitud
J~
esenc ialmente lineal. Sa bemos, sin embargo, que en la percepci ón del timbre
ocu rren grandes saltos y bifurca cio nes marcadamente alinea les. U n modelo
como el de Grey quizá sirva solamente para descr ibir regiones tí~bricas aco -
tadas, con compo rta mie ntos lineales locales, ocupadas por sonidos de ca racte-
JD] Jt]J
Tiempo Tiempo Tiempo
rísticas afines. + Súbito ••---Tiempo de ataque - - -•• + Lento
Figura 7. Representación bidimensional de similitudes tímbri cas. Co mparación ent re

Estudios de lversan y Krumhansl. lverson y Krumhan sl ana lizaron la percepci ón ataq ues aislados (cí rculos) y sonido sin los ataques (t riáng ulos): fagot (1 ); violonce llo (2);
de l timbre emp leando son idos de instrumentos musicales tónicos en tres co n- cla rinete (3); como inglés (4); flauta (5); como francés (6); oboe (7); piano (8); saxofón
(9); trombón (10); trompeta (11); trompeta co n sordina (12) ; tuba (13); campana tubular
11 Grey, J. (1977) , Trad . de GB. (14); vib ráfono (15) y violín (16)
176 177
po y la extinc ión son interd ependienres y no se co ntradice n . Este argume nto ta y baja frec uenc ia, y se parece al "b rillo" presente en casi todos los estudios
exp licaría la causa por la cua l co n sólo un a parte del soni do --el ataq ue o el sob re ti mb re. La segunda dime nsió n en importan cia -"compacto-dispe rso"-
cuerpo , segú n e! caso- pod emos identificar su timbre. O tra co ncl usión deri va- permi te sepa rar los sonidos tó n icos del ruido . En esta exper iencia, co mo en to-
d;, de este est ud io esta blece qu e los datos que usam os para perc ibir e! timbre das las de su clase, el resultado es muy sens ible a la selecc ión inici al de son idos .
dependen del contexto. La repr esentación psíqui ca resultante es fun ción tan- Por ejemplo, la dimensi ón "compacto-d isperso" no hubiera apareci do si no se
lo de la dur ación, inten sidad y envolvente espec tra l de la seña l acúst ica, co- incluían pulsos de ruido entre los estímulos de partid a.
mo de! ban co de sonidos almacena dos en la memori a del sujeto, su estado de Otra pos ibilidad de ace rcamiento verba l al timbre la dan las "experiencias
ate nción y su experie nc ia previa. En este punto, los auto res decl aran la prob a- de ca mpo", en las qu e simp lemente se recopilan y clasifican los tér mi nos que
hle inexistencia de in var iantes acústicas subyace ntes en la pe rcepc ión del tim- las perso nas -músicos o no músicos, según e l casc--, usan para describir los so -
hre de los sonidos. n idos. Aquí la d ificultad está dada por la multiplicidad de unive rsos lingüísti-
cos existentes, aun dentro de una misma comunidad. Los mejores trabajos son
Conclusiones sobre los modelos mul ridimensiona les. A pesar de la gran cantidad los q ue restri nge n las muestras a un un iverso mu y aco tado. Dos buenos eje m-
de info rmac ión que aportaron hasta la fech a, los intentos tendientes a enco n- plos son los trabajos de Kenda ll y Carta rette , en los que anal izan los té rminos
tr ar un número redu cido de dimension es no han llegado a resultad os co ncl u- que apa rece n en el trabajo de Van Bismark citado y en el trat ado de orques-
yen tes. Ningun o de ell os dem ostr ó qu e las dimension es sugeridas son tación de W alter Piston (Kend all y Carta rette , 1993) . El fin práctico más sig-
co mpleta mente adec uadas, aun dentro de un univ erso restringido de estímu- n ificat ivo de esta clase de est ud ios es obte ne r un dicc ionar io de términos qu e,
los. Nu estr a ob jeción al model o de Grey puede exte nde rse, en menor o mayor al alimentar un siste ma basado en una red neural , perm ita q ue los músicos
medida, al resto de los est udios sobre el timbre basados en el aná lisis mult id i- co ntrolen de man era verba l c iertos programas de síntesis por co mp utadora.
me nsional,
Modelos de análisis por sín tesis
Modelos verbales
El t imbre de los son idos ta mb ién se puede estud iar desde un a pe rspectiva to -
Desde un a perspectiva d istinta, Von Bismar k inte ntó redu cir el n úmero de va- ta lme nte d iferente , que parte de la producción antes que del aná lisis. La idea
riab les necesarias para determ inar el t imb re a partir de la verbalización de las ce n tra l co ns iste en el desar roll o de model os de síntesis que permitan gene rar
percepciones (Bismark, G., 1974) . Que es, de hech o, lo que hacemos habitual- soni dos sinté ticos indistinguibles de los son idos "na tura les" qu e se desean
mente cuando tratamos de describir un sonido en un a co nversación. Sele cci o- imitar. S i ambos so n idos, el sintético y el origina l, se oye n exac ta me n te igua-
nó 35 son idos diferentes y le pidi ó a los oyentes que los califiquen , co n un valor les, entonces la descripción ac ústica del soni do -ado ptada para elabo rar e l
de 1 a 7, co n relación a 30 cua lidades o dim en siones d iferentes. C ada dimen - modelo- es ace rtada. El métod o se denom ina análisis por síntesis . [ ean C la u-
sión se defin ió a part ir de un a pareja de adjetivos co ntrar ios co mo "duro- blan- de R isset ilustr a el proceso en un d iagram a sim ilar al de la figura 8 (R isset y
do", "seco -vivo", "opaco-brillante" y así hasta llegar a las 30 incluid as en el Wesse l, 1999 ).
estud io. Los sonidos proven ían de generado res de seña les periódicas comp lejas, Quizá un ejemp lo cé leb re sirva pa ra acla rar el procedimiento usua l en es-
con un número variable de armó nicos, y de pulsos de ruido rosa. Se hacían pa - ta clase de investigacio nes . En la década de 1960 R isset y Max Ma thews in-
sar a través de filt ros que los mod ificaban de acuerdo co n det erm inadas envol - te ntaron, sin éxito, imitar los son idos de los instrumento s de bro nce. La teoría
ventes espec tra les, ent re las que figuraban las correspo nd ientes a las vocales en clásica - con sus espec tros está ticos - fallaba co mp leta me nte, y el intento por
idiom a alemán. Aplicando el método de selección de compon entes principa- dot ar a las señales de un co mpo rta m iento temporal senc illo --compuesto por
les, el autor reduj o las 30 dimen siones verb ales origina les a cuatro dimensiones un ataque, un cuerp o y un a extinción- tamp oco mejorab a mucho los resulta-
perceptuales. Las dos dim en sion es más destacadas representaban los pare s dos (Risset y Math ews, 1969) . Para destr abar la cuestió n, registraron magné -
"punzan te -apaga do" y "compacto -disperso". La dim en sión más importante ticamente el son ido de un a trompeta real ejecutada por un profesional. La
-definida por el par "punaan re-apagado"- se relacionó co n el centro de grave - grabac ión fue reali zada mediante el método de aná lisis sinc rón ico de altu ra en
dad del espectro de la seña l, que depend e de la relación entre la ene rgía de al- una cá mara anecoica --con un tiempo de reverb eración muy bajo- para e lirni-
178 179
2
o 50 100 150
TIempo (ms)
F igura 9. Resu ltado del análisis sinc rónico de altura del sonid o de una trompeta (Basso,
G.,2001a)
Figura 8 . Diagrama conceptual de l proces o de an álisis por síntesis 2
60
.-
ro
~
nar los efectos acúst icos propios de una sala no rmal. El aná lisis sincró ni'co pre - "O
ro 5
supo ne que la seña l es cuasi- periódica y describe el desarrollo de cada armóni- "O
'¡¡;
c: 30 3. . . '
co indivi dual en el tiem po. El result ado de un aná lisis de esta clase se muestr a ~
.s
en la figura 9.
A part ir de este aná lisis del son ido orig ina l, los auto res simularon la seña l ' .. - .. , "
.............__ ~ _- _ _ _ _.-
simp lificándo la de dos man eras: eli minaron las fluctu acion es de alta frecuen-
cia y aprox imaro n las curvas por tramos lineales. La señal sintetizada quedó o 50 100 150
TIempo (ms)
como la qu e se ve en la figura 10.
Las dos seña les resu ltaro n ind istinguibles cuand o se las co mparó audi tiva - Figu ra 10 . Sí ntes is de la señal anterior simplificada
mente. Las simplificac iones, por lo tanto, no afectaro n los datos rele vantes
presentes en el son ido origina l.
tímbrica; 5 ) la proporción de armó n icos superiores aumenta sign ifica tiva-
A unque el modelo era simple, para la época resultaba muy costoso a n i- mente con la intensidad. Empleand o estos nu evos co noci mie ntos lograron
vel co mputaciona l (en el estud io origina l se simularo n las evo luciones tem- crear un model o computaciona lmente más eco nó mico que superó exitosa-
pora les de los primeros 13 armó nicos ). A parti r de sucesivas simplificacio nes, men te la pru eba de discrim inación auditiva
Risset y Mathews encontraron qu e: 1) la variación temporal del espect ro es El ejemplo anterior, aunq ue limitado a unos pocos sonidos de tromp eta,
crít ica para det erm inar el timbre; 2) las variac iones de alta frecu encia y pe- ilustra las característ icas y ventajas del anális is por síntesis. Para empezar, per-
que ña amplitud no se per ciben; 3 ) la dinámi ca del creci mie nto de cada ar- mite evaluar cada parámet ro del sonido de manera individual, un o por vez,
mónico define gran parte del timbre de los bronces; 4) existe una forrnan re ev ita ndo la complejísima tarea de lid iar con espac ios mul tid irnensionales en
ubicada entre 1.000 y 1.500 H z de gran importan cia para la d iscri~inación los que no se sabe bien qué cosa produ ce cada efecto perceptual. N o menos
180
181
importante, saca provecho inm ediato del ava nc e tecnológico en los ca mpos promedio alcanza una relación de 2 a 1 (en el can to no profesion al es de 3 a l ) .
de la acústica y de la info rmática, a la vez que impulsa n uevas inves tigacio- Pese a esta amplitud de valores espectrales, se compro bó que un ca mbio de ape-
nes y desarro llos. Los modelos de aná lisis por síntesis han demostrado ser efi- nas 5% en la frecuenc ia de alguna de las tres primeras formantes puede reducir
caces para gene rar co noc imie nto cie nt ífico y téc nico, redu cir la ca ntidad de drást icamente la ca pacidad de identificación de una voz conoci da .
infor mació n necesaria para exp resar una seña l acústica, prod ucir va riantes y A unque aparentemente la frec uenc ia fun dam ental, la frec uencia de las
mod ificaciones nunca expe rimentadas y controlar la prosodia musical en formant es --espec ialmen te entre 1.000 y 2.500 Hz- y el anc ho de ba nda de
t iempo real. las formantes participan en la identificación de la voz human a, se presume que
Una descr ipción det allada de las técnicas empleadas contendría la h isto- la informac ión acústica relevan te depend e de las ca racte ríst icas particulares
ria de la electroa cústica durante los últimos 60 años . Só lo para enumera rlas, de cada locu tor (Van Domme len, W., 1990). En otros términos, no existe un
pode mos cita r la sín tesis adit iva, la síntesis sustract iva, la síntesis alineal o glo- conjunto fijo de datos invariantes que se apliquen a todas las situac iones. Por
bal - a este grupo pertenece la síntesis por FM de C ho wn ing- , el modelado fí- eje mplo, puede ocurrir que la seña l ac ústica de la voz del hablante A posea
sico y, ac tua lment e en desarrollo, la síntes is basada en princi pios pcrceptuales. cierta cantidad de inform ación especí fica, de la cual el oyente extrae un sub-
conjunto de dat os adec uado para su identificación. Pero en el caso del hablan-
Estudios sobre el timbre en la voz humana te B el subconjun to ante rior podr ía resultar inapropiado, y e l oyen te debe
elegir otro diferente.
Parece que poseemos capacidades audit ivas espec iales para co mprende r la voz
hum an a, que no empleamos para oír el resto de los son idos. Es algo similar a Estudios sobre el "color" del sonido
lo q ue oc urre en la decodificación visual de los rostro s. Se sabe q ue para el re-
conocimien to del rostro de una person a se usan recursos diferentes de los que Un grupo particular de est ud ios fue or ientado sobre lo qu e se llamó el "co-
se usan para percibir el resto del ca mpo visua l (existen person as que no pue- lor " del son ido. El co lor del son ido no tiene, según sus defensores , propieda-
den dist inguir los o bjetos, pero que leen perfectamente los rostros, y vicever- des temporales y se aplica a los atri butos estacion ari os del son ido , no a los
sa). Q uizá estas capa cidades tengan que ver con la importancia socia l de la transitorios. De acue rdo co n Wayne S lawson, "u n so n ido puede ca mbiar de
inform ación y con lo parecidos que son los rostros - y las voces- entre sí; es co lor a lo largo del tiemp o, pero e l ca mb io en sí mismo no es un co lor ind e-
probable que se necesite ciert a capac idad potenciada y específica para distin- pend iente . N o más que un cambio en un color v isua l puede ser un color in-
guir entre una voz y otra. Por otra parte, ex iste fuerte ev ide ncia de q ue la pa- dependie n ce'l':' Slawson intentó desc ubrir el modo de co ntro lar el color del
labra y la música se procesan en lugares diferent es de la corte za ce rebral. sonido mientras ca mbia la altura to na l, la sono ridad o algún otro rasgo del so-
A nteriormente se creía que cada uno de los hemi sfer ios cerebrales estaba es- n ido. Propu so un siste ma de co ntrol basado en el modelo físico de fuente y
pecia lizado en uno de estos dom inios, pero en la actualidad se sabe que ta nto filtro. Por ejemplo, en un a guita rra la cuerda es la fuente de oscilació n y la
la produ cción co mo la percepc ión de música y palabra invo lucran varios sub- caja de resonan cia el filt ro. A partir del model o propu so una ser ie de reglas
procesos, cada uno de e llos lat eralizado de modo diferente. Por ejemplo, se de co ntrol y tran sform ación.
descu brió qu e las tareas de discr iminación y de identificación (que implican 1. El color del son ido está asoc iado con el filt ro, no con la fuente. Para
un acceso al léxic o verbal) son ind ependientes y está n localizadas en diferen- manten er el color consta nte se deben mantener con stantes las característica s
tes lugares de la corteza. del filtr o.
El problema de la identificación tímbrica de las voce s es much o más di- 2. Para mantener el co lor del son ido constante se debe mantener la en-
fícil qu e en el caso de los demás son idos. N o sólo porque pod emos identificar volvente espectral con stante.14
miles de voce s diferentes (contra un grupo reducido de etiquetas tímbricas 3. El color del son ido posee cuat ro dim ensiones independientes: apertu-
gene rales), sino por el pequeño ran go de variación de los rasgos no tímbricos ra, agudeza, lasitud y pequeñez.
en la voz. Sabemos que las frecu en cias fund amentales t ípicas e n hombres,
mujeres y niños están comprendidas entre 80-240, 140-450 y 170-600 H z, IJ Slawson (1985) , en Butler, O. (1992). Trad. de G B.
respectivamente. Y que el rango de variación en frecuencia para un hablante 14 Esta regla no es más que una variación de la anterior.
182 183
~d
4. Para transponer un color respecto a un a dimensión, se debe agregar un
valor co nsta nte en esa d imen sión.
5. Para invertir un co lor respec to a una dimensión, se debe invertir el sig-
no del valor en esa d imensi ón.P a b
Estas reglas definen claramente un espacio vectori al , similar al espacio
de los co lores visual es propuesto por Schrodinger, A lo co ntrove rsia l de la Tiempo
co njetura, Slawson le sumó c iertas afirmaci ones qu e se pued en ca lifica r, por Figura 11. Diagramas de Lo de dos son idos d iferentes (Lo , Y. O., 1987)
lo men os, de arriesgadas: "e l color del son ido aparece com o un elemento mu-
sica l viabl e que puede ser somet ido a un control estructura l preciso , en todo
aná logo al que se le aplica a la altura tonal". Aquí aparece por prim era vez el
deb ate sobre la capac idad del timbre para sustentar transformaciones estruc- sobre soni dos co mplejos pro pios de la vida co tid iana. C~mentaremos brev e-
tu rales o, d icho de otro mod o, sobre la cap acid ad morfofórica del timbre (m ás mente cuatro de ellos.
adela nte de sarrollaremos este punto). Al margen de la auda cia de las afirma - 1. D. J. Freed estud ió los son idos produ cidos por d iferentes baqu et as al
cio nes de Slawson, en sus conjeturas se perciben claros resab ios del modelo golpea r cu atro cacerol as de d ist into tam añ o (Freed , D. J., 1990) . A isló cu at ro
clásico del timbre. parámetros de "prev isión de timbre": la energía global, la distribución espectral,
En sinton ía con Slawson, Yee On Lo acepta qu e la envolve nte espec tral la velocidad de evolución espectral y la rapidez de alteración del evento. Las evalu a-
det ermina en gran med ida el timbre de los sonidos , pero se difer encia al asig- cio nes de los sujetos sobre el tip o (d ureza) de la baqueta empleada se mantu-
narle también gra n impo rta ncia a la evo lución temporal del espectro. A firma vieron to ta lmente independ ientes del tip o de cacero la golpea da , a pesar de
que percib imos los cambios especrra les a través de "cuadros" definidos com o que los estí mulos co ntenían informació n tan to sobre el exci tador co mo sobre
la mínima porción repetitiva de la onda. Esto s cu adros actúan co mo las tran- el resonador. Los parám et ros de previsión de timbre de Freed se co rrelaciona -
sic iones entre fonemas en la voz habl ada. A sí co mo los cuad ros prop orc ionan ron bien con las eva luac iones de la dur eza de la baqueta. A ctu alm ente se co n-
la micro estructura te mporal -del orden de los mil isegundos-, la rnacroestruc- tinúa investigando con el fin de ind ividu ali zar los índic es inva riantes qu e
tura -del orden de los segundos- está también co ns truida a partir de la conca- perm iten a los oyen tes ca racter izar y reconoc er al excitador y al resonador de
te na ción de cu ad ros. C om o apunta Lo: "El timbre es la evo lució n de los forma sepa rada .
cuadros't.!" Existen'ci ertos cu adro s cr ític os que definen los cambios importan- 2. B. H . Repp estud ió los sonidos qu e produc en las man os al aplaud ir. En-
tes a lo largo del tiempo. En el modelo de Lo , la percepción del ti mbre se fun- contró que los oyentes coi ncid ían al juzgar el sexo del "ap laudido r", aunque
da en tres parámetros: la disposición de los cuad ros críticos, la envolv ente de los juicios no siemp re co rrespondía n a l sexo real de la fuente (R epp , B. H .,
amplitud y la trayectoria de la altura to na l. En la figura 11 se aprec ian los dia- 1987) . Seg ún el autor este estud io refleja la influ encia de los este reo ti pos cul -
gramas de Lo para dos sonidos diferentes. tur ales aud it ivos.
El modelo de Yee On Lo se puede ver co mo un a versión cu antificad a di-a 3. Warr en y Verbrugge ana lizaron las respuestas aud it ivas frente a obje tos
feren tes ni veles de la concepci ón que asocia el t imbre con la evo lució n tem- de vidrio qu e rebo ta ba n o se romp ían (Warr en y Verbrugge, 1984) . Analizó la
poral del espectro de la señal. correspondencia entre patrones rítm icos, la inten sidad y las envolventes es-
pectrales y los juicios audi tivos asociados.
Eventos acústicos diferentes a la voz y a los sonidos musicales 4. N . J. Vande rveer estudió la ide n tificació n libre y la clasificación de
eventos acús ticos co mplejos co mo el t inti neo de llaves, el crepitar del papel,
Aunque la mayoría de los estudios sobre el ti mbre tratan sobre los son idos de etc. (Vanderv eer, N . J., 197 9) . Seg ún S. H andel, sería na tur al ind ica r los so-
la voz habl ada o de la mú sica, algunos inves t igadores centraron su ate nción nid os a partir del eve nto mecánico que los enge ndra, sin dud a a part ir de in-
va ria n tes tr ansform acionales (Handel, S ., 1989) . Los grupos esta ría n
parcia lmente determinados a partir de las propiedades acús ticas de los mat e-
15 Slawson (1985), en Butler, D. (1992). Trad. de GB.
16 Lo, Y. O. (1987)]. Trad. de GB. riales utilizados (es de cir, las inva riantes estr uctu rales).
184 185
A los estudios anteriores les cabe, potenciada , la crít ica que se le hace a midas. El recon ocimi ento es mayor cuan do se reemplazan las sílabas ausentes
casi todos los estudios sobre el timbre: depend en fuert emente del conjunto de por silencios que cuand o se en masca ran las mismas sílabas por un ruido. En el
son idos escogidos. segundo caso se reemplaza una sílaba por otra cosa, en el primero no.
• El brillo del sonido figura co mo un parámet ro sign ificat ivo en todos los
Resumen y conclusiones estudios mencion ados. La gran discusión gira en torno a la naturaleza de la en-
vo lven te espec tral. Al gunos auto res co nsideran que su importan cia guarda es-
Los resultados de los estudios men cion ados, y de otros similares, son muchas ve- trecha relación co n la frecuencia funda menta l de la señal, mientras que otros
ces cont radicto rios. En genera l, todos aceptan que la percepción del timbre de- sostie ne n que las band as de frecuen cia (en algunos casos las forrnantes ) deben
pende de la forma de onda en su conjunto, pero discrepan sobre cuáles de sus ocupar regiones espectrales absolutas. La mayor part e de la ev ide ncia experi-
característ icas deben considerarse relevantes . A modo de resumen , podemos es- mental confirma la segunda hip ótesis.
tablecer una serie de elementos, aceptados por la mayoría de los invest igadores, • C uando sonidos de un mismo género se hallan situados en contextos mu-
que int ervienen en la discriminación de los timbres instrumentales aislados. sicales de cie rta complejidad, en particular en texturas isorrítmicas, los índ ices
• La infor mac ión presente en el ataque de la seña l. de naturaleza temporal parecen perder importa ncia desde el punto de vista de la
• La informació n relativ a a la evo lución de la env olvente espectral, prin- discrim inación , en ben eficio de los índices ligados a la envolvente espec tral. Pa-
cipalmente en el cuerpo de la seña l. rece ser que, cuando la com plejidad aumenta (co mplejidad armón ica o cantidad
• La presenc ia de pequ eñ as variaciones aleatorias de frecuen cia en los de voces) las diferen cias temporales finas no son tan bien preservadas como las
compone ntes discretos de la seña l. diferenci as espect rales. Un buen eje mplo se puede enco nt rar en los corales pa-
Otras ca racte ríst icas se discriminan con mayor dificul tad: ra maderas en algunas sinfonías románticas . En esos fragmentos, los transitorios
• El grado de cohe rencia de la variació n en frecuen cia de los co mpo ne n- de las notas aisladas son men os importante s que la información presente en la
tes discreto s. parte del cuerpo de la seña l, ligada a la envolvente espectral.
• El grado de simplificació n en las variac iones de ampli tud y frecuenc ia • Ciertos son idos parecen poseer características o dim ension es tím bric as
(válido sobre todo para los model os de aná lisis por síntesis). ' exclusivas, no comp arables con las usuales en la mayorí a de los instrumentos .
La preemine ncia de armón icos impares en el clar inet e -cuya sola aparición so-
Esta en umeració n es vá lida solament e co mo referencia ya que de ben agregar- bre pasa en impo rta nc ia a las demás ca racte ríst icas de la seña l-, el particular
se nume rosas singularidades y excepcio nes . En la lista que sigue mencion amos transitor io de ata que de la trompet a, la presencia de ruido rosa en el sonido de
alguna s de ellas. un plat illo, la envo lvente de amplitud en el tromb ón y en la flaut a, son bue-
• Las variables significat ivas para la percepción del timbre musical exis- nos ejemplos de dim ension es tímb ricas part iculares no ex trapolables a la tota-
ten en, al men os, dos niveles tem porales diferentes: un nivel se asienta en los lidad de los instrumen tos de música.
ca mbios que ocurren en algunos milisegund os y el otro registra las var iacio nes
más lentas, del orden del segundo.
• C uando el estudio permite que participen las característ icas de a taque 3. PROPIEDADES PART ICULARES DEL T IMBRE
de los sonidos, éstas dominan por sobre los ot ros factores presentes en la señal
ac ústica. Solamente el brillo, det erminado por la distribuci ón espectral, per- A contin uac ión describiremos algunas de las prop iedades particulares de la
manece presente como un factor tímbrico de impo rta ncia. Un error sistemá- percepción audit iva q ue fuero n ana lizadas, y en algunos casos descub ier tas, a
tico cometido por muchos invest igadores que pret enden elim inar el ata que de parti r de las in vestigacion es sobre el timbre de los son idos.
la seña l aparece al seccio na rlo abruptame nte: lejos de elim inar el ataque, se lo
reempl aza por otro de band a anc ha . I7 Algo similar ocurre en los exp erimen- Constancia del timbre
tos de restauración fon émica, en los qu e ciertas sílabas de un a frase son supri-
Es ev idente que existe alguna form a de invaria ncia o de consta nc ia tímb rica,
17 Este efecto es co nsec uenc ia de l princi p io de in det erm inación acústico (Basso , G ., 200 Ia ). que se comprueba en el hech o de que una fuente acústica puede recon ocerse
186 187
en una gran varied ad de circunstanci as. Por ejemplo, un saxo se identifica co- xofón-, al margen de la existencia o no de otras característ icas menos sign ifi-
mo tal a l margen de la altura tonal o de la din ám ica que esté generando . Se lo cativas. Lo interesante en e! caso del timbre es que e! conjunto de rasgos im-
recon oce sin dificultad aun si lo oímos a través de un medio tan distorsivo co- prescindibles no es el mismo para todos los son idos, corno ya vimos en el
mo una pequeña radio portátil o a través de una puerta de madera . La voz de apartado anterior.
una person a con ocida se identifica en una hab itación silenciosa o en una reu-
nión muy concurrida, en la que se mezcla con otras voces, con la música y con ¿TImbres metaméricos?
los ruidos de propi os de la fiesta . Los espectros que nos llegan son muy dife-
rentes en tod os estos casos. Sin emb argo, la noci ón de constancia tímbrica no El sentido de la aud ición es claramente ana lít ico con relación a las alturas to-
se co mprende bien a partir de los estud ios clásicos de discriminación . nales, relac ion adas con la frecuencia fund amental de la seña l acústica. Es de-
¿Existen correlatos físicos que den cuenta de esta constan cia tímbrica en cir, en presen cia de un a mezcla espectral distinguirnos cada uno de los
diferentes contextos? Para recon ocer el timbre único de una voz se debe~ ele- comp onentes de la mezcla. Por ejemplo, cuand o combinarnos un Do y un Mi
gir, aislar y ana lizar las partes de la seña l que aporta n la información adecua- oímos tanto la tercera mayor (la combinación) co rno cada una de las notas in-
da. Una mala elección implicará un cambi o en el timbre percibido y una dividu ales. En contraste, el sent ido de la vista no es ana lítico con relación a
iden tificación equi vocada. En este punto result a int eresante destaca r que la los colores, relacion ados co n la lon gitud de las ondas lumínicas: al mezclar
envolvente espectral de una seña l ac ústica sufre, ine vitablemente, modifica- azul y amarillo vernos el color verde (la combinación), pero ya no percibimos
cione s importantes ent re l a emisión y la recepción. Ya sea por la acció n de fil- e! azul y el amarillo que lo forman. Esta característica de la visión permite
trado en el medio de prop agación, o por distor sión en las reflexion es y crear co lores met amér icos, causados por espec tros d iferentes pero indi stingui-
refracciones que puedan ocurrir, el espectro que le llega al oyente depende de bles a la vista. ¿Existe n los tim bres met am éricos o, lo que es equivalente, dos
la geome tría límite del espacio acúst ico y de la ubicaci ón de la fuente y el re- seña les físicas diferentes que se oigan exactamente igual? De acuerdo co n los
cepto r en dicho espacio (expresado con mayor precisión, la alteración del es- estud ios realizados hasta ahora, la respuesta es no (al menos en un sentido es-
pectro dep ende de la imped ancia compleja que encuent ra la seña l en el tricto , pues se pueden hallar dos seña les diferentes que cumplan un a misma
trayecto emisor-receptor) . 18 Las variaciones temp orales, en espec ial las de pe- función tímbri ca -por ejemplo en una fusión de objetos audi tivos- aunque se
queñ a escala presentes en el ataq ue, preserv an mucho mejor el patrón estruc- los pueda discrim inar) .
tural original luego de transform aciones como las anteriores. Se supone que Por otro lado ¿existe un "uníson o tímbrico", más allá del caso trivi al de
estos patrones temporales invari antes cumplen un a función destacada en la dos son idos de igual int ensidad y altura to na l? Es decir, dos son idos de diferen -
percepción de la co nsta nc ia tímbrica. te altura ton al e idént ico tim bre (¿no sería éste e! ideal de un con stru ct o r de
Habitualmente recon ocernos sin error el timbre de los son idos , lo que sig- pianos?). Al gunos autores creen que sí, aunque sus argumentos no son plena-
nifica que elegirnos los elementos de inform ación adecuados en contextos en- mente convincentes (Van Noorden, L., 1975 ; Erickson, R., 1975) . Otra carac-
teramente diferentes. Corno en el caso de las con stan cias visuales, la terística de la audició n, relacion ada con lo anterior, es la inexistencia de
constancia del timbre sólo puede ser explicada en func ión de com plicados alguna cosa parecida a una "oc ta va tím brica": no es posible obtene r un ciclo
procesos en las et apas superiores del tratamiento neura!. El trat amiento de las de timbres a partir del cual con struir una "esca la tímbrica", a semejanza de la
seña les de entrada al sistema audit ivo, o de las repre sentacion es auditi vas pri- escala de alturas to na les. Por supuesto , lo anterior no es más que otra forma de
marias, no alcanza para dar cuen ta de! fenómeno. decir que el t imbre es un rasgo multidimen sion a!.
Corno ocurre en e! recon ocim iento visual de los rostros, se supone que la
apa rición de cier tos rasgos específic os alcanza para situar un son ido en una ca- El timbre como un medio morfofórico
tegoría tímbrica particular -por ejemplo, para reconocerlo corno son ido de sa-
En el capít ulo V men cion arnos la posibilid ad de clasificar los rasgos ac ústicos
18 De aq uí surge la fragilidad de la altura espectral ant e la men or modific ación de la seña l
en morfofóri cos, capaces de portar formas inva riantes, y no morfofóricos. C o-
acúst ica. Esta propiedad, opues ta a la solidez que presenta la altura tonal frente a modifica- mentamos que la altura to na l y e! tiemp o const ituye n medios morfofóri cos po-
ciones similares o superiores, se desarrolla en Basso , G . (20 01a) . dero sos. Sin emb argo, tanto Attneave y Ols on , com o más adelant e Michael
188 189
Kubovy y Roger Shepard, conside raro n el timbre co mo un medio no rnorfo-
fór ico, Es ev ide nt e que a partir de l timbre no se puede codificar la misma cla - Capítulo VII
se de inform ación estruc tura l que se obt iene operando con la altura tonal.
S in e mbargo, descartar toda ca pacidad de organ ización estructu ral cim enta- Percepción auditiva del espacio
da en la modul ación tímbrica no parece razonabl e. La cod ificación fon éti ca
del habla se asie nt a prin cipalm ente en las variacion es del timbre en funci ón
del tie mpo , y la armonía musical puede ser co nside rada como un a parti cular
cod ificación del t imbre de los sonidos (cada func ión ton al posee un "color"
par tic ular) . "?
Timbre y atención
Para ana lizar la percepci ón audi tiv a del espac io es usual distingu ir entre loca-
U na característic a destacada de la percepción auditiva se relacion a con la lización y lat eralización . El térm ino localización se refiere a los juicios vert idos
atención . Si compa ramos las propiedades de los eve ntos y rasgos acúst icos que sobre la dirección y distan cia a la que se encuent ra un a fuente ac ústic a, que
nos perm iten manten er la atenc ión selectiva, veremos que son (casi) las mis- pueden o no coin cidir con su ubicación física. El término lateralización se usa
mas que se emp lean para discriminar y preservar el tim bre de un son ido an te para describir la localización aparente de un son ido "en la cabeza" del oyente.
ca mbios de co ntexto. En ambos casos el acento está puesto sobre el esfuerzo La lat eralización puede verse co mo una versión de laboratorio de la localiza-
r ara identificar y seguir auditivamente un objeto acúst ico particular. ción y es un compone nt e central en el diseñ o de ca mpos acústicos virt ua les.
Para caracterizar a l espacio acúst ico vamos a emplear coorden adas esféri-
cas cuyos parámetros son el ángulo de azimut El, el ángulo de elev ación O y la
4. COMENTARIO FINA L distanci a r a la fuente, tal como se ve en la figura l .
C omenzaremos nuestro estudio de la percepc ión espacial con el caso par-
Lo visto en este capí tulo vale solament e para caracter izar el t imbre de un úni- ticular de los estímu los sinusoida les estacionarios. Más adelante veremos lo
co objeto audit ivo. Tod avía no conside ramos las ca racte rísticas que debe po- que ocurre co n las señales generalizadas, variables en el tiemp o y de espectro
seer una seña l acúst ica para que percibamos Lino o una mult iplicidad de compu esto .
objetos acúst icos, terna que será desarrollado en el capítulo VIII.
La concl usión lógica de este capítulo esta ría dada por el an á lisis de los
li SOS musicales del tim bre, quizá ordenados de acuerdo co n su progresión his-
Plano
tórica. Pero tal empresa ocuparía, por lo men os, un libro similar a éste. Así que frontal
lo dejamos para más adela nte.
Plano
horizontal
1'1 En la música conte mporá nea la d isti nción ent re armonía y timbre resulta muc has veces
desd ibujada, co mo puede comprobarse en piezas com o AventuTes de Liget i y Modulations de
G risey. ' Figura 1. Siste ma de coord en adas esféricas: e, azimut; 0, elevación; T, distan cia
190 191
1. L OCALIZACIÓN DE SINUSOIDES 30
: : : ., , , , ., ,
,
20
En la localización de señales que poseen una sola línea en su espectro -corno

600 0
iD
10
O
7ft ..
~
··t·-t··:
:
~ "~ ": ' -
5000 ~ 10
.~~
. . ...
.. -. _.
ocurre con una sínusoide- los factore s espectrales no aportan información es- "C
ro O : : :
: :
"C
'¡ji 10 . ~.
pacial relevante. Por este moti vo los datos empleados en la localización de si- 4000
e : :
O
nusoides son principalmente binaurales. De todos ellos se destacan claramente '" : : : :
~
N 3000 É 10 . ~. : ;=;
E. : : : :
la diferencia interaural de intensidad (lID) y la diferencia interaural de tiempo (ITO) . ro '"
"C O
-
: : : :
- - -
~ 10 ~
'13 2500
e ::J O
: : : : : : "'-.'
Dife re ncia interaural de intensidad '"o
::J
1800
~ 10
.'!!
:
- :
: : : : : : : :
:.;,;,,;:
: : :
'"
u.. e O
: - : :
" ": ": .. ..
ro 10 :
1000
C uando la fuente acúst ica se ubica fuera del plan o medio del oyente, la inten-
'13
e O
,~
: : : -:-:
~ 10
: : : :
500 .. .. ..
sidad de las señales que llegan a cada uno de sus oídos es ligerament e diferen- ~
Ci O : : : :
te. En la mayoría de los casos, esta diferencia de intensidad no es provocada por 200 10 .-
O
la desigualdad de recorrid o entre la fuente y cada oído, sino por la somb ra acús- O' 30' 60' 90' 120' 150' 180'
tica que causa la cabeza al interponerse entre la fuente y el oído más alejado. Angu la horizonta l desde el frente (azimut)
En la figura 2 se puede ver la diferencia interaural de int ensidad (un) en
funci ón del azimut e. La frecuencia de la señal sinusoida l generada por la Figura 2. Diferen cia inreraura l de int ensidad (no) en func ión del azimut e y de la frecuencia
fuente se emplea com o parámetro de la famili a de curvas.
Una cabeza humana promedio se puede aproximar a una esfera de alrede-
dor de 20 cm de diámetro . A cau sa del fenómeno de difracci ón la cabeza no el t iemp o que le lleva a la onda alcanzar cada un o de los oídos . La ITO varía
va a provocar un a sombra acústica nítida por debaj o de 1.700 Hz, y va a resul- ent re O y 690 ms para seña les cuyos áng ulos de azimut cor respo nden a 0 ° y
tar acúst ica mente transparente por debajo de 500 Hz. C omo puede verse con 90 °, respectivamente. C om o un a onda ac ústica que se propaga en el aire tar-
claridad en la figura 2, la lJO es ínfim a a frecuencias por debajo de los 500 Hz, da 30 us en recorrer 1 cm , para ir de un oído al o tro nec esita aprox imada-
pero puede llegar hasta 20 dB a frecuencias elevadas. En otros términos, la di- mente 700 us.
fracción de las ondas en la cabeza limit a la eficacia del mecani smo de detec- Si las señales son estricta mente sinusoida les, un a diferen cia de tiemp o
ció n de diferencias int eraurales de int en sidad a la parte superior del espectro equivale a una diferen cia de fase. A bajas frecu encias la inform ación conte-
audible. nid a en la diferencia de fase es sign ificat iva, pero a a ltas frecuen cias la lo ngi-
En cuanto al mínimo cambio detectable en la lID, se ha comprobado que tud de onda es menor que la dist an cia entre o ídos y la difer enc ia de fase
llega a 1 dB para señales front ales siempre que la frecuenci a de la señal supe - prov ee dat os amb iguos. A una lon gitud de onda de 23 cm , similar a la distan -
re los 1.000 Hz. cia promedio en tre oídos, le corre sponde un a frecuencia de 1.500 H z. Si la
Un buen ejemplo relacionado con la liD lo pro vee la reproducción este - señal posee 10 kH z entran va rios ciclos co mpletos en esa distan cia y la fase
reofónica bicanal , en la que casi tod a la información espaci al está codificada dej a de apor ta r inform ación espacial unívoca. En la figura 3 se pueden apre-
úni cam ente en términos de diferencias de intensidad (esto no es así, deb emos ciar estas dos situac iones.
aclarar, en los registros de audio bien cuid ados en los que se contempla tam - Los movim ientos de la cabeza reducen en part e la ambigüedad de fase, pe-
bién la in for mación de fase). ro ésta resulta muy grande para frecuencias por enc ima de los 1.500 H z y el
mec an ismo de ITD pierde tod a efectividad.
Diferencia interaura1 de tiempo En la figura 4 se aprec ia la diferencia de recorrido en funci ón del áng ulo
de entrada de las señ ales que llegan a los oídos.
Para fuentes acú sticas ubic adas fuera del plano medi o del oyente, la diferen- Si den ominamos r al radi o de la cabe za, la diferencia de recorrido des:
cia interaural de tiempo (ITD) aparece co mo consecuencia de la diferencia en d = r () + r sen ()
192 193
En la figura 5 se puede ver e! gráfico de las diferen cias temporales de lle-
gada en func ión de! ángulo e. La curv a se quiebr a a 90 ° por simetría bilateral.
(ñ
.so 0,6 1/1\..
V "- t\.
Tan importa n te como la IT D es el mínimo cambio de ángulo perceptible c.
E 0,5
(M A A). C uando e! azimut e es cero los umbrales de detección para cambios en ~ / 1\
el ángulo de llegada son muy pequeñ os, de! orden de l Oa 2° -que correspo n- Ql
"O 0,4
/ \
den a una diferenc ia temporal de 1 0~. Para otros ángulos horizontales de lle- ~
gada e! MAA varía sensiblemente con la frecuencia (figura 6). A 1.800 Hz y un

"
~
Ql
0,3
:E 0,2
J 1\
azimut de 60° e! MAA no puede discern irse. ro
.¡;
~
e
0,1
/ 1\
~
i5 0,0
/ 1\
a) ~ ~ ~ ~ ~ 1~ 1~1~ 1~ 1~
Ó<jl = 210 0 Áng ulo horizontal desde el frente (azimut)
Baja frecuencia Figu ra 5 . Diferenc ia interaural de tiempo IT D en fun ción del azimut
14
(ñ ,q
b) o ... II
"O 12 I I
~ I
I
I
I
~
a> ... ; :I
~
I
:o 10 1 ,
'O I
I
I
,
"
ro
o b '
I
I
I
I
"S
8 I
I
I
,
ó<jl =180 0 Ol 75° I I

e s: I ,
-ro I ,
Ql 6 I
Alta frecuencia
"O
o 0 . . -0
:o 60°
E 4
ro
u •
Figura 3 . Pérdid a de efect ividad de la IT D a alta frecuenc ia por con fusión de fase. o
E 2
El mecan ismo no puede distinguir ent re la locac ión de [as fuentes 1'1 y 1'2 si emit en a a lta 'c
frecuenc ia ~
0°
O
200 500 1000 2000 5000 10000
Frecuencia (Hz)
Figu ra 6. Mín imo cambio de ángulo perceptible (MAA) en funci ón de la frecuen cia .
El pará me tro variable es el azimut 9
El cono de confusión y los movimientos de la cabeza
Como la diferenci a interaural de tiempo depende de la diferencia de recorri-

do de las ondas entre ambos oídos, la línea que va de un tímpan o al otro de-
Fi¡::ura 4 . C álculo de la d iferenc ia de recorrido ent re las señales que llegan a ambos o ídos fine un eje de simetría axial alrededor del cual se encuent ran lugares
194 195
Batidos binaurales
U na nota ble ca racte rística de nu estra audició n, en la que se comprueba la sub-

siste ncía de la inform ación de fase más allá del,sistema auditivo periférico, se
revel a con la aparición de batid os binaurales. Estos se manifi estan al presen-
ta r dos seña les sin usoida les de frec uenc ias ape nas diferentes (!lf < 20 H z), una
en cada oído . La ex iste ncia de los batidos binaurales depe nde de la inte rac-
ción de la inform ación de las seña les que parten de ambos oídos a n iveles su-
periores de procesam iento neural. Proveen una dem ostración irrefut able de
que la desca rga de las neuronas preserva la infor mació n de fase del estí mulo.
Los batid os binaurales son men os ní tidos que los batidos mon oaurales,
Figura 7. Cono de co nfusión later al
con las dos sinusoides del estímulo presentes en un solo oído. Se los percib e
sólo por debajo de los 1,000 Hz, a d iferencia de los mon oaurales que se ~yen
en todo e! ran go de frecuencias audib les. Además, estos últimos se perciben
geométricos co n e! mismo ITD. Ap arecen así los denom inados conos de confu- mejor cuando las int ensidades de las dos sinusoides son similares. Los batidos
sión a cada lado de la cabeza tal como se aprecia en la figura 7. binaurales, por e! cont rario, se oyen aun con grandes diferen cias de int en sidad
Las ambigüedades relacion adas con este cono de confusión, al igual que las entre los estím ulos (la sensibi lidad a la fase existe de n tro de un gran rango de
vincu ladas con e! plano medio, pueden ser resueltas moviend o la cabeza. Si la ro- inte nsidades ), y un autor hasta sostuvo que una de las seña les puede quedar
tamos 2oo a la izquierda y la imagen auditiva se desplaza 2oo en su posición late- po r debajo del umbral de audibilidad. Estud ios recientes no han corrobor ado
ral aparente, entonces uno tiend e a suponer que la fuente se sitúa en el plano esta afirmac ión .
horizonta l. Si, en cambio, e! mov imiento de la cabeza no es aco mpañado por un
cambio en la imagen perceptual, la fuente de sonido se localiza directamente arri-
ba o abajo del oyente . La visión y el sentido del equilibrio juegan un papel im- 2. LOCALIZACIÓN DE SEÑALES NO SINUSOIDALES
porta nte en este proceso, pues ayudan a definir la posición de la cabeza en el
espacio. A n iveles elevados de procesamiento neural la representación espacial Los ;onidos reales, a diferenc ia de las sin usoides teór icas, tienen co mienzo y
invo lucra la integración de la información proveniente de diferentes sent idos. fin . Como sabemos, todo ca mbio temp oral en un a seña l acúst ica va asociado
Como resumen - y solamente para seña les sin usoida les-, es posible soste- a ca mbios en su espectro, ta nto más profund os cua nto más rápido oc urre la
ner que los datos físicos aportados por la IDD son útiles a altas frec uencias, tran sición temporal. Precisamente, estas irregularidades espec trales apo rta n
mientras que los proveni entes de la lTD lo son para bajas frecuencias. Este re- nu eva inform ación útil para localizar fuentes acústicas. El siste ma auditivo las
levo en los mecan ismos de percepción espacia l fue den ominado en 1907 teo- aprovecha de dos man eras diferentes: un prim er mecan ismo co mpa ra e! espec -
ría doble por Lord Ravle igh , pero no se verifica de manera acabada para señales tro presente a la entrada de! siste ma auditivo con espectros previos o con .~s
de espectro co mplejo. pectros almace na dos en la memor ia de largo término. Como esta operac ion
Los umbrales de ca mbio en la percepci ón de las diferen cias de tiemp o son puede realizarse co n un solo oído inv olucra un proceso mon oaural. El segun,
men ores cua ndo la ITD es cero, con la fuente ub icada en el plan o medio. El do mecan ismo compa ra las ca racte rísticas espec trales de las seña les que llegan
umbra l de var iación para la IDD ta mbién es men or cuando la IDD es cero. En a ambos oídos y es, obviamente, bina ural.
defin iti va, la resolución espac ial es mejor para sonidos que llegan de frente o
desde algún lugar en el plano med io, con 0° de azimut. Localización monoaural: el rol del pabellón auricular
En a lgunos casos la localización mon oaural es tan buena como la bina u-
ral, hecho que sugiere el uso de algún mecani smo adiciona l no contemplado En 1969 Burler sugirió que el pabellón auricular provee inform ación sobre la
en la IDD ni en la ITD, tal como veremos más adela n te. localización vert ical y sobre la discriminación entre los camp os acúst icos an -
196 197
1",
terior y posterior. Es decir, permite local izar fuen tes ubicadas en el plan o me -
dio , imposib les de resolver con la lID y la ITD (Butler, D., 1969 ).
Hoy está aceptado que el pabellón auricular mod ifica el espectro del estí-
Amplitud 10dB
.. ~\ ro.
e
0°
18°
---- /
0°
mu lo en función del áng ulo de inc idencia de la onda en relaci ón con el eje
'j 1"\,'\h\ JJ
18°
medi o de la cabeza. La acción del filtro se mide co mparand o el espectro del (\\ / \\ 1/ I 36°
./ 1\ '\ / A .\ )/
est ímulo ex te rior con el espectro de la seña l en la entrada del can a l aud itivo 36° 54°
./
externo. La razón , expresada en dB, se conoce como la funci ón de tra nsfe ren-
cia de la cabeza (HRTF) l y se pued e apreciar en la figura 8.
La información pro vista por el pabell ón auricular, dado su tam año - unos '8
r6
54°
72°
90°
»>
./
¡....-.... .::>
- /\"
¡......-----
/('\ '/
Ir\~ / A r:
72°
90°
27 cm 2- , es efecti va a frecuenc ias por encima de los 6 kHz. Entre 500 H z y
6 kH z la ca beza, act ua ndo como pantall a, funciona de manera sim ilar.
cri
~ 106°
.>
¡---.... .----J
/'\\ / ' f'
106°
"'\ I
~
En exp erimentos co n ruid o de banda angosta , la elevación apa rente deri- ------- f'. 126°
va de la coincidencia entre los picos de la HRTF y la frecue ncia ce ntra l del rui-
do. Por ejemplo, un ruid o d iótico centrado en 8 kHz se oye "arriba" al mar gen
126°
144°
-----.-/
--------
'"'\~ (\' IJ
/
144°
de su ubicación rea l, pues en esa posición la función de transfe renci a posee un

/ ' \\ ¡(
pico de arnplitud. é
162°
__V \\J IÍ
180°
Si el oyente dese a hacer un uso efic iente de los dat os espectrales asocia- \J I
180°
dos con la dirección de la fuente acúst ica, es necesario que distinga entre los V
picos y va lles relacion ados con la dirección (filtros HRTF) y los propios de la
0,2 0,5 2 5 10 15
fuente y de las reflexiones generadas en las superficies cercanas. Esto sign ifica
qu e el cono cimien to previo de la fuente y de las condic iones acú sticas del am- Frecuencia (kHz)
biente es relevante. Sin embargo, com o cada pab ellón auricular provee filtros
Figura 8 . Funci ones de tra nsferenci a desde e! camp o externo ,has ta la entrada de l canal
d iferentes y conocidos, se los puede separar de los datos espectrales externos. 3
aud itivo externo ( HRTF) con e! ángulo horizontal com o par ámetroe
G . Plenge presentó evidencia de que cuando un sujeto no está fam iliarizado
co n las características de la fuente y de l ambien te acú stico la localizac ión mo-
noaura l se degrada (P len ge, G ., 1974) . Pero en compensación se requieren
dade s d e fase típicas de las sin uso ides. Si el espectro cubre un gran rango de
muy pocos segundo s para entrar en la nue va situa c ión. Esta acomodación espa-
frec uencias, las ambigüedades de fase pueden ser superada s a travé s de compa -
cial es de gran imp ortancia en la aud ic ión y ejecución de música en vivo .
raci ones entre los canales del filtro auditivo involucrados. D. W. Gr~ntham
co nsideró que la d iferencia interaural de tiempo debe definirse a pa rtir de se-
Empleo de dat os es pec t ra les en la localización binaural
ñales de espectro de ba nda y prop uso llam arla verdadera ITD (G rantha m, G .,
En señales de espectros de banda las diferencias interaurales de t iempo pro - 1995 ).

A contin uac ión men cionamos algunos experimentos en los que se desta-
veen información para locali zar la fuente que no está sujeta a las arnbig üe-
ca la ap licación de datos espec trales en la locali zac ión bina ural.
I De! inglés Headrelared ttansier[unctum s. Localización de señales transitorias

Z C uando las seña les que llegan a los dos oídos son idénticas se dice que e! est ímulo es di6-
neo y cuando son diferentes se lo llama dic6¡ica. Klump y Eady midieron los umbrales para la discriminación de la IT D par~ tres
J Un eje rcicio int eresante consiste en "aplastar" los pabe llone s contra la cabeza y salir a dar tipos de estímulos cortos. Fueron necesarios 9 us para detectar un ~~mblO en
una ca mina ta. Es notable co mo se alte ra nuestra percepci ón acúst ica de! espac io al modifi- el rrn ante un estímulo de ruid o de banda angos ta de 1,4 s de dur aci ón: 11 flS
car levemente los filtros HRTF.
199
198
para sinusoides de 1.000 Hz recortadas por una ventana rectangular de 1,4 s; tren de pulsos. Los clics luego de l primero apo rta n poca info rmación para la
y 28 us para clics de 1 ms de duración (tén gase en cuenta que 10 /lS cor res- localización . E. R. Hafter presentó evidencia de q ue un disparo adec uado -un
ponden a un desplazamiento lat eral de 1°). Los umb rales de IT D para tren es de pulso de ruido de baja intensidad o un hueco (gap) en el tren de clics- puede
impulsos repe tidos fuero n del orden de los 10 /lS (Klumpp y Eady, 1956 ). desac tiva r la adap tac ión binaur al. En su experimento los clics que aparecen
luego de la perturbac ión son más efectivos q ue los anteriores - adaptados- pa -
Localización en función de la frecuencia ra localizar espacia lmente la fuente. Hafter y Buell dicen: "[...) El siste ma au-
ditiv o se vuelve insensible a los datos interaurales luego del ataque, a la vez
La disc rimi nación de la posic ión lateral sobre la base de los ret ardos temp ora- que mon itorea el entorno a la espera de nuevas condiciones. Cuand o algo
les entre los dos oídos depende principalmente del contenido de baja frecuen- inespe rado oc urre, el entorno espacial es nu evamente exa minado" (Hafter y
cia de señales de banda ancha, por ejemp lo clics. Por debajo de 1.500. H z las Buell, 1990).
fases de las oscilaciones de decai miento en la onda de los dos oídos puede n
compararse, proveye ndo info rmac ión sobre los t iempos de llegada relativos de Interferencia binaural
los clics. Para frecuenc ias por enc ima de 1.500 Hz la información de la estruc-
tura fina del decaimiento se pierde. Sólo queda la referida a la envolvente de Los ruidos de baja frecuenc ia deg radan fuertemente la lateral ización de las se -
dec aimiento. ñales de alta frecuen cia, mientras que la recíp roca no es cierta. Una interpre-
tación de la inte rferencia bina ural establece que ésta resulta de la fusión de la
1mportancia de las disparidades en el cuerpo de la señal señal y del ruido en una imagen auditiva única, no jerarquizada.
Las disparidades en el cuerpo de una seña l compleja (que implican la percep-

ción de la dife renc ia entre fases) son más impo rta n tes que las del ataq ue, aun 3. M O DELOS DE PROCESAM IENT O ESPACIAL
para pulsos de 10 ¡.J.S de durac ión . Só lo para imp ulsos muy cor tos preva lece la
disparidad del ataque (que en este caso es la única dispo nib le, pues ei cuerpo Se han propuesto gran cantidad de model os q ue intentan dar cuenta de la
queda enmascarado bajo el ruido de banda anc ha provocado po r la interven - multiplicidad de mecani smos presentes en la percepción espac ial. En la figura
ción de l principio de ind et erminación acúst ico ). 9 se puede aprecia r el esquema de Blauert , que incluye todos los bloques que
aparecen en los model os más detallados (Blauert, J., 1997) .
Correspondencia tiempo-intensidad En cuanto a los modelos de ap licac ión, uno de los más interesan tes es el
prop uesto por Yoich i Ando a fines de la década de 1980. Su esquema se pue-
Si se presentan cl ics idént icos por medio de auriculares, la imagen se percibe de ver en la figura 33 del capítu lo I.
"en el centro" de la cabeza . Si a continu ac ión se retarda el clic del oído dere- El modelo de A ndo postu la la existencia de un mecan ismo precort ical de
ch o, por ejemplo 100 ¡.J.S, la imagen se desplaza hacia la izquierda . Pero si la in- extracción de la autocorrelaci ón de las señales que provienen de ambos oí-
tensidad de la seña l en el oído derec ho aumenta, es posible co locar la imagen dos, la posterior cor relación cruzada interaural entre las vías derecha e iz-
nuevamente en el ce ntro de la cabeza. La cantidad de t iempo necesario para q uierda, y la espec ialización de los hemi sferios ce rebra les para el proceso de
compensar 1 dB de diferencia int eraural se den omi na razón de correspondencia. factores espac iales o te mporales. Para ciertas tareas co mplejas (com o la pro -
Este fenómeno apoya la teoría que estab lece que las diferencias en tiempo y en pia del efecto "cocktail party") es necesaria la interacción de ambos hem isfe-
int ens idad son codificadas en el sistema nervioso de manera similar, y es de gran rios: el izqui erdo -rernporal- tiene a su ca rgo el procesa miento de la palabra,
importa ncia para la implementación de sistemas virtuales de espacia lización. mientras que e l derecho -espacial- procesa la localización de las fuentes. Es-
te modelo fue util izado con éx ito en el dise ño de salas para música no amp li-
Adaptación binaural ficada, ent re e llas el cé leb re auditorio de Kirishima, en Japón .
El siste ma auditivo bin aural parece procesar sólo el ataq ue del co nj unto en un
200 201
-- - -- - - -- • C uando oc urre lo an ter ior, la locación de la fuente est á dete rmi nad a
Iln¡;;r~a~ió;; s-;'n; orial- .
---- --,y ---

I I
I no auditiva I
Cognición
I
por la del primer sonido. Este fenó meno se den omina efecto de precedencia; o
I
~ f- efecto Hass.
Formación del
evento auditivo
• El efecto de preced encia aparece sólo para soni dos de carácter d iscon-
tinuo o transitorio.
IT ti • El segundo estí mulo pued e ten er alguna influ encia en la localización de
t- II la fuente (su máximo apo rte es un camb io de 7° en la localización apare nte ).
lJl ." .il- -.---

-- Realimentación
• S i el inte rva lo en tre estímu los es de 1 ms o men or, el efecto de pre-
11l-
.c 11l ce de ncia no actúa¡ se o bt ien e algú n t ipo de co mprom iso entre las ubicacio-
"E ~
11l '" nes espaciales de las do s fuentes. Este hecho se deno mina suma de locaciones
6 ~ Patrón de actividad binaural
"ffi" \-
.cO
(Blauer t, J., 1997).
«e. , J'
" ,,
,, r r r r r
o
"O
.!!l
1:
'"
-1:
~ -P~:e~a~o~
--
monoaural
I Procesador I-P~:e~a~o~ ~
• Si el estímulo retrasado es lo suficiente in tenso , entre 10 y 15 dB por
enci ma del primero, el efecto no ocurre.
• Se asume cor rien te me nte qu e e l efecto trabaj a más efecti vam ente cuan-
-T--- '
I binaural monoaural I
o L_ -
I T
do ambos estí mulos se parec en. P Dive nyi demostr ó, sin embargo, qu e las di-
Estimulación 1.
de la cóclea I I 1
Eslimulación
-, de la cóclea
feren cias espectrales no cuen tan si se mantiene la envolvente temporal
(D iven yi, P, 1992) . Esta co ncl usión es razona ble, pues las reflex iones puede n
mod ificar el espect ro de la seña l por distor sión armóni ca .
• El efecto es más notorio en el plano hori zon tal , aunque ta mbién apare-
r -
I
--
Filtro del
-- I
ce en el plano med io.
~;
• El efecto de precede ncia puede to ma r a lgún tiempo en aparecer (m uy
importa nte en grandes salas e iglesias) .
• C iertas modi ficac iones en las con dic iones acú st icas del ambiente pue -
den destruir ternp orariarnente el efecto de preceden c ia.
• La habi lidad para detect ar ca mbios en el interv alo temporal del estí mu-
Figu ra 9. Mode lo esquemát ico de Blauert para la aud ició n espac ial lo ret rasado puede mejorar notab lemente con la prác t ica.
El efec to de preced encia no inv o lucra un a co mpleta supresión de la infor-
mación de los "ecos". El oye n te pued e distinguir cualitativame n te cualq uier
4. EL EFEcrO DE PRECEDENC IA ca mb io en el pat rón tem poral de los estímulos. Es más, este patrón aporta in-
formac ión sobre la sala y la posición de los objetos y paredes en ella. El efec-
Sabemos q ue e l senti do de la aud ic ión , a diferencia de la vista, se co ncentra to de precedencia seguramente aparece en un ni vel relati vam ente a lto del
en las fuentes acús ticas antes que en las reflex iones provocadas por los obje - proceso cog n itiv o , Parece que los posib le "ecos" son sup rimidos después de ha-
tos de l entorno. U n eje mplo co t id iano ocurre al locali zar la ubicación de un a ber sido evaluado s com o co ns istentes con las expectat ivas del oyente en rela-
fuente acúst ica en un a sala reverb erante donde la mayor parte de la ene rgía ción co n la fuente acúst ica y a l ambiente. C uando ocurre un ca mbio
proviene de reflex ion es. Wallach (1949) y Hass (1951) investigaron este fe- inesperado la máscara del efecto de precedencia puede retirarse mom entán ea-
nóm en o con dos seña les asincrón icas y los resultados pued en sintet izarse en mente. En e l gráfico de la figura 10 se puede ver co n clarid ad la región de va-
las siguientes reglas. lidez del efecto de precedencia.
• Dos son idos sucesivos se percib en co mo un o solo si el inter valo te mpo- En la región supe rior las reflexion es superan los lím ites del efecto de pre-
ral entre ellos es lo sufic ientemente co rro . El límite super ior es de 5 ms para cedencia y se las perci be com o ecos aislados, en la pa rte intermedi a las refle-
clic s y de 40 rns para son idos de carác ter co mp lejo, com o pa labra y música. x iones apo rta n inform ación espa cia l del entorn o acústico, y en la región
202 203
20 r-----,,....--r--r--r----,----r--r-----.
10 Altav oz 2
Cñ Eco
:!:!. .: // I\~
.5 O
9
"x
al
Pos ición ~
¿-
o:: Alta voz 1
al
.; -10 del oyente
al
"O
~ -20
Z Figu ra 11. Sistem a de refuerzo electr oacúst ico co n dos altavoces distantes ent re sí
-30
Reflexión
inaudible
. ' ••!3
A
-40 O 10 20 30 40 50 60 70 80
Retardo de la reflexión (ms)
Altavoz 2
Figura la. Región de validez del efect o de preceden cia
Altavo z 1
infer ior las reflexion es se vuelv en ina udibles. C uando las reflexion es poseen
retardos iguales o men ores a 1 ms aparece el fenó meno de filtro en peine, q ue
se oye co mo una especie de co loraci ón espectral."
Tiempo de recepción (ms)
Refuer zo electroacústico en grandes espacios

Figur a 12. Diagram a temporal en el punto de recepción a partir del siste ma de refuerzo
elect roacústico con dos fuentes
El efecto de precedencia se emp lea para preserva r la local ización espac ial de
la fuente física cua ndo se emp lean varios altavo ces separados por dista nci as
sign ificativas. Po r ejemplo, en el sistema de dos fuentes electroacústicas de la
figura 11, el oyent e percibiría antes y con mayor inten sidad al alta voz 2. El al-
ravoz 1, cercano a la fuente física, se man ifestaría com o un eco.
La secuencia temp oral que le llega al oyent e se aprecia e la figura 12. Es
ev iden te que percibirá co mo fuente acústic a primari a a l a ltavoz 2.
La solución a este problema co nsiste en retardar la señal del segund o al-
tavoz hasta ubicarla dentro del límite de Hass. El esquema del disposit ivo se
muestra en la figura 13.
Altavoz 2
El resultado fina l se puede eva luar en el gráfico temporal de la figura 14. retrasado
A hora se recibe prim ero la seña l del altavoz 1. La seña l del altavoz 2 oc u- / / 1\"'. D, + 20 ms Altavoz 1
sin retardo
pa una posición que cae dentro de los límites esta blecidos por el efecto de pre-
~
cedenc ia. Para el oyente la locación de la fuente qued a esta blecida por el
primer son ido que le llega, q ue es el que emite el alta voz 1. g p";,,"
del oyente
D, ------~
¿
., C mnIJ filter e n ing lés (Basso, 200 Ia ).
Figura 13 . Aplicación del efecto de precedenc ia a un sistema de refuerzo electroacústico
204 205
Rango del efecto
Hass o de precedencia
iñ
I Altavoz 2
:E. con retardo
"C
Altavoz 1 de señal
ro
"C
"¡¡;
e
al
E
TIempo (ms)
Figu ra 14. Diagrama remporal en e l pum a de recepc ión luego de insta lar el disposirivo de
retardo
Figura 15. Co nstanc ia visual de tam a ño, La ca beza más ce rca na al observador rien e el
5. PERCEPCIÓN DE LA DISTA NCI A mismo tamaño que la "gran ca beza" alejada
Hasta aho ra ana lizamos los mecani smos empleados para det erminar la direc -
ción de llegada de las ondas ac úst icas desde un a fuente exte rna . N os queda por diada en det alle, la distan cia aparente de la fuente ac úst ica que defin e la pers-
ver de q ué man era evaluamos la distancia a la que se en cuentra dicha fuente . pectiva auditiva compo ne un a importante dim en sión psicoacústic a. Los inves-
En e l siste ma de coorde nadas esféricas de la figura 1, al com ienzo de este ca- tigador es que desarrollan dispositivos acúst icos para el cine y sistemas
pítulo, nos falt aría determinar la distancia r a la que se encuentra la fuente. multimedia han concentrado gran part e de su interés en el perfecci on amien-
to de modelos virtu ales de perspectiva auditiva.
Perspectiva auditiva La sonor idad, cuando interviene co mo un parámetro de entrada para eva-
luar la distanc ia de las fuentes acúst icas, deja de ser un correlato unidimensio-
La perspec t iva acústica, a l igual que su co nt raparte visual, es una import ante nal de la intensidad física para con vert irse en un rasgo co mplejo q ue involu cra
fuente de inform ación ambiental. Las imágenes acúst icas de gran desarrollo en más de una dimensión . Los objetos en el mund o son, en general, de tamaño
azimut se reducen a un punto a grandes distancias. Por ejempl o, el ancho acús- constante, pero la imagen de un objeto en la retina crece y decrece cuand o és-
tico a/larente de una orquesta sinfón ica, muy grande en las primeras butacas de te se acerca o se alej a de nosotros . Este hecho es conocido como constancia de
la plat ea, disminuye a unos pocos grados al oírla en un parque a 300 m de dis- tamaño. En la figura 15 se puede apreciar una ilustración clásica de la constan-
tan cia.s El efecto es equivalente al de las líne as paralelas que convergen en el cia visual de tamañ o.
infin ito. Si cont inuamos desarrolland o la ana logía con el sent ido de la vista, En el dominio de la audición la constancia de la sonoridad funciona de mo-
se podr ía decir que la sonori dad disminu ye con la distan cia ta l como ocurre do aná logo a la con stanci a de tamañ o para el sentido de la vista. Si un a fuen-
co n el ta maño aparente de los objetos y que la definición t ímbrica se atenúa te acúst ica de int ensidad con stante se aleja de nosotros a camp o libre , la
de modo similar a l gradiente de color en la visión . 6 Aunque no siempre estu- intensidad física que nos llega disminuye prop orcionalmente con el cuadrado
de la distancia. No debe sorprendemos entonces que una fuente cuya intensi-
dad decrece parezca alejarse. Es decir, también podemos experimentar la sen-
~ El panimetro subjetivo emp lead o en ac ústica de salas se den omina "anc ho aparente de la
lucn t e" ( AWS) , bien cor relacio nado co n el facto r obje tivo de espac ialidad (I-IACC) . sación de oír una fuente acú stica que disminuye de intensidad sin alejarse -un
(, La ana logía co n el sent ido de la vista, aunque inexac ta, resulta útil para ejemplificar los instrumento musical en decrescendo-, cuyo equi valente en el camp o visual po-
d iferentes aspec tos imp licados en la percepción de la perspecri va auditiva. drí a ser un globo q ue se desinfl a.
206 207
Imaginemos un experimento: un oyente observa a dos cantantes, una cerca- Canta fuerte. pero lejos
na y \<1otra alejada . La cantante cercana produce un sonido pp, mientras que la
(11 rn cmite el mismo son ido pero en ff. Los son idos poseen la misma altura tona l
y du ración . S i al oyen te se le pide que evalúe la sono ridad de ambas cantantes,

dini que la más alejada supera a la cerc an a. Sup oniendo que la int en sidad del pp
sea 1/1 28 de la inten sidad del ff, y que por estar a 50 m la inten sidad de la can-
tant e alejada llega con 1/2.500 (1/d 2 = 1/50 2) de la emitida, la onda cercana po-
see alrededor de 20 veces más energía que la alejada. Sin embargo, el oyente
insistirá con su afirmació n. En la figura 16 se puede ver este expe rimento.
El experimento anterior muestr a que existen otros datos no to mados én
c ue n ta , diferentes de la sonori dad, que nos aportan informac ión sobre la in- ¿ Cuál de ellos se percibe
ten sidad física y la d ista ncia de las fuentes acústicas. Hasta aquí no to ma mos con mayor intensidad?
en cuen ta el cambio espectra l operado en las señales de las ca n ta ntes en fun-
c ió n del esfuerzo voca l. En gene ra l, la envolve n te espec tral ca mbia de form a Figura 16 . Consta ncia de sonoridad
- para favorecer a los armó nicos más agudos- a medida que la inten sidad y el
esfuerzo voca l aumen ta n .
La figura 17 sin te tiza los trabajos de [ohn C howni ng en un a cantida d de
ex peri me ntos simi lares al exp uesto (Chow ni ng, J., 1999 ). Representa un a ge- Da intensidad decrece cuando la distancia aumenta D
DI cambio de la envolvente espectral es mínimo
nera lización del cambio de la co mposición espectra l en función de la altu ra
tona l, la dinámica y la d ista ncia. A causa de la gran cantidad de dimensiones
necesarias para describir los da tos físicos se han inclu ido espacios bidi mens io - 11
na les (espectros de potencia ) dentro de un espacio tridim ensional ce rrado.
Es posible ahora co mprender al oyente de l expe rimento: no juzgaba la dis-
tan cia y la sono ridad de la fuente únicamente a partir de la inte nsidad que per-
r¡o
.- t!
E
\ \-_ _.__ 1-_-
.. .__...
---1----
Q)
c ib ía. En la figura 18 se esquematiza una situación simétrica a la de la figura 16. c:-
"" :J
.e : CJ) I
o~
Una fuente de información adiciona l la prop orci ona la reverberación del
recin to . La relac ión en tre la intensidad de la rev erberación y la onda dir ect a
es interp retada por el oye n te co mo un índ ice de distan cia. En un espacio ce - pp
rrado t ípico la intens idad de l ca mpo rever berante no varía co n la d istan c ia a
la fuente, mien tras que el sonido dir ect o sí lo hace. Sabemos, por experiencias
previas, que el nivel del ca mpo reverb erante depende de la intensidad de la
fuen te q ue lo excita y usa mos este co nocimie nto para eva lua r la intensidad y
dista ncia de las fue ntes acústicas en recintos ce rrados .
En la figura 19 se comparan dos seña les inmersas en el mismo ca mpo re-
vcrbera n re. La seña l A se ubic a a cinco unidades de distan cia del oyente y po-
see una inten sidad relati va se is veces men or q ue la seña l B, a un a distan cia de
dos unidades. A mbas llegan al punto de recepción co n la misma intensidad di- Dltura
Menos parciales y cambios en la envolvente
recta. S in embargo, la relación con el campo reverberan te aporta la inform a- espectral debidos al cambi o de altura
c ión necesaria para ev ita r la co nfusión de distan cias sin necesidad de apela r a
diferencias espe ctrales. Figura 17. Espacio distancia-intensidad-frecuencia según C howni ng
209
20/1
Aunque la an alogía con el sentido de la vista nos ha resultado útil hasta
aho ra, debe seña larse que la con stancia de sonor idad es más comp leja que la
consta nc ia de tamañ o: pocos objetos visuales varían de tamaño ante nuestros
ojos (como en el ejemplo de un globo que se desinfl a) , pero las fuen tes acús-
tic as varían norm almente de int en sidad en lapsos muy breves, especialmente
en música. Por eso quizá el mecani smo de percepción asoc iado a la co nsta n-
cia de sonor idad necesite inform ación relacion ada co n índ ices espectrales y
con la int erp ret ación de la relac ión seña l directa/señ al reverb erante. La eva-
luación aislada de la int ensidad parece no alcanzar.
En gene ral, los juicios auditivos sobre la distan cia a la q ue se enc uentra
una fuente acúst ica son relati vamente imprecisos, y los errores co n relación a
la distancia física son del orde n del 20% en sit uac iones normales.
Es interesante descr ibir lo que ocurre cua ndo los oyentes son privados de
algunos de los datos men cion ados. Por eje mplo, en el ca mpo libre no actúa el
sistema de evaluación de la perspectiva relacion ado con la reverberación y la
FiJ(lIra 18. Percepción de la d istan cia: los son idos de ambas cantantes posee n para e l
precisión de los juicios co n relación a la distancia se reduc e sign ificativamen-
"Yl' Il~e la ~nisma intensidad, pero la composición espectral le permite al oyente sabe r que
la lilas a lejada ca nta en ff te. Estas situac iones se han estu diado en experiencias de laborat ori o, con
fuentes sinusoida les ubicadas en cá maras ane co icas, en las se preserv a sola-
mente la informac ión relacion ada con la inte nsidad física.
Si ampl ificamos seis veces

la seña l a 5 m, obtenemos 6. PERCEPCiÓN DEL MOVIM IENTO
el mismo nivel que a 2 m
La habi lidad para percibir el movim ien to lat eral de una fuente acústica se mi-
B de empleando el mínimo ángulo de movimiento audible (MAMA). Los ex perimen -
u tos han mostrado que el sistema auditivo es poco sensible al movimiento de
ro
u
.¡¡; las fuentes acús ticas, aunque se co mporta mejor ante movim ientos lentos. Pa-
e Señal
ra desplazamientos angulares del o rden de los ISO/s, el MAMA es de 5°. Pero pa-
.
ID
directa
.E
.... ra mov imientos angulares veloces, del orden de los 900/s, el MAMA crece hasta
llegar a 21°.
El efecto Doppler, responsable del ca mbio de altura en las sirenas de las
ambulancias cuando pasan a nue stro lado, es una importante fuente de infor-
mación sobre el ca mbio en el sentido del movimi ento relat ivo en tre el emisor
acústico y el oyente. Es un fen óm en o físico que hace que la frecuencia aparen -
"I te en el pun to de recep ción aumente si éste se acerca a la fuente y qu e dismi-
nu ya si se aleja de ella. En la figura 20 se ilustra el caso con un a fuente acúst ica
2 3 4 5 6 en movim iento hacia un receptor en reposo.
Distancia de la fuente Si la fuente se enc uentra qu iet a la onda acústica llenar á la distan cia FR
que la separa del rece ptor en un tiemp o tu = FR/c , con e como la velocidad
FiJ(lIra 19 . Raz ón seña l d irecta /ca mpo reverberan te en func ión de la d istan cia
del son ido en el a ire. La lon gitud de o nda en este caso es A. = FR / f ~t. Pero
210
211
Espacio acústico virtual
si la fuente se desplaza h ac ia el receptor a vel ocidad VF la onda ac ústica reco-
rre rá en el mismo tiempo un a distancia menor F'R. La fue n te se h abrá movi-
do en ese lapso una distancia F' R - FR = VF Ót y la nueva longitud de onda será
A' = F'R / f Ót. Tom ando en cuenta la relaci ón gene ral v = Af y luego de algu-
nas ope rac iones a lgebraicas senci llas se tiene qu e:
En la ec uació n anterior f es la frecuencia de la seña l emit ida por la fuente y f'

es la frecuencia aparente en el punto de recepción . S i se co ns ide ra tambi én la
posibilidad de movimiento del recep tor a veloc idad VR la ec uació n se mod ifi-
ca levem ente:
f' = ~f
c - VR
El efecto Dop pler se emp lea desde h ace t iempo en música electroacúst ica a Espacio acústico real
parti r de módulos específicos de procesamie nto. Casi no es n ecesario co me n-
ta r la imp ortan cia qu e tiene un a bu ena simulació n Doppler en el caso de los
Figur a 21. Ca mpos acúst icos defin idos por un siste ma esrereofón ico bican a l
efectos especiales para c ine y mul t imedi a.
En cuanto a la pe rcepc ión de l efecto, se reduce a la perce pc ión de un a va-
riación co ntin ua de frecu encia , que ya exa mina mos en el capítulo IIJ.
( IT D) Yde inte ns idad (no) qu e apo rta n las seña les qu e le llegan a ambos o í-
dos. En un siste ma electroacú st ico de rep roducc ión, sin emba rgo, a la infor-
7. CAM POS ACÚST ICOS VIRTUALES maci ón anterior se suma n las refer encias espac iales codi ficad as en la seña l
gra bada .
En un ca mpo acús t ico h abitual , con el oyente in me rso en su interior, la in - Por ejemp lo, el regist ro de un co ncie rto en un gran aud ito rio contiene in-
formac ión espac ial depende de los conocid os dato s espectrale s, tempor ales formac ión sobre la reverberación y las ca racterísticas espectro-temporales de
la sala. Asimismo , es func ión de los v ínc ulos espaciales entre cada instrumen-
to y ca da un o de los micrófonos ut ilizados. C uando esta grabación se rep rodu-
ce en otro rec in to a través de un siste ma ester eofónico bícanal, el ca mpo
ac úst ico que perci be el oye nte se desdobl a entre: a ) un campo acústicoreal, qu e
es en el qu e está in merso y que de tec ta a partir de los sonidos qu e él mismo
produce -como voz h ab lad a, ruidos de pisada s, et c>- y b) un campoacústico vir-
tual gene rado por la fuente electroacústica a par tir de las referencias codifica-
\ I V \ ]CV
) das en el regist ro origina l. En la figura 2 1 se puede ve r un esq uema qu e ilustra
v,
{LA A R dicha situac ión."
F'
7 Por supuesto que el térm ino "rea l" está emp leado aq uí co mo un a etiq ueta práct ica, sin
Figura 20. Efecto Do ppler co n un a fuente F en movim iento a velocidad VF hac ia un reco nnotaciones ep istemológicas. En cie rto sent ido, por supuesto, ambos ca mpos ac ústicos
cepto r R en reposo son "reales" a su manera.
2 12
213
La situac ión ideal sería que el campo acústico real no interfiriese negat i-
vamente co n el espacio ac ústico virtua l que define la grabac ión . Pero esto Capítulo VIII
oc urre po r lo general en salas de aud ición cuidadosa mente d iseñad as, por Percepción de objetos auditivos
eje mp lo un a sala de control de un est udio de grabación . Lo habitua l es que el
campo ac ústico de la sala rea l degrade la informac ión espa cial qu e co ntiene n
las señales electroac úst icas. Au nq ue en el ejemplo nos refer imos a un sistema
cstereofón ico bicanal, lo mismo ocurre co n los demás siste mas de espac ializa-
c ión electroacústi cos que ex iste n en el mercado, tales co mo las diferentes ve r-
siones conoc idas como surround o las que se derivan de la codifícacl ón Blum lein
origina l.f
Desde A ristóteles, la percepción se entiende como el proceso a través del cual

8. RESUMEN utilizamos la información prov ista por nuest ros sentidos para armar represent a-
ciones mentales del mundo que nos rodea. En gene ral, desde un a perspecti va
N uest ra habilidad para localizar son idos es muy buen a en el plano hori zontal , realista (la de A ristóteles lo era ) la tarea de la percepción es tom ar los datos de
algo men or en el plan o vertical (elevación) y regular para la distan cia. los sen t ido s y deducir de ellos un a representaci ón útil del amb ien te ex terior. En
La localización espac ial es el resultado del procesami ento co mbina do de la vida d iaria no percibimos los rasgos del son ido -altura, sonoridad, timbr e,
datos. Para fuentes acústicas corri en tes los datos de scriptos en este capítulo dur ación- de modo aislado , sino q ue los integram os en la representación de
son acces ibles simultáneame n te , al men os en c ircunsta nc ias nor males. Es esta fuentes acúst icas u objetos aud it ivos. U na parte importante en el proceso es
riqueza de informac ión, muchas veces red und ante y reforzada por dat os v isua- decidir qué partes de la estimulación sensor ial corresponden al mismo objeto
les, lo qu e hace la locali zac ión más precisa y co n fiable. o evento ambienta l. La for ma fina l de cada representación mental de un ob-
Un capítu lo aparte podría ded icarse al d iseñ o de ca mpos acúst icos virt ua- jeto -visual o aud it ivo- for mado a parti r de un c ierto agrupa m iento de dat os
les. Todos los imp lementados hasta aho ra, desde los dispositi vos mo notón icos sensor iales, es una prop iedad eme rgente. Esta propi edad no co rrespo nde a n in-
hasta los actua les a lgor itmos de espac ialización para cine y multimed ia, pasan- guno de los dato s to mados de man era ind ividua l y surge a partir de n uestra
J o por la este reofon ía bicanal, hacen uso de las ci tadas cap acidades aud itivas. capacidad de orga nizac ión psíquica de los datos. La ci ta de Hel mholtz repro-
En algunos casos, la contradicción entre dato s de en trada (por ejemplo, una duc ida en el cap ítu lo 11 (" [•••] esta mos muy bie n entrena dos para evaluar los
lID que corresponde a una fuente a la izquierd a del oyente co n una de ITD re- objetos que nos rodea n, pero fallamos co mpleta me nte cuando intentamos ob-
laciona da con la m isma fue nt e ubi cada a la izqu ierda) puede degrad ar e incl u- servar las sensa ciones per se [...]") alca nza aquí plen a sign ificac ión.
so destruir la local ización auditiva .
l . ECOLOGÍA ACÚSTICA Y ANÁLISISAUDITIVO DEL ENTORNO
A lbert Bregman llamó análisis auditivo de escenas al proceso que permite reu -
nir en un a un idad perceptiv a e l conj unto de datos provenie n tes de un a fue n-
te acúst ica exte rna (Bregman, A ., 1994). Estrict am ente, cada oído no recoge
más que los cambios te mporales de la presión acústica en el tí mpa no que le
cor respo nde. U n agregado auditivo es, según Bregman, la asociación de las par-
tes del espec trog rama neu ronal (conjunto de datos sensor iales) que parecen
perte ne cer a un mismo eve nto perceptu al. Una fuente acúst ica es un a entidad
K Por ejemplo, Dolby-Surround, Dolby-D igital, THX, A mbisoni cs y muchos otros. física que genera ondas en el aire. U n agregado audi tivo es un percep to cau-
2 14 2 15
sacio por un grupo de elementos sonoros que se experimenta como un todo y mo gráfico. Es muy difícil distinguir cada comp on ente en la mezcla final, pero
que parece ema nar de una única fuente acústica externa. ' Normalmen te, las real izamos esta operación inmediatam ente con el oído (si pudiéramos reprodu-
propiedades emergentes que definen cada agregado están correlacion adas con cir las seña les en un equip o de audio) gracias al proceso de agrupamient o per-
las propiedades de los objetos físicos asociados. ceptu al. Cada una de las fuentes co rresponde a un solo agregado acúst ico.
En visión se pued e describir el problema del aná lisis ópt ico del ambiente Parece haber diferentes mecan ismos de segregac ión auditiva q ue respon-
en té rminos del correc to agrupamiento de las regiones est imuladas en la ima- den en funció n de la tarea a realizar. C uando los oyentes intentan manten er
gen ret iniana. En nue stro caso ¿q ué elementos se deb en agrupar para ensam- int egrada en un solo agregado una secuencia de son idos, la segregac ión es in-
blar un son ido o, mejor aún , un objeto acúst ico ? No es posible co mparar las voluntar ia y opuesta a sus int enci on es. Pero cuando los sujetos se esfuerza n en
estrat egias de agrupamiento de amb os sentidos pues existe una diferencia cru - separar los son idos la segregac ión aparece como un proceso de selecc ión pro-
cial en el modo en que usamos la en ergía acústica y la lumínica para obtener vocado por la ate nc ión . La existe nc ia de estos dos mecani smos explica los di-
información del mund o ex te rior. En audición, hacemos uso de la ene rgía emi- ferentes resultados que se ob tiene n en las pruebas experim entales cuando se
tida por los objetos (las fuentes acústicas) y cas i no to mamos en cuenta la varía alguna ca racterística acústica en la seña l de ent rada . Las diferencias t ím -
ene rgía reflejada en ot ros objetos físicos. Se podr ía afirmar que ex isten al me- bricas ent re sonidos musicales, por eje mplo, faci lita n mucho la segregación.
nos tantas fuentes acústicas como objetos sonoros en una situac ión n orm al. Pero si la secuenc ia se basa en ot ro factor de agrupamiento diferente, como
Las reflexiones -que cambian en funci ón del contexto espac ial- degradan la puede ser la variación de la altura to na l, las diferencias tímbric as no provocan
inform ació n que nos llega de cada una de las fuentes. En con secuencia, nece- ne cesariamente la segregación.
sita mos aten uar la información que llega por reflexión y co locar en primer pla- El sistema auditivo emp lea diferentes datos para separar los objetos aud it i-
no la q ue nos llega dir ectamente (en una sala de conc iertos situa mos vos. En lo que sigue describiremos los más destacados. Debe ten erse en cuenta
auditivamente el pian o en el esce na rio, aun cuand o gran part e de su energía que no siempre se utilizan todos los datos en todos los casos: el agrupamiento
nos llega por reflexión desde las paredes y el cielorr aso de la sala). Por el co n - perceptu al no es un proceso a "todo o nada". En una situación comp leja se ob-
trario' la inform ación visual está causada prin cipalmente por la reflexión de la serva con frecuen cia que e l dato saliente enmasca ra y oscurece a los menos
luz en los objetos de interés. Encende mos una lámpara no porq ue nos intere- acent uados, mecanismo que nos permite manten er la eficiencia perceptu al aún
se mirarla, sino para ver por reflex ión los objetos de la sala. A diferencia de la cuando no esté presente toda la información esperada . En el caso del timbre,
gran cantidad de fuentes acúst icas que nos aco mpaña n desde siempre, hub o que depend e de una gran cantidad de ent radas auditivas conc urrentes, el con -
una sola fuente de luz a la vez a lo largo de gran part e de nu estro recorrid o evo - texto juega un papel determ inante a la hora de decidir cuál dato es sign ificati-
lutivo. En resumen , los datos audit ivos y visua les son diferentes y se comple- vo, y cuál no lo es.
mentan para brind arn os un pan orama verosímil del mundo exte rior. El "efecto de cafetería" (o "coc kta il party") pon e de man ifiesto la eficac ia
de nu estra capacid ad para separar los d iferentes objetos audit ivos. Podemos
mant ener una conversación sin inconvenie nt es en un ambien te con gran con -
2. I NFORMACIÓN UT ILIZADA PARA SEPARAR LOS OBJETOS AU DIT IVOS taminación por ruido . Sin embargo, si registramos con un micrófon o dicha
con versación y la reprodu cimos más tarde habremos perdido algunos datos
La fusión o fisión simultá nea de la información audit iva y la construcc ión de esencia les para sepa rar la figura acúst ica del fondo de ruido y el discurso se
agregados son ejemplos de organ ización perceptual. A part ir de el los ana liza- vuelve in intelig ible.
mos el entorno ac úst ico al distribuir los dat os sensoriales ent re los d iferentes A contin uació n descr ibiremos los rasgos de la inform ación acúst ica que
objetos audit ivos potenci ales. Podemos ilustrar la distinción entre los concep- permi ten agrupar o separa r los diferentes objetos ac úst icos entre sí.
tos de fuente acústica y de agregado acústico a part ir de las señales de la figura
l. En ella se ven varias ondas acústicas aisladas que se han reunid o en el últ i- Annonicidad y frecu en cia fu ndamental
I Es una traducci ón (quizá no muy feliz) de auditory stream ("corriente", "flujo") . C reemos, Un con junto de parcia les perfecta mente armónicos tien den a fusiona rse en un
sin embargo. que el ténnino "agregado " describ e ace ptab lemente la idea de Bregman . solo artefacto percep tual, pues compa rte n la misma altura to na l, definid a por
216 217
-t
-a Voz humana
la componente fund amen tal de la serie. De acuerdo co n este criterio, si dos es-
-3
-4
tím ulos simultáneos de espectros perfectamente armónicos tienen diferentes
-6
frecuencias fund am entales, se oyen sepa rados .? Una desafin ación de! 3% es
~ =~~
-O -21 suficien te para qu e un armó n ico se perci ba segregado de! complejo (siempre
.:3 - 1+t-+++++l+I--H
:.a.E -2 1
-15
que su dur aci ón exced a los 400 ms) . Para el son ido complejo resta nte , e! efec-
<t: .~~
to de la desafinación de! armón ico es sim ilar al que oc urre cuando se reduce
-.
-4 e! nivel del armó n ico en cuest ión hasta vo lverl o inaudible. La fusión por ar-
-3
-a
-t L- --'- ----'--_---' monicid ad fue uti lizada desde e! medioe vo para combinar los registros de ór-
~~O M ' ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ l gano y co nsti tuye un recurso clásico en orquestac ión .
Tiempo (segundos)
-,-z
-3 Impresora Disparida des en el ataq ue
-4
-6
i ~ M'6.4J.'-l(lt\.A ~Lt!LJuJu AAfuA_~.Il.h- .Aful~f1lAI/\\f~¡v-¡:HH

a.
E =~ ~
-21
I
~ r~v ~
1
,vv ' ''W ~I VIJ\,J " ¡V Y~V 1V - y
, :
V' VlJ IYV V V ~
!
Rasch in vestigó la h abilidad para o ír un son ido co mplejo en presencia de otro
semejante (R asch, R. A. , 1978) . C uando la única diferencia entre ambos es la
frecuen cia funda me ntal, la seña l debe estar por enci ma de los -20 dB respec-
<{ -9 ¡
-6
to de! sonido en mascarante. Pero si la seña l co mienza 30 ms antes del en mas-
-4
carante, se la perci be aun cu and o su n ível llega a ape nas -60 dB (figur a 2). La
-,-,
-3
seña l puede seguir percibiéndose aun que cese de inmediato después del ataque
~~~ 15~~~~~~~~~~~~~~~~~ 1
Tiem po (segundos) del son ido en masca ran te (este efecto se relacion a co n e! fen óm en o de co nt i-
nuidad que veremos más ade lan te j.! El va lor de 30 ms cor respo nde apro xima-
-,
-t
Alarma
-3
-4 damente a las imp recisiones de ataque qu e se encuentran co n frecuencia en la
-6
música instrume n ta l. Esta capacida d de agrupa miento por disp ar idad en e!
ataque refue rza la idea trad icional de que las asincro n ías son un factor impor-
tante en la percepción sepa rada de las voces en la música polifónica.
En un experimento relacion ado co n las disparid ade s temporales en el ata-
qu e, Rob erts y Moore dem ostr aron qu e sin usoides extra ñas agregadas a un a
-4
--,, L-
·3
.....J
vocal pued en influir en su ca lidad t ímbrica, pero qu e esta influ encia se redu -
0,005 0,010 0,015 0,020 0,025 0,030 0,035 0,040 0,045 0,050 0,055 0.000 O,CM 0,070 0,075 0,000 0,005 coso 0.095 0,1 ce not ab lemente si el elem ento ex traño apa rece antes o después del in icio de
Tiempo (seg undos)
la voca l - se segrega de ella (M oore, B., 1997) .
-,-a
Mezcla
i¡~l\~.~W~
Contraste con sonidos previos
La perc epción de un estí mulo es afectada por los estí mulos inmedi atamente
precedentes. En gene ral, al nuevo estí mulo se le resta algo así como e! "nega-
tiv o espectral" de los anter iores.
-4 - ¡ I I
-3 •
.,-,
L-_ _~_--'-_"._"._"._".__=_=_=_=:_:_:':
_==_==_=:_:'
2 Las relacion es entre espec tro ar mó nico, periodic idad y ton icidad se ex pon en en el
Tiemp o (segundo s) Apé nd ice I.
3 Algun os canta ntes lo util izan para conseg uir pianissimos sorpren dentes (y, est rict amente
Figu ra 1. C uatro seña les sepa radas reunidas en el último gráfico ha blando, inaudibles a no ser por el mecanismo citado).
218 219
Enmascarante
1I1\1 \
\
"tJ
.~
a.
'11
E
<l;
.'
,----"~'---...,
"tJ
.€
a.
E
<l;
: Señ al
Tiempo
1/ I \ Frecuencia
Figura 3 . Espec tro de potencia de dos seña les suces ivas. El tercer gráfico representa e l
Figura 2. Experimento de Rasch espec tro perc ibido por e l oye nte
Tam bién se ver ifica un efecto similar cuando oc urre un cambi o en el estí- Localizaci ón de la fue nte
mulo, que puede ser interp retado co mo que el estímulo de par t ida se sustra e del
csr lmu lo fina l. El rasgo modificado se separa perceptualmente del resto y la par- Mu ch as veces las d iferencias espaciales juegan un papel importante en el an á-
te del estímulo que permane ce est able se reduc e hasta su nivel de adaptac ión. lisis aud itivo del entorno al facilitar o dificultar la segregac ión basad a en otros
Un eje mplo notab le de lo an te rior se da al o ír un estímulo con un a estruc- fact ore s." Sabem os, por ejemplo, qu e un a seña l se detect a con mayor faci lidad
rura espec tra l particular, seguido in med iatament e por ruid o blan co (espect ro cuando su ubicación espaci al difiere de la del ruido enmascarante.
plan o) . El ruido blanco aislado puede ser descri to co mo "no coloread o". Sin Shackleton y sus colegas inve stigaron la habilidad para identificar cada
embargo, en la secuenc ia completa se oye un a estructura espec tral "col orea- vocal en un conjunto de dos voca les conc urren tes. Encontraron que una dife-
da" , q ue co rrespo nde al espectro de la primera señal in vert ido (figura 3 ). rencia de frecu encia fund amental entre las do s mejora la identificac ión en un
22%, mientras que un retardo de 400 Ils --corre spondientes a una diferencia en
C orrela ción de los cambios en amplitud y frec uencia azimut de 45°-la mejora sólo 7% (Shack leton, T. M. et al., 1992) . En resumen,
el mecanismo de segregació n espectral parec e ser más poderoso que el espacial.
IZasch tamb ién notó que , aun cuando dos sin uso ides co miencen en sincro n ía La pregunta es, entonces, ¿por qué los human os no le dan prioridad absolu ta al
es posible ac rece ntar la separación perceptual modulando en frecuen c ia la m ás índ ice espacial ? Y la respuesta se enc uentra en la base de nuestra estrateg ia au-
aguda (R asch, R. A., 197 8) . Este proc edimiento permite reducir el umbral de ditiva, centrada en la percepción de fuentes y no de reflexiones acúst icas. Las
pe rcep c i ón de la seña l de mayor frec uencia en 17 dB . En realid ad , el experi- seña les provenientes de la fuente pued en haber sido reflejados muchas veces en
ment o de Rasch no es más que un caso par ticu lar de una característ ica gene-
ra l de la percepción aud it iva: los son idos qu e presentan ca mbios "co herentes" 4 Recordemos que la localización de la fuente se refiere al mund o físico mientras que la la-
tiend en a fusiona rse perceptualm ente, mien tras los qu e presentan variacion es teralización de l son ido pertene ce al uni verso de las representac iones me nta les (véase el ca-
incoh erentes entre sí tienden a segregars e, pítu lo VII ).
220 221
fati zar part e de la infor mación cuand o e l contexto -o la tarea imp uesta- se lo
demanda. En algunas ocasiones la local ización (o la lat eralización) del son ido
ocupa un lugar fund amental en la segregación de los objetos auditivos . Un
buen ejemplo lo brinda nuestra ca pac idad para man tener una co nversación en
ambientes muy ruid osos.f
Peri odicidad y fu sión perc eptual
Un patr ón temporal perfect amente regular, q ue repi te exact amente igual en

tiemp os iguales, es periódico, mientras q ue un o q ue presenta peq ueñ as varia-
cion es en su período o amplitud se define como cuasi periódico. En la figura 5
se aprecian las diferencias en sus correspon die nt es gráficos tempor ales.
Las seña les que se emplean en los experimentos psicoacúst icos tradicio-
Directo nales son, a los efecto s prácti cos, razonab lemente per iódic as. Están gene radas
Primeras
por medios electrón icos y es prácti ca mente imposib le hallarlas en la naturale-
ce reflexiones za o en las ondas de los instrum entos de música no elec trónicos. Las señ ales
:3.
"tJ
ro cuasi periódica s, por otra parte, son típicas en esto s últ imos casos ." El sistema
"tJ
.¡¡;
c:
Reverberación auditivo es muy sens ible a las seña les cuasi periódic as al ser capaz de detectar
al
E pequeñ as variaciones del orde n de una fracción de período. Estas variac iones
son impuestas por las alinealid ades de las fuent es acústicas. En el caso de la
o nempo(ms) música, aparecen tanto en el instr umento como en su ejec ución y a vece s se
las agrega in ten cion almente en la forma de vibrato o trémolo. El sistema au-
Figu ra 4 . Patr ón de reflexiones en una sala mediana y gráfico tempo ral de la ene rgía que ditivo emplea de manera provechosa las pequeñas aperiodicidades menciona-
llega a un secto r de la platea das para fundir perceptua lmente los estímulos que le llegan . C uando recibe
peq ueñas variacio nes sincronizadas en paralelo tiend e a o írlas com o si estuv ie-
ran originadas en la misma fue nte, fenómen o relacion ado con la ley de destino
el ambiente, o pueden haber sido aten uados por la presencia de un objeto cer- común de la teoría de la G esta lt.
cano, hech os que deforman la infor mación relativa a su posición . En la figura Tomemos por ejemplo la emisión voca l en un cantante. S iempre ex iste n
4 se ilustra esta aparente con fusión de fuentes reales y virtuales. pequ eñ as irregularidades en e l flujo de aire que llega desde los pulmon es; ha y
El efecto de precedencia (o efecto Hass) nace de la nec esidad de localizar vibracion es no contro ladas en los músculos de las cuerdas voca les; aparecen
uní vocamente cada fuente acústica aún en presencia de un gran número de re- turbu lenci as no lineales en el tracto vocal y concurren desajustes en la adapta-
flexion es ternpran as.P En el experimento de Shack let on y Meddi s las refle- ción de impedancias ent re el co mplejo buconasa l y el exte rior. Como conse-
xiones no mod ifican la frecuencia fund amental ni las relac ion es armón icas cuencia de estos facto res el conjunto de armónicos es modul ado irregularmente
de cada vocal. De hecho, en un contexto norm al las señales no armón icas y de en frecuencia (Ujitter" ) y en amplitud (Ushimmer" ). A l aplicarse ambas modu-
banda ancha son las que aportan la mayor parte de la información espacial. lacion es al total de la seña l, el efecto fina l es la percepc ión de un solo objeto
A unqu e la necesidad de atenuar el efecto de las reflex ion es explique la men or audit ivo, la voz de tal o cual cant ante en particular.
import ancia relativa de los datos espac iales fren te a otros más estab les, es ne-
cesario recordar la capacidad que posee el siste ma auditivo par a atenuar o en -
6 Tal es el caso del "efecto de cafete ría" ("coc ktail part y'') .
7 En la actualidad se sabe que posee n un co mpo rta miento caó tico y no estocást ico, como
\ Tema desarrollado en e l capítulo VII. se creía hace un tiemp o.
222 223
Es muy sencillo realizar el siguiente experimento: se generan digitalmen-
+ te tres series armón icas con la misma fundamental, que se funden perceptual-
c:
-c
'¡¡;
mente en un solo objeto acústico -se oyen com o si estuv ieran origina das en la
~ misma fuente. Si a cada serie armónica se le agregan pequeñas fluctu acion es
a.
no correlacionadas (que pueden ser tres vibratos diferentes), cada serie se se-
para de las restantes y se las oye com o si provinieran de tres fuentes distintas
emitie ndo en uníson o.
Los siste mas audi tivo y visual parecen trat ar la periodic idad y la simetría
+
c: de un a man era similar, pero co n diferente grado de resolución . Por eje mplo ,
-o
'¡¡; la vista no de tecta con facilidad la aperiod icidad de la segunda seña l de la fi-
~
a. gura 6, al no contar co n la ayuda de las líneas que indica n los períodos que
aparecían en la figura 5. Tamp oco nos percatam os in medi ata mente de que tres
de los edificios son men os simé tricos respecto del eje ce nt ral que los otros dos.
El siste ma audit ivo, en cont rapart ida, detect a inm ed iat amente un grado simi -
Figur a 5. Comparación enr re una seña l per iódica y una seña l cuasi periód ica
lar de disparidad .
Tanto el sistema visual como el audit ivo pierden par te de su capacid ad de
at ención -se podría decir que se "descon eét an"- cuando aparecen simetrías o
periodicidades perfect as, aún dur ante un tiemp o breve, y fallan a l intentar ex -
+
c: traerles información relevante.
-o
'~
a.
r-t--t-\-+--+-/-t-+-+--,I-+--+--4-r-....:......
Percepción de secuencias rítmicas
Numerosas ex perienc ias co mpro baro n que la fusión y fisión perceptu al de

eventos repetitivos depend en del int ervalo de tiem po que medi a ent re cada
+ ocurrencia ..En una escala temporal media, del orden de las décimas de segun -
c:
-o do, se habla de secuencias rítmicas. En un contexto acústico cotidiano muchas
'~
a.
t-t--t---i-++++-+-\-+--+-+-+-....-....:,....... secuenc ias de sonid os son rítmicas, y es de esperar que ex istan mecani smos
perceptuales específicos q ue las contemplen. Por eje mplo, si un pat rón audit i-
vo es rítmi co, entonces ciertos aspec tos del mismo result an tem poralmente re-
dundantes. Una vez que los elementos tempran os que defi ne n el patró n son
••
•• ••
••
adve rtidos , los subsiguientes puede n ser anticipados. Handel demostró, en se-
cuencias repetitivas segmentadas por pausas, q ue el principio de agrupa mien-
••
•• ••
••
to per ceptual pred om inante se basa en la estruct ura tem po ral ; otros
parámet ros, com o la altura tonal, pasan a segundo plan o (H andel, S., 1989) .
••
•• ••
•• En otras palabras, la estruct ura temporal -Handel la llamó timing- de los ele-
••
•• •• mentos es más importante para determinar el ritm o subjet ivo que la estructu-
• ra interna de cada grupo.

Por el contrario, cuand o oímos secuencias rápid as (m ás de 10 eve n tos por
Figu ra 6. Percepci ón visual de la periodic idad y de la simetría. Las ondas son las mismas segundo) los sonidos no se agrupan de ac uerdo con su orden tem poral físico,
que en la figura 5, pero sin línea s de referencia sino de acuerdo con cie rtas ca racte rísticas comunes como la altu ra to na l o el
224 225
timb re. Si la secue nc ia se perci be como un todo se prod uce fusión rítmica, y in te rna lizado y operaría aun si el auditor no está familia rizado con la señal fí-
cuando apa rece dividida en varios pat ron es diferentes se produc e fisión rítmi- sica en un caso particular. Que el siste ma audi tivo interpreta una transforma-
ca. Bregman sugirió que cada agrupamiento producido por la fisión rítmica co - ción súb ita de las prop iedade s ac ústicas co mo el inicio de un a nu eva seña l, o
rresponde a un objeto audi t ivo diferente. Dowling dem ostró qu e la que haber oído previamente un son ido pot encia la percepción de su ocurren-
segregación ocurre también cuando las seña les sucesivas difieren en intensi- cia futura , son hech os que nadi e cuestiona. Aunque nosotros nos inclinamos
dad o en ubicación espacia l.f por el modelo acústico, la propuesta de Ca doz no deja de tener cierto atract ivo.
A lgunos co mposito res -no tablemente Bach- han aprove cha do la segre- Las regularidades físicas han sido corroboradas experimentalmente y son una
gació n prod ucida en sonidos muy separados en frecuenc ia -por eje mplo en las buena guía práctica, aunq ue qu izás no deriven de una co mprensió n perceptual
¡Jarritas para violín solo-, o la fusión de los son idos de dos instrumentos en una profu nda de la natur aleza de los procesos físicos invol ucrados.
sola melodía (para que el efecto tenga lugar los instrumen tos de ben ten er tim- De ac uerdo con el modelo físico, las regularidades que pueden emp learse
bres y locaciones similares) . para agrupar element os en un úni co objeto aud itivo son:
• Regular idad 1: es ex tremadamente raro que dos son idos, que co mien-
Percepción del orden temporal ce n y te rmine n exac ta men te al mismo tiempo, no posean alguna relación en-
tre sí.
Puede ser difícil esta blece r el orden temp oral de sonidos que parecen provenir • Regularid ad 2: progresión de una transform ación : a) las propiedades de
de diferentes fuentes acúst icas. Las person as no en trenadas necesitan duracio- un son ido aislado t ienden a modificarse de man era continua y lenta; b) las
nes de 200 ms para esta blecer el orden de cuatro eventos no relacion ados y prop iedades de una secuenc ia de son idos to mados de la misma fuente t iend en
muy diferentes. Este result ado qui zá provenga de la segregació n en d iferentes a modificarse lentamente.
corrientes audi tivas, donde los soni dos pa rece n flotar un os con respecto a • Regularidad 3: cua ndo un cuerpo vibra per iódica mente, sus vibraciones
otros en el t iempo subjetivo. dan nacimien to a un patrón acústico do nde las frecue ncias de las componen-
G iovanni Vicario demostró que no es posible ordena r temp oralm ente dos tes son múlt iplos de una misma frecuencia fundamen tal.
corrientes de son idos de alta y baja frecuencia cuando la separación exce de las • Regularidad 4: la mayor ía de las mod ificacion es que afecta n a una fuen-
tres octavas." En su experimento, cuan do los sonidos sucesivos se un ieron co n te ac ústica afecta a todos los compo nentes del son ido resulta nte, de man era
glisados en frecuen cia la tend en cia a separarse en diferentes co rrientes se re- idént ica y simultá nea .
dujo, aun cuando los glisados no fueran completos . La co nt inuidad perfect a
ent re tonos no es necesaria para reducir la fisión en tre las dos secuencias: si un El fen óm en o de reducción del enmascaramiento por com odul ación con s-
ca mbio en frecuencia "apunta" hacia el próximo son ido , el oyente puede se- titu ye un buen ejemplo de regular idad del tipo 4. 10 En el experimento clásico
guir el patrón de cont in uidad más fácilmente. Las tran sicion es bruscas ta m- de Don ald Hall se emite una seña l sinusoida l superpuesta a un ruido de ban-
bié n ayuda n a ev ita r la segregac ión en diferentes co rrientes aud itivas e das múltiples. Si el ruido se mantien e está tico el sonido de prueba es enmas-
interv iene n considerab lemente en la percepción de la palabra. ca rado, pero si e l ruido en rnascara n te fluct úa sincrónica mente en amplitud, la
percepció n de la señal se restablece. El oyente agrupa a las difere ntes bandas
Re gularidad en los datos físicos de ruido en un solo obje to auditivo a partir de su movimient o co mún. El so-
n ido de prueba, está tico, se segrega del resto .
Los teóri cos que propon en el modelo físico para describir la repre sentación
mental de un o bjeto auditivo, co mo C laude Ca doz, sost iene n que aprove cha - Redundancia de la información
mos ciertas caract erísticas de las fuentes físicas para compone r el an álisis au-
ditivo de esce nas (C adoz, C. et al., 1993) . Este mecani smo sería luego Como hemos visto , ex isten muchas estrategias de agrupamien to e interpret a-
ció n de los dat os sensoriales. Esta multiplicidad es necesaria porque cada un a
8 Dowling (I968) , en Moore, B. (I 997).
9 Véase este tema en el puma 4 del capítulo IV. \0 Véase este tema en e l puma 5 del capítulo 1lI.
226 227
de ellas, por separado, está sujeta al error. Por ejemplo, la estrateg ia que agru- necesario para exp licar por qué los seres h uman os vemos el mundo co mpue s-
pa los sonidos por su origen espacial puede ser ineficaz en amb ientes muy re- to de objetos distintos. La capacid ad de percibir objetos -piedra s, árboles, la-
verberantes. La que se basa en relac iones armón icas puede fallar si se dr idos o viento- debía esta r originada en operacio ne s efectuadas por e l sistema
enc uen tra con son idos ina rmónicos o ruidos de banda . Las que busca n simili- nervioso central. Advert ir que la percepción de objetos sepa rados no es sólo
tudes secuencia les pueden ser burladas ante son idos discontinuos o cambi an- producto de .las sensaciones periféricas fue una de las más import antes cont ri-
tes. La utilización en paralel o de varias relac iones de agrupamiento co nst ituye buciones de la escuela de la Ges ta lt.
hab itualmente una protección contra el fallo de una de ellas. C uando la in- Según la teoría de la G estalt los hechos psíquicos son formas, unidades or-
formación que recibe es contradictoria, el aud itor simplemente se puede de - gán icas que se ind ividua lizan en el ca mpo espacial y temporal de percepci ón
clarar incapaz de penetrar los comp lejos sonoros. La ex tre ma rareza de tale s o de represent ación . Las formas dep enden, en el caso de la percepción , de un
casos test imonia la potencia de análisis de l siste ma auditivo human o. conj unto de factores sensori ales objetivos. La percepción de las diferentes cla-
ses de elemen tos y de las diferentes clases de relacion es corresp onde a de ter -
min ados modos de organ ización de un todo , que dep ende a la vez de
3. PRINCIPIOS GENERALES DE ORGAN IZACIÓN PERCEPTUAL cond iciones objet ivas y subjetivas. La corre spondencia que se pued e estable-
y T EORÍA DE LA G ESTALT cer entre las partes de un todo articulado y cie rtos elementos objet ivos no se
mantiene, en gene ral, cuand o esos mismos elemen tos pertenece n a otro con-
Junto a sus descubrimientos fundacion ales en física y fisiología de la percep- junto objetivo. En otras palabras, una parte en un todo es algo dist into a esa
ción , Helmholtz es conocido también como un precursor de la psico logía cog- part e aislada o en otro todo, a cau sa de las prop iedades que deb e a su lugar y
nitiva. Formu ló el principio de la inferencia inconsciente, que establece que función en cada un o de ellos. El ca mbio de un a condic ión objet iva puede pro-
nuestro sistema visual "construye" objetos tridimension a les a partir de los da- ducir un cambio local en la for ma percibid a, o traducirse en un cam bio radi-
tos presentes en el espaci o bidim ensiona l de la ret ina . A parti r de l princi pio ca l de la forma emergente.
de Hel mholtz se desarrolló la teoría de la Ge stou. Ésta se in icia en 191 2 con un El objetivo inicial de la teoría de la Ge sta lt con siste en esta blecer, por
art ículo de Max Werthe imer sobre el mov imie nt o aparente, que exp lica la ilu- medi o de la ex perienc ia, un conjunto de condiciones de existencia de las for-
sión que posibilita la existencia del cine. El autor deduj o que la percepción de mas perceptuales y de leyes de transformación de dichas form as. Para que és-
un todo (el movimiento) era radica lmente diferente de la percepción de sus tas se muestren eficaces no es necesario que exista una corre spondencia
component es (las imágenes estáticas). La teoría tuvo un gran desarro llo du- rigurosa entre los elementos del estímulo objet ivo y los elem entos de la form a
rante los siguientes 50 años . Sin embargo, aunq ue la descripción de los fen ó- -de hech o, la cor respondencia di rect a gene ralmente no ex iste y, en tod os los
menos percept uales post ula da por los gest a lti stas no ofrecía rep aros casos, no se mantie ne constante.
impor tantes, la argumentación teórica se mostró insuficiente para fund amen- Los teóricos de la escuela afirmaro n que el proceso fisiológico que result a
tar sus leyes y la escuela cayó en cierto descrédito en la déc ada de 1970. En la de un conjunto de excitaciones tiende a organ izarse espon tá nea ment e si-
act ual idad, se han retomado sus principios generales de orga nizac ión percep- guiend o ciert as leyes de estru ctura, independientes en principio de las sign ifi-
tual, que describen a grandes rasgos las carac terísticas de la percepción , pero caci ones agregadas por la ed ucación. En la ac tua lidad existen teorías sobre la
se han dejado de lado los modelos exp licativos orig ina les. Casi todos los psi- percepción que contradicen tal afirmación. Se rán comentadas más adela nte.
c ólogos especializados en la percepción ace ptan hoy la operat ividad de las le- Los tr abajos de los psicólogos gestalt istas llevaron a enu nciar cinco le-
yes de la G estalt , aunq ue las justifican a partir de proceso s y mec ani smos yes y dos principios generales qu e permiten agrupar los estí mu los qu e pro-
diferentes. vie ne n de una misma fuen te, y segregar los q ue no lo hacen. En general,
Los gestaltistas, a difere nc ia de los estr uct uralistas, en tendía n que la per- un a reg la a islada no siempre perm ite la fusión o fisión per ce ptu al y var ias
ce pción no podía reducirse a una mera suma o ser ie de sensaciones , sino que de ellas deben actua r juntas para q ue emerj a la forma fin al (Ko h ler, Koffka
respondía a la configuración total de la que aque llas forman parte. "El todo es y Sande r, 1962).
distinto que la suma de sus partes" sint et iza un o de sus axio mas básicos, en el En lo que sigue describiremos brevemente las leyes y los principios gene-
que las propiedades emergentes ilustran el concepto gestáltico de organizac ió n rales de organ ización q ue propo ne la teoría de la Ge stalt.
228 229
Leyes de la Ge stalt
Los psicó logos de la Ge stalt centraron sus estud ios en el sentido de la vista.
Co n a lgunas adaptaciones, sus cinc o leyes y dos princip ios de organ izació n se
:lplican también a la aud ición . l l
ro
'0
e
Ql
:J
U
e
u,
• ••• ••• ,.
Ley de fJroximidad Tiempo
Figura 9 . Agrupa mie nto de sonidos por proximidad temp oral

La ley de proximidad expresa que los elem entos cerc an os tiend en a percibirse
como una unid ad. En la figura 7 se aprecia n pares de círculos agrupados por
prox imidad espac ial. Ley de semejanza
En audición la proxi midad puede darse en diferentes di mensiones. Los so-
nidos se agrupan por pro ximid ad de altura, de tiempo, de tim bre o de espacio. La ley de semejanza esta blece q ue elementos idénticos o semejantes (en colo r,
tamañ o o for ma para el sentido de la vista ) t iend en a percib irse agrupados. En
aud ición , la semejanza implica similitud de timbre, altura, sono ridad o locali-
Clrculo s no agrupados zació n espacial. El rasgo que determi na la agrupación perceptual por semejan-
•••••• za depende del co nte xto o de la ta rea impuesta al oyente. Van N oorden
demostró que la similitud de timbre puede impo nerse a la similitud de altur a
ton al, al men os bajo ciertas ci rcunsta nc ias (Van N oord en, L., 1975) .
•• •• ••
Circules agrupados por proximidad
En la figura 10 se observa la ley de semeja nza aplicada a la vista y en la fi-
gura 11 se puede ver el espec trog rama de dos co rrientes perceptu ales agrupa-
das por semejanza tímbrica.
Figura 7. Ley de prox imidad
Agrup amiento por semejanza
ro
'0
e
Ql
ro
'0
e
•••• •• Figu ra 10. Ley de semejanza
:J Ql
:J
•••• ••
U U
~
u, e
u,
•••••• • ••••• ro
•
'0
e
Ql
Tiempo Tiempo :J
U
~ \
Figu ra 8. Agrupami ento de sonidos por proximidad de alt ura
u,
\
Tiempo
11El orde n y aun el núm ero de leyes varía según el auto r que se consulte. El que expo ne-
mos aquí es el m ás frecue nte en la literatura sobre e l tema. Figura 11. Agrupamien to de sonidos por semeja nza de ti mbre
230 231
Ley de cierre
suave y conti nua. Los cambios bruscos indican que una nueva fuente se ha acti-
vado. Por ejemplo, si la alternancia entre sonidos agudos y graves se inte rcala con
La ley de cierre esta blece q ue las figuras incompletas t ienden a completarse y
los glisados en la direcció n adecuada, se reduce la segregación en dos corrientes
a ser percibidas co mo una un idad cerrada. En la figura 12 se ve una serie de
percepruales. En la figura 15 se puede apreciar el correlato auditivo de esta ley.
rect án gulos.
En la voz hab lada, grandes ca mbios inespe rados en la frecue ncia funda-
Bajo ciertas co nd iciones un son ido enmascarado puede o írse como si fue-
mental dan la impresió n de que un nuevo hablante se ha incorpo rado. Este
ra co nt inuo aún sin serlo (e n todo caso, no exis te ev idencia senso rial de su
efecto requi ere un "co noci mie nto" de las reglas norm ales de entona ció n. La
cont inuidad). Se lo sigue "oyendo" aú n cua ndo ha cesado. En la figura 13a
segregació n auditiva produce silencios ilusorios en cada cor riente d urante la
percibimos que la señal de banda angosta no presenta ni nguna solución de
part e de la seña l atrib uida a la ot ra corr iente.
cont inuidad. Puede oc urrir, sin embargo, q ue result e discontin ua en los tramos
enmascarados (figura 13b) .
Ley de destino común
Ley de continuidad o de buena forma
Por la ley de dest ino común los objetos que presentan un patrón de movi-
miento común tiend en a percib irse como una unid ad. Ejem plos clásicos son
La ley de con t in uidad estab lece que los ele mentos q ue forman parte de un pa-
las bandadas de pájaros o los grupos de maratonistas.
trón cont inuo tie nde n a percib irse co mo una unid ad. En la figura 14 ve mos
Esta ley es de eno rme importanci a en audición. Los diferentes componen-
dos líneas que se cruzan, aunque son pos ibles o tras configurac iones.
tes en frecuencia proveni entes de la misma fuente acústica varían usualmente
Esta ley, aplicada a la audición , hace uso de nu estro conoc imiento de las pro-
de una man era cohere nte. Tienden a comenzar y terminar juntos, cambian de
piedades físicas de las fuentes acústicas que mod ifican sus pará metros de manera
int en sidad a la par y altera n sus frecuencias de manera asociada. Por eso si dos
Ag rupamiento por cierre

A Con tinuidad A-O Y c-a
~ s
[ ] [ ] [ ] [ ] [ ] C > < = __ __ O
Figura 12. Ley de cierre
Figura 14. Ley de continuid ad
III III
• • • • •• • ••
°ü °ü
c:
1Il
::>
u
c:
1Il
::>
1\ III
u
e
u.
e
u. V V 'o
e
1Il
• •
::>
u \
• \
1Il
Tiempo Tiempo
u:
• • •• • \
al Con enmascaramiento b) Sin enmascaramiento

Tiempo
Figu ra 13 . Ley de cierre para una secuencia de sonidos
Figura 15. Ley de continuidad en dos secuenc ias de sonidos
232
233
Circulos agrupados por movimiento común
Figura 16. Ley de dest ino común (las ondas do bles representa n movimien tos en paralelo)
• • • • • • • • • • • •• • • •• • • •• • • •
Figur a 18. Figura y fond o
•• ••
.. .. : ..• • • • • •
••••
• •• G racias al pr inc ipio de figura y fond o se esta blece un a jerarqu ía entre los
objetos de in terés y el med io neutro que, aunq ue pueda estar const itu ido por
exc itac iones comp lejas y heterogéneas , es desplazado a un grado inferior de di-
Tiempo feren ciación . La segregación percep tua l entre figura y fondo no ocurre de ma-
Figu ra 17. Agrupamiento de sonidos por movimiento común nera mecán ica. A l oír una conversación o una melodía en un amb iente con
un gran ruido de fond o, seguim os al objeto aud it ivo que cont enga mayor sen-
tido en funci ón del contexto o de nuestro interés partic ular. C uando los índ i-
o más componentes de un son ido complejo expe rimentan el mismo tipo de ces de diferen ciación no son evidentes se producen figuras ambiguas o
cam bios al mismo tiemp o, son agrupados y perc ibidos como provenient es de la ilusio nes figura-fo ndo, situaciones que se aprovechan en e l mimetismo y en el
misma fuente. En la figura 17 las dos líneas melódicas que se mueven en para- camuflaje.
lelo tienden a agruparse ent re sí. El principio de pertenencia (t am bién conocido como principio de corres-
Con relación a la ley de 'destino común, hay dos fact ores que se destacan ponde ncia ) expresa que si un compone n te simple es usado para la form ación
a la hora de sintet izar sonidos para crear nuevos objetos auditi vos. El prim ero de una co rriente perceptual, no puede emp learse en la formación de una se-
tie ne qu e ver con la forma y sincron ismo del ataq ue, y el segundo con la sin- gunda corr iente. En la figura 18 no pueden verse a la vez la copa y los rostros .
cro nía de las modulacion es (de amp litud o frecuencia) en el desarrollo te m- Parece que ate ndem os a una corriente perceptual a un tie mpo, y el resto for-
pora l de los compo nentes que se pretende n agrupar. ma parte del fon do. A lgunos autores han aceptado, no obstante, que el prin -
cipi o de pertenencia auditivo puede debilitarse en ciertas ocasiones: un
Principio de figura y fondo elemento sonoro puede oí rse com o parte de más de una corriente perceptiva. I
En el caso de las tex turas po lifónicas se ha prop uesto la posib ilidad de perci- \
Ten emos la capacidad visual de distin guir una figura del fond o contra el cual bir más de una figura a la vez. I
aparece. Tambi én somos capaces de distin guir la melodía que ejec uta un solista El papel de la atenc ión es determinante en la selección de los ele mentos "
destacada por sobre la masa orquestal y de comprender el discurso de locutor de que van a formar part e del obje to acústico que ocupará la función de figura.
radio a pesar del ruido de fond o. Sin embargo, todos estos estímulos nos llegan La ate nc ión actúa sobre la ent rada auditiva para seleccionar ciertos rasgos del
desde el campo perce ptivo periférico sin jera rquización alguna. En la conoc ida son ido para su aná lisis co nsc iente. Empleamos nu estra sensibi lidad a los cam-
imagen de la figura 18 se pueden ver alte rnativamente dos rostros o una copa, bios en la seña l acúst ica para dirigir la ate nci ón hacia nuevos y pote nc ialmen-
según cuál de los campos visuales consideremos como figura y cuál como fond o. te impo rtantes eve ntos del ento rno. Cuando un aspecto del son ido cambia,
234 235
mien tr as el resto se mantiene co nsta nte, llama la atenció n del oyente: se co n-
viene en figura. El efecto "cocktail party" o la audición de una voz que se des-
taca del resto en una pieza polifónica son buenos ejem plos de elecciones
nrcn ciona les. Neisse r sugirió que la ate nc ión aparece una vez real izado un aná-
lisis preatentivo de las diferentes corrie ntes perceptivas (N eisser, u., 1967 ).
Sin embargo, este proceso no es de un solo sentido : se sabe que la ate nció n
puede influir en la form ación de cor rientes perceptivas.
Prin cipio de pregrumcia
El principio de pregnancia fue formulado por Koffka del siguiente modo: "la or-
ganización psicológica será siempre tan excelente como las cond iciones domi-
nant es lo permitan " (Guill aume, E , 1975). Se ent iende aquí por "excelencia" a
la intervención de propiedade s como regularidad, simetría, armonía de conjun-
to, homogeneidad, equilibrio, máxim a sencillez, etc. En otr as palabras, para agru- Figur a 19. Triángulo de Kanizsa
par el campo perceptu al recurrimos a la men or cantid ad posible de información .
Este principi o opera empleand o simultánea mente varias leyes de la Ges talt,
En la figura 19 se ha dibujado el trián gulo de Kani zsa. La interpreta ción
más eco nó mica en términos de informació n es supo ne r que ex iste un triángu - Como se escribió :
lo blanco que se supe rpone a tres círc ulos y al trián gulo delineado, y no la mu-
r-""-:::I
cho más compleja e improbable alineación de tres ángulos y tres pac man.
En el enmasca ramiento por ruido ocurre algo similar. Es más eco nó mico Violín I
1 .10
.
en términos de información supo ne r que el sonido en masca rado cont inúa en O I tf · I
I....J
presencia del ruido, que interpreta r una comp leja operac ión sinc rónica de ac -
tivaci ón-desac tivac ión. j .10 ~
Se puede aprecia r un eje mplo notable de agrupamiento, en el q ue inter- Violín 11
,) ~---.---
viene n varios prin cipios gestá lticos a la vez, al comienzo del movimiento fina l lo.--"
de la sexta sinfonía de Tchaikovsky. En el siste ma superior de la figura 20 se
ven las partes de los vio lines 1 y 11 tal como figuran en la partitura, mientras
que en el segundo siste ma está escrito lo que casi todos los oyentes perciben. Como se percibe :
En este caso se opo ne n entre sí algunas de las leyes de agrupamiento exa mi-
1 .10
nadas. Por semejanza tímbrica y de alturas se fusion an los son idos provenien-
Violín I
tes de ambos grupos instrumentales y luego se reagrupan de acuerdo con el
princip io de pregnancia. En esta segunda fase intervienen las leyes de conti- 4J
--= I
nu idad y cierre junto a un principio de cohesió n estructura l llam ado ilusión de

escala por Diana Deutsch (1975) .
Es posible acentuar la ambi güedad perceptual del pasaje agregando un
Violín 11
I'¡ 10
I
- tf ' ., .---.---
' 1}
compone n te espacial si se dispon e la orquesta en el escena rio de tal modo que
los primeros y los segundos violines queden alejados ent re sí, a ambos lados del Figura 20 . Reagrupam ient o melódico en el cuarto movimien to de la sexta sinfon ía ("Pa-
director, como ocurre en la form ación orquesta l "a la alemana" . r ética") de Tch aikovsky
236 237
Isomorfismo
Capítulo IX
l.os creado res de la escuela de la G estalt trataron de fundamentar su teoría en Percepción del habla
i érmin os fisiológicos. Postularon una conex ión muy direct a entre la experiencia
perceptiva, la fisiología y e! mund o físico a través de! principio de isomarfismo,
que afirma que una experienc ia subjetiva y e! disposit ivo neural asociado rie-
ncn estructu ras formales similares.
Se trata cla ramente de una postu ra monista en la que los procesos físicos,
fisiológicos, psico lógicos y cultu rales tien en la misma base rea l: la form a físi-
ca . La física se convierte aq uí en la c iencia funda ment a l a to mar como refe-
rcncia exp lica tiva últim a. Esta co nce pción se manifie sta, por eje mp lo, en las
nu merosas co mpa raciones entre el mundo físico y e! psicológico a las qu e re- Resulta evidente que la percepción de! habla no depende simplemen te de ele-
curre Koh ler: "[...] de! mismo modo que en el campo físico (por ejemp lo e! mentas invariantes accesibles directamente en la onda acústica. Por ejemplo,
campo eléct rico ), en e! ca mpo psicológico hay tam bién una estructurac ión es- los patron es de la señal acústica que corresponden a una palabra se modifican
pontán ea que obedece a princ ipios dinámicos" (Ko h ler, W., 1972).l2 de manera compl eja en función de los sonidos que la preceden y que la suceden,
Para estos investigadores la teoría de las formas físicas y e! isomorfismo y un fon ema que resulta altament e probable en determinado contexto lingüísti-
psicofísico const ituyero n e l asiento teórico de la doctrina. A l afirmar que en co va a ser "oído", aun en ausencia de los datos acústicos correspondientes . El
la naturaleza inorgánic a se enc uentran modos de ser del tipo "formal", libera- reconoc imiento de la palabra depende también de indicadores semánt icos, sin-
ron la barrera que separa los procesos no orgá n icos de los proc esos fisiológicos tácticos y circunstanc iales. La import ancia de estos ind icadores se potencia a
en e! siste ma nervioso cen tral. El marco teó rico fue tomado de la teorí a de! medida que aument a e! ruido presente en e! ca nal de comun icación.
campo electromagnético vigente a principios de! siglo xx . C ite mos nueva- A unq ue este capítulo trata sobre la percepción de! habla, convi ene repa-
mente a Kohler: "[...] los procesos fisiológicos neurales con q ue se asoc ian los sar primero brevement e el mecani smo de fonación human o.
hech os perceptua les está n en cada caso local izados en un medio co nt in uo, y
los hec hos que oc urren en un a parte de ese medio in fluyen sobre los que t ie-
nen lugar en ot ras regiones, en la med ida direct a en que las propiedades de 1. EL APARATO VOCA L Y LA FONACiÓN
am bos se ha llan relaciona das mutuamente [...] a un percepto aislado en med io

de un ambiente homogéneo, le atr ibuimos su ca mpo". Int rod uce entonces e! Las men ores un idades de! habla son los fonemas. El idiom a españo l posee al-
princ ipio de isomorfismo: "las propiedades estructura les de las ex perienc ias rededor de 24 fonemas diferent es que se definen a partir de los sonidos que es
son al mismo tiem po las propiedades estructurales de sus cor rela tos biológicos capaz de producir e! aparato voca l.' En esenc ia, prod ucimos tres clases básicas
y, en últ ima instancia, de! mundo físico" (Kóhler, W., 1972).\3 de son idos dife rentes: las consonantes plosivas, que son seña les transitor ias qu e
En la actua lidad ya no se cree en e! principio de isomorfismo, y hace tie m- se producen al bloquear y luego abrir repe ntina ment e e l tracto voca l; las con-
po que han sido dejados de lado los fundamentos teóricos origina les de la psi- sonantes fricativas, que dependen de la tur bulencia en e! a ire cuando pasa a tra-
co logía de la Gestalt. Sin emba rgo, las leyes de agrupa miento toda vía son vés de una pequ eñ a abertu ra, y las vocales, cuyas ondas son per iód icas y que
empleadas para describi r el modo en q ue percibimos e! mundo ext erior. De to- poseen alt ura ton al defin ida.
dos los int ent os realizados para int egrar estas leyes a un modelo teórico gene - Veamos prim ero, de man era muy sint ética, cómo y con qué producimos
ral, quizá el más interesante sea e! que propon en los creadores de la teoría de esta gran ca nt idad de son idos diferentes.
la percepc ión caót ica.
1 La cant idad de fon emas del españo l depe nde de cada región lingüística y varía levemen -
IZ Trad. de Ju lio G uillén. te, por ejemplo, ent re Madrid , Buenos Aires y La Haban a. Co mo referencia co mparativa,
11 Trad. de Jul io G uillén.
el inglés posee alrededor de 40 fonemas.
238 239
El aparato vocal al
Cuerda s Cuerdas
vocales vocales
El aparato voca l human o se pued e d ividir en tres partes principales qu e son: falsas falsas
un n reserva de aire a mayor presión que la atmosférica, un canal de salida don-
Cartílago Cartílago
ele el a ire pued e ser in terrumpido o modulado, y un a cavidad resonante qu e Tiroides Tiroides
(j lt ni las seña les que se emiten al ext erior. Cuerdas Cuerdas
La reser va de aire a presión, llam ada presión subglót ica , se locali za en los vocales vocales
verdaderas verdaderas
pulmones. Su capacidad prom edio es de tres a cuatro lit ros y puede llegar has-
ta se is d urante un a inspiración pro funda . Movemos alrededo r de med io lit ro
durante la respirac ión pausada, pero un cantante entrena do es capaz de utili -
zar hasta ci nco lit ros en un a sola ex ha lac ión .
En el bo rde supe rior de la tráquea se ub ica un a especie de cav idad ca rt i-
laginosa llam ada lar inge, qu e la co mun ica con el tracto voca l, término qu e in-
c luye la garganta y la cavid ad naso bucal. Dentro de la laringe se hallan las
cuerdas (o mem bran as) vocales, enca rgadas de estr echar u ocl uir el paso de ai-
re a parti r de la acc ión de varios pequ eñ os músculos. La apert ura con form a de
V en tre las cue rdas voca les se denomina glotis. La glot is mide aprox imada -
men te 2 cm de largo y 1 cm de anc ho cuando está to ta lme n te abierta . En la
figura 1 se pue de ve r el co rte lat eral de la pa rte supe rio r del apa rato voca l, y Figura 2. Vista frontal y superior de una laringe humana
en la figura 2 se ven dos co rtes esque máticos de la laringe.
En fonación, la caja toráxica ap lica una presión subgl ót ica un poco ma-
yor qu e la presión atmosférica - entre 1,005 y 1,04 atmósferas- qu e fuerza al
a ire a pasar por la glotis y qu e hace vibrar las cue rdas vocales, cuya apert ura
estática es regulad a por el ca rt ílago ar ite noides . Las cuerdas voca les, a su vez,
vibran a un a frecu encia co ntrolada por la presión subglót ica y por la tensión
aplicada a sus pequ eños múscul os. Para el habla normal, las frecuencias se ex-
tiend en en un rango qu e va de 140 a 400 Hz en las mujeres y de 70 a 200 H z
en los hombres. Estos rangos pueden exte nde rse una octava o más en el ca nto.
Producción del sonido
En la fona ción participa n va rios mecani smos difere ntes du rante la producción
de ondas. Las consonantesplosivas, que son seña les transitori as que se producen
al bloquear y luego abrir repentinamente el tracto vocal, tienen un desarrollo
temp oral en el que prim ero aparece un ataque similar a un impulso de gran pre-
sión, seguido por un bre ve interv alo en el qu e la vibración se aten úa rápid a-
mente. En la figura 3 se ve el gráfico temporal de la co nso na nte plosiva fk/.
Esta seña l, transitoria y no peri ód ica,.posee un espec tro de banda anc ha
F i~ur.1 l. Corte lateral de la parte superior del aparato vocal hum ano y, por sup uesto, ca rece de altura ton al. Las plosivas se dividen en sordas (lp/ ,
240 241
+
+
"O
ª
C.
E
«
"O
.ªE
C.
«
Tiempo
Tiempo
Figu ra 3. G ráfico temp oral de la co nsona nte /k/ Figura 4. G ráfico te mpora l de la consona nte /sh/
/t/ y /kJ) y sonoras (lb/, /d/ y /gJ). En estas últimas, las cue rdas vocales se po- aprox imadamente armón icos. En otras palabr as, las vocales sí poseen altura
nen en vibración y una vocal suena inmediat amente después -unos 30 ms- de ton al definida. Se producen por la modul ación periódica de la apertura glóti-
la conso na nt e. Como el carácter tran sitori o de las plosivas hace que conten- ca. Tan to la frecuencia de vibració n de las cuerdas vocales como la form a de
gan poca energía, los cantantes gen eralmente las exa geran para equilibrarlas onda result ante están det erminadas casi completa ment e por la laringe. La fre-
en sonor idad con respecto a las vocales. cuencia fund amental, que define la periodicidad y la altura ton al, depende de
Las consonantes fricativas (ls/, /z/, /sh/ , Ii/, /f/, /v/ , etc .) producen una tur - la presión subglótica y de la tensión y apertura de las cuerdas voca les. El trac-
bulencia en el a ire que fluye a través de una pequeña abert ura a mayor velo- to voca l, tapizado de tejid o bland o, casi no devuel ve energía hacia la larin ge.'
cidad que la velocid ad crít ica . Aunque se puede sostener esta clase de señales Las diferentes posicion es de la lengua, por ejemplo, modifican la acc ión de fil-
en el tiempo, son estaci on arias solamente en el sentido q ue lo es el ruido blan- trado y det erminan cuál voca l se va a emitir, pero no alteran la periodicid ad
co. Sus ondas son no periódic as y el espectro es de band a ancha . En la figura base de la seña l que emiten las cuerdas voca les.
4 se aprecia el gráfico temp oral aislado de la con son ante fricati va /sh/ . En la figura S se pued en observar las formas de onda que parten de la la-
Aunque el tracto vocal pueda enfati zar algunas frecuencias de la band a ringe para tres niveles de int en sidad diferentes. A mayor int ensidad aumenta
total gene rada por una cons on ante fricati va (por ejemplo, 6 kHz para la /s/ o sign ificat ivamente la cantidad de armón icos en el espec tro.
3 kH z para la /shJ) no se destaca ningun a frecuencia en particular y el son ido De la laringe surgen ondas aproximadamente periódicas que se parec en,
result ante es no tón ico. Existen otros son idos como las consonantes nasales según el caso, a una onda tri an gular o una onda diente de sierra con gran can-
(lm/, /n/, /ñ/) , las vibrantes (lr/, /ITJ), ete., pero los modos de producción no di- t idad de armón icos. El sonido que se registra en la laringe se siente como un
fieren en esencia de los ya vistos." zumbido con altura tonal definida, no como los sonidos mucho más agradables
A diferencia de las con son antes, las vocales se mantienen estable s en el que oímos cuando el locutor emite por la boca. Esta gran diferen cia acúst ica
tiemp o, sus formas de onda son prácticamente periódic as y sus espectros son se deb e a la acción de los filtros de reson ancia del tracto voca l.
Z No pretendemos cubrir aquí el panora ma com pleto de los fon emas del españo l. Tamp oco 3 Aquí falla la difundid a ana logía ent re el aparato voca l hu man o y los instrum entos de
empleamos los símbo los recomendados por la Internacion al Phon etic Assoc iatio n (IPA), vien to del grupo de los bronces : la campana de estos últ imos devuel ve hacia la boquilla un
que exigirían un a descripción de tall ada . Quien desee ampliar en el tem a deb erá recurri r a gran porcenta je de ene rgía en cada ciclo. Así se esta blecen las ondas estac ionarias necesa-
textos específicos de fon ética y fon ología. rias para su func ion amiento.
242 243
a)
:t/\cAA~ IL lie mpo I I

l.-Jl.-JL.......JL-L-
Frecuencia
....
Figura 6 . Configuraciones de l tracto voca l para las vocales fif,fuf,le! y faf
bl 2:o1AA~
liempo -. Frecuencia
lil
;:;~ ' ~ I
la
:~ o 1 2 3 o
-10
~ 1
Frec uenc ia 1kHz)

11
e) ~"
"O
lal
s
ªa.
~ :~
10
O
I~
O
E ·'0 -!: 10 , ·' 0
-c ·20
ca o
r
.'"
O 2 3 'i ·10
· 20
-eo
- ·20 ·40
Frec uenc ia 1kHz)
liempo Frecuenci a G) -30
.2:: a 1 2 3
' SO
O
Z
Frecuenc ia 1kHz)
Fi¡.:ura 5. Formas de o nda y espectros tom ados en la laringe: a ) señal débil, b) señ al de me-
, lialla int en sidad y e) seña l muy int en sa
lul
"'~ 'Oo
:10
10 · 10
O · 20
Fo rma n tes -10 -30
-:10 .."
-30 ' SO
o 1 2 3 o
lil t ra cto vocal se puede aproximar a un tubo de 17 cm de largo, cerrado en un ex- Frec uen c ia 1kHz)
I remo por las cuerdas vocales y abierto en el otro a través de la cavidad naso bucal.
C ada vocal define un a geometría partic ular del tracto voca l, como se pue- Figu ra 7. Efecto de filtro de l tracto voca l sobre un a seña l periód ica proven iente de las
de ver en la figura 6. cuerdas voca les
Cada configurac ión partic ular del trac to voca l, a su vez, modifica las ca-
ruc rcrfsticas espectrales del filtro acústico correspondie nte , Lo que oímos es,
en definiti va, una señal periód ica gene rada en la laringe y filtrada por el trae-
lo vocal. En la figura 7 se puede ver cómo la misma onda, emitida por la fa-
ringe, adopta envo lventes espec tra les diferentes para cada voca l. En este nación partic ular de forrnantes, tres o cuatro según el caso. Sin emba rgo, es
ejemplo se oye siempre la misma altura ton al, pero con tres alturas espec trales posible distinguirlas con claridad a partir ún icament e de las dos prim eras. Si
se const ruye un gráfico cartes iano que posea la frecuen cia de la primera for-
dilcrcnt cs (las voca les /i/, /a/ y /uf).
rnant e en abscisas y la de la segunda forrnante en ordenadas, se obtie ne un es-
La cav idad naso buca l posee resonancia de ban da media porq ue el tej ido
pacio bidimensional en el que cada punto co rresponde -idealmente- a una
hlnndo que la tapiza absorbe gran cantidad de energía acústica . Cada una de
voca l. En la vida real, por supuesto, existe gran variabi lidad no sólo entre un
cstus zonas de resonancia, en las que se refuerza la amplitud de los componen-
hablante y otro, sino hasta en la misma persona en diferentes momentos de l
les espectrales, se denomina fonnante. Cada vocal corresponde a una comb i-
245
244
a)
3000 1
1 ejemplo, en la figura 8 se compara n las regiones de recon ocimi ento voca l pa-
1
2500 . 1 1
-----r- -- - í - -- -- T----- 1
ra voces masculin as y femeni nas.
1 1 1
1 1 1
2000 .. - --"'_---<1'", _ E_ ~. ~ ,~ __, L _ _ •. __

1
1
I
I
1
1
Características generales de la emisión vocal
Ñ
~
N
u,
1500
----1------!- -cbj----- La voz human a gene ra un espectro de potenc ia que alcanza un máxim o de
1000
-----! -~ ----i--t----- energía alrededor de los 500 H z en los hombres y de los 1.000 Hz en las mu-
500 - -- - ~·~ - - - ~- - - - ~ f - - - - - jeres, para luego decaer a razón de -8 dB por octava hasta un a frecuencia com-
1 I
I
I
1
1
1
prendid a en tre 4.000 y 5.000 H z. En la figura 9 se puede ver el n ivel medio de
O emisión de una voz mascul ina tom ado a 1 m del locutor. El rango diná mico
O 200 400 600 800 1000 1200 1400
F1 (Hz) útil para la palabra es del orden de los 30 dB. Las crestas más poten tes se en-
b) cuentra n a alrededo r de + 12 dB por enc ima y las más débiles a -18 dB por de-
3000 - - -_.:,_. -,- _'} -_... .-- -'--
1
..
1
----, bajo del ni vel medio.
1 1
1
I ¡
I
I
En la región de sobrecarga el oído no puede discr imin ar ent re diferentes
2500 -1: - -': -- --i- -- - - T -·---- - ~ - - -- -
1 1 1
fon emas y la int el igibilidad cae bruscamente.
1 I I I I
2000 --.._{ -----~ ---- -:- - + --- --~---- -
Por supuesto, la voz human a no emite de man era omn id irecc iona l a to-
+·-- ---~-- ----f-----~----~-~-* ~----

Ñ das las frecuen cias. Es marcadamente direccion al por enc ima de los 1.000 Hz.
~ 1500
N
u,
En la figura 10 se muestran los diagramas de directi vidad en el plan o vertical
1000
j
' 1
' .
I
I
I correspondientes a cinco frecuenc ias diferentes.
--rO- - -- · --- - t --··--~--
1 "
1 I
,:.;;..'" - -- r-- - - - -:-- __-+ -- _

1 1
500 o ~
, 1 110
1 1
O
1 1
100
Región de sobrecarga
O 200 400 600 800 1000 1200 1400
90
F1 (Hz)
iD 80
~
Figu ra 8 . Region es de reconocimie nt o voca l para las dos primeras forrnanres del espa ño l ~ 70
o
c:
riop latense; a ) voces masculinas, b) voces femen inas o
(f)
60
c:
'0 50 N'
'¡¡; Ivel de cresta de I
~ . a palabra
a. 40
NIVel medio d I
día. Por lo tan to hay un rango de valores para cada par de forrnan tes (una re- Q)
"O 30
e a palabra
gión en el gráfico de la figura 8) que cont iene informac ión sobre la misma vo- ~ 20 Nivel mlnimo de I
t3
ca l (Aronson, L. et al., 2005). Q)
a.
a Pa./abra
(f) 10
Q)
Los ran gos se supe rponen en algunos casos y los mismos sonidos pueden a; o Nivel eficaz total de la
>
p~ rc ibirse en dos form as diferentes. Por lo gene ral, sólo un a de las interpr et a- Z -10
palabra : 69 dB a 1 metro
ciones tien e sentido en su contexto y la adoptamos automát ica men te de ma- -20 Umbral de audibilidad para
nera precon sciente. Una de las razones de la gran extensión de las áreas para -30
sonidos de espectro continuo
cada voca l es que las mujeres, los hombr es y los niños no poseen el mismo ta - 270 380 490 630 770 920 1070 1230 1400 1570 1740 1920 2130 2370 2660 3000 3400 3950 4650 S600
maño de tract o vocal y no pueden producir exac ta mente las mismas forman- Frecuencias centrales de las bandas de igual contribución
tes. Los oyentes evalú an las características acústicas gene rales del locutor al indice de articulación
antes de decidir las formantes que le van a corresponder a cada vocal. Co mo Figur a 9 . N iveles espec tra les de emisión para una voz masculina
246
247
\
\
270' 270' a)
5.000
1 80'+-tt---+~E-1---+-"'" O' -H+-+-*-+-++ O' N

~
<ti
'ü 2.500
e
Q)
::>
u
90' 90' ~
100 Hz 400 Hz u.
1.000
270'
o 2 3 4
Tiempo (5)
180'+-+-+-4r:---;I-.+--& O' 180-t--+....I,jH~+-+-J- O'
b)
5.000
90' 90'
1.000 Hz 4.000 Hz
N
270' ~
<ti
'ü 2.500
eQ)
::>
u
Q)
1 80"+-+---fJH~-I--+--H-
u:
1.000
-
90' O 2 3 4
10.000 Hz Tiempo (5)
Figura 10. Direcrivida d de voz humana en el plano vertical Figura 11. Son ogramas de banda ancha y de band a angosra
2. R EPRESENTA CIÓN GRÁRCA DE LOS SONIDOS DEL HABLA lor que proporcion a una buena resoluc ión te mpo ral (1/ 300 s), pero que no
permite observar los armónicos ind ivid uales de una señal periódica. Los sa no-
Co mo los espectros de los son idos del habla varían en el tiemp o -no son estáti _ gramas de band a angosta posee n norm almente band as de 45 Hz, suficiente pa-
cos-, para estudiarlos se usan trad icion almente gráficos carte sianos tiempo/fre- ra distinguir los armón icos, pero no para diferen ciar indi vidualmente los
cuenc ia que se denominan sonogramas. El problema con estas form as de rápid os impul sos glót icos. En la figura l 1 se pueden ver dos sonog rarnas de di-
representación es que, como todo siste ma pasivo de aná lisis de ondas, depen- ferente ancho de band a.
den del límite impuesto por el principio acúst ico de indeterminación. Resulta Nu estro oído puede resolver con gran det alle y (casi) simultá nea ment e los
imposib le obtener simultánea mente gran resolución en el t iemp o y la frecuen- aspec tos temp orales y espec tra les de una seña l acúst ica, co mo ocurre cuando
cia. Una solución de co mpro miso consiste en alte rna r sonog ramas de banda oímos un a sucesión ráp ida de acor des. Sin embargo, no viola el pr incipio ac ús-
anc ha y de banda angosta. En los primeros la band a t ípica abarca 300 H z, va- t ico de inde terminación po rque posee la ca pacidad de activar y desactivar r á-
248 249
Existe evidencia de espec ializac ión cerebra l rel acionad a con la percep ci ón
de! h abl a. Por eje mp lo , se h a probad o q ue interv iene n difer entes regiones
de! cer eb ro en la per cep c ión de los son idos de! habl a y en la de los soni dos
ambien ta les en general. S i se aplica n simultá n ea me nte a los dos o ídos est í-
N mulos diferentes -por eje mp lo dos frases distintas- e! estímulo h ablad o pre-
e. sente en e! o ído derecho -que se procesa en e! hemi sferio cerebra l izquier do-
'e"
'ü 2.500
es co mprend ido co n mayor fac ilida d . Lo co ntrario oc urre en e! caso de la
al
'"o~ mú sic a.
u,
1.000 Experiencias con tom ografía computada y resonancia magn ética de mos-
traron que , mientras qu e los soni dos ambientales y musicales son procesados
en ambos hemi sferi os ce rebrales, los son idos de! habl a est imulan casi exclusi-
o 2 3 4
vame nte el hemisferi o izquierdo. Esta caract erística esta ría basada en la nece-
TIempo (5) sidad de mantener cercanos todos los centros in volucrados en e! tratamiento
de las señales del habl a, a fin de permitir la detección de sus pequeñas tran si-
Figura 12. Espectrograma aud it ivo ciones -del orden del mili segundo. De otro mod o, si la información tuviera
que viajar entre hemisferios, estas transiciones se perd erí an debido al exc esi-
vo tiempo involu crado en la comunicación.
pidam ente los senso res de la membran a basilar, co rrigiendo así el anc ho de A continuac ión nos referimos a algunas de las ca racteríst icas particulares
banda efec tivo de acue rdo a la tarea impuesta." de la percepción de l habl a, q ue nos perm iten decodifica r co n eficac ia los fo-
Como ninguno de los sonogramas trad icionales representa lo qu e e l oído nem as en un a amplia vari edad de situac iones y co ntextos.
detect a realm ente , algunos autores crearon los espectrogramas auditivos, en los
que e! anc ho de banda de cada frec uencia de aná lisis iguala a la banda crítica Tasade ocurrenciade los sonidos del habla
que co rrespo nde a su frecu encia ce ntral (C arlson, G ranstrom y Hunnicutt,
1982) . En la figura 12 se muestr a el espectrograma aud it ivo de! regist ro de voz En e! habl ar rápido pued en oc urrir 30 fonem as por segundo. Liberman espe-
ha blada de la figura 11. En este caso se pueden observar a la vez los armó ni - culó que est a tasa supe ra la resolu ción temporal del siste ma audi tivo (Líb er-
cos en bajas frecuenc ias y las transic iones rápidas a altas frec uencias. rnan , A . et al., 1967) . S in embargo, la evidencia reciente indica qu e es
C uando se co mpara un registro acústico de voz hablada co n su represen- posible identificar secue ncias donde cad a fon em a dura ape nas 10 ms, a un a
t~ción gráf ica lo primero que llama la ate nc ión es qu e los silencios general- tasa de ocurrenc ia de 100 fonem as por segundo . A esa ve loci dad no se perci-
mente no correspo nden a los espac ios entre palabr as. Una de las mayores be cada evento por sepa rado, pero se puede seguir audi t iva rnen te e! patrón
d ificultades a la hora de ana lizar gráficamen te esta clase de seña les es det ermi- sonoro globa l.
nar el mod o en que la secuencia de son idos se segmenta en sílabas y palabr as.
Variación de los daros acústicos
3. CARACTERÍST ICAS PARTI CUL AR ES DE LA PERCEPCIÓN DEL HA BLA La percepción de! mismo fonema puede estar determinada por diferentes da-
tos acústicos. Por ejemplo, una consonante fric ativa "a com od a" sus bandas
Aunque e! tema sigue siendo motivo de controversia entre neurólogos y de ruid o de acuerdo con la vocal que la sucede: voc ales diferentes dan lugar,
lingüi st as, es probable qu e en el ser humano hayan ev olucionad o mec anis- inevitablemente , a diferentes tr an sici ones entre forrn antes. Una sola transi-
mos espec iales dedicados a la percep ción de los so n idos propios del habla. ción de la señal acúst ica puede contener información so bre varios fonemas
vecinos.
4 El control acti vo de la mem bran a basilar se vio en el capítu lo 1, punto 4.
250 251
Modo lingüístico Transiciones
de las formantes
: : Régimen estacionario:
No hay un continuum en la perc ep ción de los son ido s del h abl a, la per cep- ~ :
Una
~'
de la vocal
.
:
c i ón es d icotómica. En general , los sonidos son percibidos com o lin gü íst i- .~ de ~. . Formante 3
cos o co mo no lingüísti cos. Se puede ac t ivar el mod o lin güísti co dándole :¡¡ estas { W: :
G~ :
c ie rtas instru cciones al oyente, pero una vez ac ti vado es mu y difícil rev er- ~ :""OIIIiI! • Formante 2
tir el proceso. , Formante 1
U na de las consecu encias de esta carac te ríst ica de la perc epci ón de l
habl a es nu est ra inc apacid ad par a o ír los soni dos propios del lenguaje en TIempo
t érm inos de sus parámetros acú sti cos. Los per cibimos co mo un a co rr iente Presentación normal (diótica)
ún ica de pal abr as y las descripciones "acú sticas" son, cas i siemp re, confusas.
Pa ra lograr una aud ición limpia de los dato s acús t icos es necesari o aislar ca -
da fone ma y saca rlo de conte xto . Sólo a partir de ese mom ento se desacti -
va el mod o lin güísti co.
Resulta casi innece sari o menci on ar la importancia q ue ti en e esta ca-
racte ríst ica en la percepción de canciones y piezas líri cas, en las que coe x is-
ten ele me ntos propios del mod o lin güíst ico (el texto) y. no lin güíst ico (la
música) .
Percepción dual
Base Transiciones aisladas
(a un oldo) (al otro oído)
En la década de 1970 Rand realizó por primera vez un experimen to q ue de-
mostró la ex istencia de lo que se con oce como percepción dual (Rand , T. e, Presentación dicótica
1974 ). Más adela nte , Liberman perfeccion ó la experien cia de Rand de la si-
guiente manera: se presenta a un oído la part e de la seña l prop ia de una síla- Figura 13 . Esquema del experimento de Liberman sobre la percep ción dual
ba a la cual se le ha quitado la tr ansición del ter cer forrnante, y al otro la part e
está tica del tercer forman te más los dos prim eros forrnantes co mpletos (L íber-
man, A., 1995). Los oyen tes dic en percibir la sílaba completa en el prim er oí- Integración audiovisual
do y sólo un cort o zumbido en el o tro . En la figura 13 se aprecia la descr ipción
esquemát ica de dich o experimento. A l decodifi car un mens aje habl ado le prestamos ate nción a un a gran canti-
Según Liberm an, los resultados obte n idos ind ican que ex isten módul os dad de datos no acústicos . Los movimi entos de la cabe za, de las manos y, en
separados que proc esan, por un lado, los sonidos del habla y, por otro , los de- particul ar, de los labios del hablante pued en influ ir sign ificativamen te en la
más son idos. Esta conclusión concuerd a con los datos obten idos a parti r de la percep ción del h abl a.
observació n direc ta de la ac t ividad corti cal durante la audició n . Es interesante men ci on ar aquí un exp erimento en el que se presenta
Una de las consecuencias int eresantes asoc iadas a este fenó meno es que un vid eo con el aud io modificad o a un grupo de espec tado res (McGurk y
se viola el principi o de separación espacial que sostiene que un elemento ac ús- MacD on ald, 1976). En la imagen aparece un locuror diciendo "tata" jun-
tico dado no puede ser asigna do a más de un a fuente a la vez. Parece que el to a l aud io del mismo locutor pronunci ando la palabra "ma ma" . Los oyen -
mecani smo de perce pción lingüíst ico es tan poderoso que , bajo cierta s cir- tes dicen o ír "na na" , sin expresa r riin guna duda - oyen "nana" con
cunstanc ias, permite agrupar elementos acúst icos aún cuando éstos proven- cl aridad-v v se sor prenden a l oír el aud io a islado , libre de to da información
gan, o aparenten provenir, de fuentes diferentes. visual.
252 253
l'crcc/>ción categórica C uando aprendemos a entender las palabras de un lenguaje partic ular, presta-
mos ate nción a las diferencias acústicas que afecta n su sign ificado e ignoramos
Una consecuencia de la perce pció n en modo lingüístico es nuestra capacidad las que no lo afectan. U na vez que aprende mos a distinguir entre ambos gru-
para ubicar cada fone ma en un a det erm inada categor ía individua l. Cuando pos, nos cuesta oír las diferencias acústicas que no atañen al significado. Esta
varía de manera continua algún parámetro acúst ico de la señal, por eje mplo la exp licació n da cuenta de la dificultad para oír diferencias entre fone mas en un
frecuencia de una formante, no oímos una serie de peq ueños cambios grad ua- lenguaje no familiar. Kuhl enco nt ró que los n iños nacen con habilidades rele-
les, sino que perci bimos saltos "cuánticos" entre un fone ma y otro. Este fenó- vantes respecto del len guaje que parecen depen der de mecan ismos generales de
meno se deno mina percepción categórica y no ocurre usualmente con los la percepció n auditiva: no responden de manera específica a una lengua en par-
son idos ambientales. No se d istinguen los cambios acúst icos de la señal cuan- ticular. Pero a los seis meses la percepció n de los bebés ya está polarizada por la
do éstos caen en la misma categoría, pero se percib en co mo muy grandes si exposició n a una lengua específica . Kuh l propuso la teoría del magnetismo del
provocan un salto de ca tego ría. La percepción ca tegó rica se nos presenta co- lenguaje nativo, en la que la expos ición a una lengua en partic ular resulta en la
mo evide nte cuando tratamos de comprender un discurso en una len gua q ue formac ión de representacion es almace nadas de categorías foné ticas, que gene-
no do mina mos completa men te: las confusiones frecuentes se deben a una in- ran "protot ipos" de cada catego ría. Los prototipos ac túa n como iman es percep-
suficiente com petencia respecto de las ca tegorías fon ém icas de esa lengua. tuales: la percepción categorizada es una con secuencia natural. La teoría de
La percepci ón de vocales estac iona rias es muy diferente pues los peq ue- Kuhl es compatible con la h ipótesis de que el ce rebro funcion a como un siste-
i111S ca mb ios físicos son percibidos con facilidad. Según Liberman, esto oc urre ma que opera en la frontera del caos.
porq ue las voca les aisladas está n much o menos cod ificadas y se las oye como
sonidos co rrientes, no ca tegor izados lingüísticamente. N o obsta nte, las voca-
les de ntro de una secuencia de l habla se co mpo rta n de man era similar a las 4. M O DELOS DE PERCEPCiÓN DEL HABLA
consona ntes, es decir, de manera altame nte codificada .
Un ejemp lo de percepc ión codificada y ca tegor izada de sonidos no perte - Teoría motora
nec ientes al habla es la percepción de las a lturas musicales en un siste ma es-
ca lístico determi nado. En música tonal, las funciones armónicas ta mbién Esta teoría establece que los objetos de la percepc ión de la pa labra son tra ta-
está n altamente categorizadas. dos co mo gestos fonéticos del hablant e, representados en el ce rebro co mo co-
Existe n tres hi pótesis principales elaboradas para explicar la percepción mandos de movimient o invariantes relac ionados con cie rtas configuraciones
categórica. En la primera, Pisoni considera que la memoria auditiva para los lin güíst icas significativas (Liberman y Mattingly, 1985). Estos gestos no se
patrones ac ústicos de las consona ntes decae rápidamente y q ue cuando debe- mani fiestan directament e en la señal acús tica.
rían ser procesa dos en la iden tificación ac ústica del fone ma ya se han perdi- El modelo es inco mp leto pues no especifica cómo se logra la tran sform a-
do: la disc riminación fina del estímu lo dentro de esta ca tego ría de fone mas es ción entre la seña l acústica y los gestos percibidos. Segú n Klatt, "es más una
imposi ble (Pisoni , O. B., 1973). Para fone mas más largos e inte nsos, co mo los filosofía que una teoría de la percepción del habla" (Klatt, O. H., 1989 ).
de las voca les prolon gadas, los patro nes ac ústicos pueden ret en erse en la me-
moria audit iva por períodos mayores, pudiendo rea lizarse sobre e llos operacio- Teoría de los rasgos invariantes
nes de discriminación similares a las operadas en los sonidos en gene ral.
En la segunda hip ótesis K. Steve ns sugiere que las cat egorías y los límit es A su vez, Ste vens y Klatt defienden una teoría en la que la percepción se da en
en el habla han evolucionado con el fin de explota r la sensibilidad natu ral del una serie de etapas que inclu yen un conjunto de det ectores fon éticos (Klatt, O.
sistema auditivo (Stevens y Blumstein, 1981). Esta hip ótesis no da cuenta de H., 1989) . La primera etapa ocurre en el sistema audit ivo periférico (filtrado, su-
muchas de las operacio n es carac te rísticas necesarias para la aparición de la presión lateral, adaptació n y sensibilidad a la fase) . La segunda con sta de una ba-
percepción ca tegó rica. tería de detectores acústicos (de tectores de ataque, de cambio espectral, de
Una tercera hip óte sis, formulada por Kuhl , con sidera que la percepción forman tes y de periodicidad). La tercera eta pa la form an una serie de detectores
categórica surge de la experiencia con el propio lenguaje (Kuhl, P. K., 1993). de rasgos fon éticos y sus decision es son específicas de una lengua determinada,
254 255
Finalmente, aparecen etapas de aná lisis de segment os y búsqueda de léxico. las interferencias, para compensar las distorsiones de la señal (por ejemplo en
Este model o está basado en la suposición de que es posible encontrar un una línea telefónica) y para superar la mala articulación de un locutor.
mnpco relativamente invariante entre los patrones acústic os y los son idos del
habla. Sus detractores señ alan el carácter inevitablemente secuencial de las Resistencia del habla frente al deterioro de la señal
ope raciones involucradas.
Es remarcable la resistencia del habla frente a varias formas de distorsión se-
Modelo de red neuronal vera. Los métodos de teste o de articulación las han catalogado en : cantidad de
ruido de fondo, cambios en el espectro de frecuencia y recorte de picos.
El modelo de McClelland y Elman es cone xio nista y está basado en las teorías Cantidad de ruido de fondo. La inteligibilidad de sílabas aisladas resulta sa-
de las redes neu ron ales (McClelland y Elman, 1986). Asume que existen tres tisfactoria con una relación señal/ruido (SiR) de +6 dB. Sin embarg o, las pala-
niveles de representación, cada uno de los cuales contiene un idades de proce- bras resultan inteligibles aún para relaciones SiR negativas si integran
sarn ien to altament e interconectadas llamadas nod os. En el nivel más bajo, los sentencias bien formadas , en particular si el oyente está familiarizado con el
nodos representan rasgos fonéticos, en el siguiente representan segmentos fo- tema, o si el habla y el ruido provienen de lugares diferentes.
nétic os, y en el último nivel representan palabras. Por ejempl o, el nod o corres- Cambios en el espectro de frecUencia. Se ha demostrado que, contra la afir-
pondi ente a un fonema específico puede disparar hacia dos o tres nodos mación tradicional, no hay componentes en frecuencia esenciales para la co-
cor respond ientes al nivel de los rasgos asociados normalmente con dichos municación. Se puede cortar una señal de habla con un filtro de banda
íone mas. La activación excitatoria o inhibitoria puede fluir en ambas direccio- pasante de Oa 1.800 Hz, de 1.800 a 20.000 Hz o de 1.000 3 2.000 Hz, y no per-
nes, desde nivele s más bajos hacia otros más elevados, o vicever sa. der mucho en inteligibilidad.
Este modelo permite explicar varios aspectos de la perc epción del habla, Recorte de picos. Si se coloca un circuito que recorte la señal de entrada al
la les como la restauración perceptiva de fonemas "perdidos", la percepción ca- 2% de su amplitud promedio queda una onda casi rectangular de período varia-
rcgorizada y la armon izació n de datos. Es uno de los modelos comp atibles con ble y se pierde la informac ión aportada por la forma de ond a original. Sin em-
la teoría de la percepción caótic a. bargo, se obtienen tasas de articulación entre el 80 y el 90%: son necesari os sólo
dos bits para codificar la amplitud sin perder casi nada de inteli gibilidad. Por su-
puesto que el sonido no resulta "natural" y es imposible reconocer al locutor.
5. LA BÚSQUEDA DE INDICADORES ACÚSTICOS INVARIANTES En resumen, el sistema de comunicación humano ha evolucionado de tal
forma que puede operar bajo una gran variedad de condiciones adversas. Sin es-
Cale y Sco tt not aron que la percepción del habla involucra la identificación tas capacidades el teléfono no existiría, o sería extra ordinariamente complejo.
simultánea de, al men os, tres tipos de datos cualit ati vamente diferentes: indi-
cado res acústicos invariantes, ind icadores dep endi entes del contexto e indica-
dores asentados en la envolvente dinámica de la onda (C ale y Scott, 1974) . 6. INTELIGIBILIDAD DE LA PALABRA
En otras palabras, cada sílaba contiene dato s invariantes y dato s dependientes
del contexto. Existe evidencia de que la env olvente dinámica de la onda pro- La inteligibilidad del discurso se refiere a la exactitud con que un oyente pro-
vee información sobre la comp osición fonémica de la señal y de que, en cier- medio puede entender una palabra o una frase hablada. En una situación nor-
\ 0 grado , el sistema auditivo está capacitado para dec odificar los estímulos del mal parte de la inform ación se extrae del contexto y de las señales visuales que
habla basánd ose únicamente en las variaciones de la amplitud en el tiempo. acompañan a la fonación y, por lo tanto, es posible entender el significado in-
La naturaleza multidimensional de la información acústica permite un alto ni- cluso si solamente una fracción de las unidades acústicas discretas se oye co-
vel de redundancia en la señal del habl a. Coexisten diferentes dat os que per- rrectamente. En otros casos el oyente queda limitado a valerse únicamente de
miten la identificación de un fonema det erminado, aunque con uno solo de la información acústica, como ocurre en los sistemas de comunicación no pre-
dios se lo pueda reconocer. La redundan cia sirve para superar las ambigü eda- senciales, por ejemplo el teléfon o o las grandes salas en las que se emplea re-
des inherentes al discurso hablado, para minimiz ar la influencia del ruido y de fuerzo electroacústico.
256 257
U n fone ma es inteligible cuand o se lo oye de forma clara y puede ser di- 100
ferencia do del resto de los fone mas de la misma lengua. La misma definici ón Silencioso • Ruidoso .
puede ap licarse a un discurso artic ulado , aunque aquí actúan facto res contex-
ruales de importancia. <Jl
90
III
~ .
~
Veamos primero qué ocurre con los fone mas aislados. En este caso el pun -
.o
ro 1)
~ 80
a.
to crítico en cuanto a la inteligibilidad son las co nsona ntes , pues al ser más
~
al
"C
déb iles que las voca les se pueden en mascara r con mayor facilidad. e 1:(·
-o 70
'ü 1'.-1 r~ 1"
ro
:; IJ
Ensayos de articu lació n u
t: •
ro 60
al
"C
La investigación en esta área co menzó co n el desarrollo de los sistemas telefó- al
.¡¡¡-
nicos a fines del siglo XIX y de la radiofonía a princ ipios del xx. Los primeros eal SO
1,:
E
intentos para definir numéricamente la inteligibi lidad fuero n los ensayos de ar- o ~.~
Q.
1-
ticulación, que cons isten en pruebas de campo en las que un locu tor lee un 40
kl l· o
conjunto de fonemas o palabras de una lista confeccionada al azar. Para ev itar
la influencia de elementos no fonét icos, las secuencias carecen de sent ido lin- o
~ r: 1\ I ~
L...--
2 3 4
güístico y las sílabas están ordenadas de manera estocástica. Es habitual el uso
Locutores
de listas estanda rizadas para permitir la comparación entre ensayos. 5 Los oyen-
tes, distr ibuidos en la sala de una manera predeterm inada, anotan los fon emas Figu ra 14 . Resultado de un ensayo de a rt icu laci ón de palabra a part ir de cuatro locu tores
o palabras que creen oír. El resultado de l test es el porcentaje de palabras co- d iferentes
rrectas -que coinc iden con la lista origina l- para cada oyente. Ad emás de los
facto res acústicos específicos que ana lizaremos más adelante, los ensayos de Silencioso . Ruidoso .
100
articulació n son muy sensibles a las características parti culares de cada locu-
tor y de cada oyen te. En las figuras 14 y 15 se pueden ver los resultados obte- <Jl
nidos a part ir de dos grupos de locutores y oyentes (Berane k, L., 1954) . ~ 90

.o
ro
U na característica a destacar de los ejemplos anteriores es la not able dis- ~
a.
al
paridad en la resistencia al ruido que presentan las voces de los diferen tes lo- "C 80
e
cuto res. En las mismas co ndiciones de ruido int enso, el primer locuto r de la -O
'ü
ro
figura 14 se co mprende correctamente, mientras que el último de la lista re- :;
u 70
sulta absolutamente ininteligible. t:
ro
al
La tasa de articulación se puede con siderar una med ida válida de la int e- "C
al
ligibilidad, que es aplicable únic amente a cada caso particu lar. El valor es re- Ee 60
al
presentativo de la sala en la que se realizó el ensayo y de las características del e
O
locutor y de los oyent es que partic iparon en él. Q.
so
En condiciones acústicas óptimas la art iculación casi nunca supera el
95% de respuestas correctas. Afortunadament e, un discurso articulado puede
O
comprenderse aunque algunas sílabas resulten ininteligibles porque el oyente 2 3 4 S 6 7
ex trae el sentido del contexto. Por esta razón , una tasa de articulación del Oyentes
Figu ra 15. Resultado de un ensayo de art iculación de pa labra ob ten ido con siete oyentes
5 En idioma ing lés se utiliza la lista defini da en el "Harvard P.B.SO word score" . ubicados'en la misma posició n. El locu tor fue siempre el mismo
258 259
80% permite comprender el discurso sin esfuerzo. Cu and o baja al 70% los Se enco ntró que un discurso grita do es más difícil de entender que uno a ni -
oyentes deben concen trarse con esmero para entender las sen tencias y, por de- veles medios, al margen del ni vel acústico final en el oído de los oyen tes. Es-
bajo del 60%, en la mayoría de los casos la inteligibilidad resulta insuficiente. te efecto de sobrecarga, que ya ana lizamos en este cap ítulo, se debe a los
Los ensayos de articulación , aunque brindan valiosa informac ión sobre la cambios en los transito rios del ataque y en la entonación de las formantes de
inteligibilid ad, son muy costosos en tiemp o y recursos, yen algunos casos pue- la seña l. Para simplificar los cálcu los la sobrecarga se suele tratar de la siguien-
den resultar imposibles de realizar. En la actu alidad se usan prin cipa lmente pa- te manera: en primer lugar, para altos n iveles de emisión se reduce la razón se-
ra verificar los modelos durante el desarro llo de métodos objetivos de ñal-ruid o perm itid a en el can al un valor de -4dB cada vez que la seña l supera
medición y predicción de la inteligibilid ad. en 10 dB el valor base de 75 dBA (med idos a 1 m del emisor). En segundo lu-
gar, se asume que los niveles de emis ión co mprendi dos entre 45 y 75 dBA que
Medición indirecta y predicción de la in teligi bilidad no llegan a los oyentes co n valores super iores a 80 dBA no requieren correc-
ció n por sobrecarga.
Existen varios métodos disponibles para predecir la intel igibilid ad de h abla en En todo can al acústico hay siempre cie rto n ivel de ruido de fondo. El
un sistema de co mun icac ión o en el interior de un a sala. Cada uno de estos efecto más obvio del ruido de fondo es en mascarar la seña l del habla. C uan ti-
métodos se basa en el mismo principio fund amental, que consiste en hallar al- ficar este efecto es difícil dadas las d iferentes situac iones posibles, pero como
guna relación entre la seña l del hab la y el nivel del ruido que la interfi ere en estánda r de diseñ o se considera que cada decibel de ruido que se agrega por
el cana l de comunicació n . En esta relación inte rvienen los siguientes factore s enc ima de un nivel base de 45 dBA debe compensarse con un aumento de 0,6
mensurables: el ni vel y otras característica s acúst icas de la seña l emitida , el dB en la seña l hab lada.
nivel y com posición espectral del ruido de fond o, y la naturaleza del can al de La naturaleza del cana l de co municación tam bién puede afecta r dec isi-
co mun icación o de la sala. vame nte la inteli gibilidad del discu rso h ablado. S u infl uencia, beneficiosa o
En un ento rno tranquilo, una con versación produce un nivel de presión perjudicial, se puede evaluar a partir de la respuesta al impul so del ca na l. Si
sono ra entre 55 y 65 dBA medidos a 1 m del locut or; aunque en situac iones es- se tra ta de un a sala exis ten dos factores que se analiza n por sepa rado : el pa-
peciales el nivel puede alcanzar 96 dBA. Como los niveles varían sign ificativa- trón de reflex iones y la reverberación. En gene ra l, el recinto realzará la in-
mente ent re indi viduos, para el diseñ o de sistemas de comunicación se utilizan tel igibilid ad cuando proyec te cierta cantidad de ene rgía dentro del período
los casos más desfavorab les en lugar de los niveles promedio. La tabla 1 presen- de integraci ón de l discurso (de 35 a 50 ms) . Dado que el ruido de fond o se
ta los valores estandarti zados para el diseñ o de sistemas electroac ústicos en distribuye de man era uni forme en el tiemp o, toda reflexión tem pran a mejo-
grandes salas para prosa. Ca da valor se obtiene restand o un desvío estánda r al rará la relación seña l-ruido del sistema . Sin embargo, las reflexiones tardí as,
promedio. los ecos y un a reverb eración excesi va interfieren co n la seña l y tie nde n a re-
ducir la relación seña l-ru ido del cana l, det er iorand o la inte ligibi lidad del
Tabla 1
d iscurso.
Esfuerzo vocal dBA
Relación señal-ruido
Susurro 32
Suave 37 Probab lemente sea la más simple y senc illa de las relacion es que se usan para
Relajado 42 medir la inteligibilidad. Se la define como la resta ent re el promed io de largo
Normal (priv ado) 47 tiempo, o nivel sonoro continuo equivalente , de la seña l del habla en el pun-
Normal (púb lico) 52
Voz levant ada 57 to de recepción (LA eq . señal) Y el nivel promedio de largo tiemp o del ruido de
Int enso 62 fond o (LAeq. ruido) ' Ambos ni veles se miden en dBA:
Muy intenso 67
Grito 72 Relación señal-ruido (SR) = LA eq . señal - LA cq. ruido (dBA)
Máxim o 77
260 261
Las med icion es de inteligibilidad del discurso conforme a la relación señal-rui- Durante varias décadas, el Al Y los ensayos de articulación fueron los ún i-
do realizadas por Bradley sugieren una meset a de n ivelación por enci ma del cos métod os capaces de evaluar la int eligibilidad del habla. Se sabía que el ti -
valor SR = + 15 dBA. En otras palabras, mejorar el sistema más allá de este va- po y la complejidad de la seña l de prueba (palabras articuladas sin sen tido
lor no aumenta la inteligibilidad de l siste ma. El defect o de este índ ice es que cont ra palabras conectadas en una sent encia sign ificat iva) tie nen un impacto
no contempla la natu raleza acústic a del ca nal de co mun icación: relacion es de importante en los resultados. Sin embargo, la acúst ica de esos tiempos no po-
S R ópt im as pueden corresponder a una int eligibilidad deficiente si, por eje m- día diferenciar cuant itativamente ent re las dos secuencias. Tampoco incluí a
plo, la sala presenta un eco destacado. ele mentos propi os del ca nal de co mun icació n, co mo e l patr ón de reflexiones
o la reverberaci ón , n i cont emplaba algunos efectos psicoacústicos relevantes
Índice de articulación (Al) com o el en masca ramien to . Era necesario hallar otro mét odo de evaluac ión
que superase estas limitaciones.
El primer estudio sistemático y profund o sobre la inteligibilidad del habla fue
realizado por Harvey Flet cher dur ante la década de 1940 en los Laboratorios Índice de transmisión de la palabra
Bell. Fletch er y su equipo, a partir del estudio de la relación seña l/ruido de ca-
da banda de un te rcio de oc ta va, crearon el índice de articulación ( Al) , un ex- Introdu cid o por Stee ne ke n y Houtgast, el índice de tra nsmisión de la palabra
celent e métod o para evaluar los efecto s del ruido en la inteligibilidad. es básic amente un a ve rsión mejorad a del índ ice de la artic ulación
( ST I) 6
El Al es básicamente un a medid a de la int eligibilidad basada en el coci en- qu e incluye las d istorsiones tem por ales en el can al de comunicación (S tee-
te seña l/ruido en cinco bandas de octav a. El cálcul o del Al consiste en tres pa- nek en y Ho utgast , 1980) . El ST I se basa en las ex pe rie nc ias de det ección de
sos básicos: medición del cocie nte seña l/ruido eficaz para cada band a de modulaci ón descr iptas en el punto 3 del capítulo Il . Las seña les del habl a se
octava , aplicació n de un factor de co mpensación tab ulado para cada banda y co nsider an com o un flujo de ene rgía con va riacione s espec tro -te mpo ra les y
c álcu lo del valor med io. La siguiente ecu~ción sint et iza el procedimiento: el grado de preservación de estas va riac iones a tr avés del cana l de co mun i-
cació n se tom a co mo un a med ida de su fideli dad. Los autores argumentaron
que la conse rvaci ón de la envo lve nt e d inám ica imp lica la preservaci ón de
Al = ~ i (LA eq , señal - LAeq, ruido + 12) dB sus co mpone ntes de Fouri er en el pu nto de recepción . El n ivel continu o
30dB .=1 eq uiva len te de la seña l del h abla es sust ituido por un a seña l teó rica de prue-
ba, cuya intensidad es modu lad a po r una func ión sin usoida l co n un índ ice
en la que el factor de comp ensación G liI vale: de la mod ulació n m = 1. C ua lq uier deg rad aci ón de la seña l en el can al de
co mun icac ión aparece rá co mo un a reducci ón en el índ ice de la mod ula-
ci ón en el punto de recepc ión. S tee ne ke n y Houtgast aco nse ja n el emp leo
Frecuencia [Hz) GIiJ de señ a les mod ulador as de frecue nc ias comprendidas entre de 0,4 y 20 H z
pa ra re presentar el grado de intel igibil idad a todas las tasas de oc urrenci a
250 0.072 del habl a.
500 0. 144 Si f repr esenta la frecuencia de la señal modul adora y t es el tiem po en se-
1000 0.222
gundos, entonc es la int ensidad de la señal de prueba es modul ada por la fun-
2000 0.327 ción 1 +cos(21tft). El índ ice de modul ación en el punto de recepción es
4000 0.234 fun ción de la frecuencia y se calcula con la siguiente expresión, que se dedu-
ce de la repu esta discret a al impulso entre los ext remos del ca na l:
El índice de articulación no es sensible a los cambios en la reverberación y a la
presenc ia de distorsión temporal en el campo acúst ico, factores que sí contem-
plan los ensayos de articulació n. Por ello se limita su aplicación a campos acústi-
cos sin defectos ostensibles y con un tiempo de reverberación máximo de 0,5 s. 6 Del inglés Speech Tra nsmission Index.
262 263
(-j1rf~)
L ll,¡ e
Usando mediciones empíricas de las señales reales de prueba, es posible medir
el STI de cualquier sala o sistema de comunicación. Si se reduce el número de
n ri
m(f)=---- bandas de octava se puede construir un sistema mucho más sencillo y rápido
denominado RASTI,7 que permite determinar la inteligibilidad del habla en
L ~2n n tiempo real.
Pérdida de articulación en consonantes

en la que c es la velocidad del sonid o y rn la trayectoria entre el em isor y el re-
cepto r. Si se desea incluir el efecto del ruido de fondo se la debe modificar de Como la inteligibilidad de la palabra depende en gran medida de la audición
la siguiente manera: correcta de las consona n tes, a veces se emplea un índice denominado pérdida
de articulación en consonantes (% Alcons) que se ca lcula únicamente en la ban-
da de 2.000 Hz. Es un índice apropiado para predecir la inteligibilidad por
software durante la et apa de diseño de una sala. Por ejemplo, a distancias rna- .
m'(f)= m(f) - - - -
yores que el radio de reverberación, la pérd ida de arti culación en conson antes
se calcula de la siguiente expresión :
aquí Is es la intensidad promedio de la seña l del habla en el punto de recep- %A lcons = 9 TR ~

ció n e IRla intensidad del ruido de fondo. l-a
En esta funci ón se manifiestan los efectos del patrón de reflexiones y de
la reverberación. También es posible deducir de manera senci lla un cociente en la que TR es el tiempo de reverberación glob al en segundos, S es la su-
seña l/ruido aparente: perficie interior total de la sala y a es el coeficiente de absorci ón medio de
la sala .
(S/R)ap = 10 log m(f) )
, ( 1- m (f)
Ayuda visual
Si se recort a cad a cociente indiv idual a un valor limitado entre + 15 y -15 dB, Se sabe que la lectura de los labios permite que las person as hip oacú sicas par-
se calcul an las relaci ones SIR aparent es por bandas de octava y se promedian ticipen en una conversación. Las personas con oíd o normal tambi én se bene-
los valore s de las 14 bandas involucradas, queda: fician con la información visual y, si bien no les perm ite la comprensión
completa del discurso hablado, la recon strucción fonética en presencia de rui-
14
do se facilita al observar el rostro del locutor.
L (S/R) ap Se ha comprobado que la información lingüística se comprende mejor
(S/R) a = o_c_L._1 _
cuando se la transmite por televisión que por radio (Re isberg y McLean,
p 14
1987). MacLeod y Summerfield encontraron que el"beneficio de la lectura de
labios" corresponde a un aumen to promedio de 11 dB en la relación señal-rui-
El índice de transmisión de la palabra (STI) repre senta una razón linealizada do del sistema y Ostberg prob ó que el tamaño del monitor de video también
de la forma: contribuye en el mismo sentido (McLeod y Summerfield, 1987) . Estas obser-
(S/R) ap + 15 vacio nes confirman la idea intuitiva de que la información visual contribuye
STI=-~-
30 7 Del inglés Rapid Speech Transmission Index.
264 265
100
Apéndice 1
80
1!J'" Teorema de Fourier
~
8 60
2'"
'"
Q)
:::l
40
o.
'"~
Q)
"O
Q) 20
Se
Q)
~
O O
[L
El teorema de Fourier se puede enunc iar de la siguiente man era: "Toda función
-30 -20 -10 o peri ódica de período P pued e descomp on erse en una suma de sinusoides armó-
Relación Señal I Ruido (dB) nicas, de amplitudes y fases adecuadas, cuyo primer armónico o fund amental
posea período P".1 En otros términos, una suma de sin usoides armón icas gene-
Figura 16. Au mento de la inte ligibilidad en condiciones de ruido al agregar informac ión ra una onda periód ica cuyo per íodo coincide con el período de la sin usoide de
visual
menor frecu enc ia, llamado primer armónico o fundamental de la serie. El teore-
ma permite descomp oner y ana lizar cualquier funci ón per iódic a y h abi lita la
a mejorar la intel igibilidad, sobre todo en condicio nes adversas provocadas posibilidad de construir seña les per iódic as co mplejas a partir de una suma de
por la existencia de ru ido en el canal de comunicación. sin uso id és puras.
En la figura 16 se observa el resultado del experimento de Ben oit , en el Rec ord emos que una sucesió n es armón ica cuand o presenta una base y to -
que se midió la intel igibilidad en función de la razón seña l/ruido en dos situa - dos sus múltiplos. Es un caso part icular de suces ión aritmét ica en la que la ba-
ciones diferentes : sólo audición y aud ición más visión (Benoit , C. et al., 1994) . se aa coincide con la razón k (a n = aa + n k con k = aa). Por ejemplo, una
La visión es innecesar ia en condic ion es acústicas óptimas (SIR > O dB), sucesión armó n ica de base 5 es: 5, 10, 15, 20,25 , oo . , n x 5; y una de base 300:
pero resulta decisiva en condiciones acústicas alta mente degradadas (SIR = -24 300, 600, 900 , 1200 , ... , n x 300. La diferencia entre dos valores sucesivos, o
dB) en las que la informació n auditiva no alcanza para entender el discurso lin- razón de la sucesió n armónica, es igual al valor de la base. A sí en el último de
güíst ico. los ejemp los 1.200 - 900 = 300; 900 - 600 = 300, et cét era.
La disposición de las amplitudes y frec uencias de las sinusoides involucra-
das en la suma se den omina espectro de Fourier, y cada una de ellas toma el
nombre de componente de Fourier.
Aunqu e la complej idad de las operaciones matemát icas involucradas en
el cálculo de los armón icos es grand e, en la actualidad ex iste n numerosos pro-
gramas de computación que los realizan con gran eficiencia. A un sin realizar
grandes esfuerzos matemáticos podemos extraer n umerosas conclusion es cua-
litativas que son de util idad. Por ejemplo, el teor ema dice'que una función pe-
riódica posee un espectro armó n ico. Si tenemos una seña l periódic a y
1 En realidad existen cie rtas restricciones matem át icas: las funciones deben ser seccío na l-
mente co ntinuas además de periódicas . Afortunadamente, las que interv ien en en acústica
musical cumplen con estos req uisitos.
266 267
los motivos de su empleo en gran cantidad de ap licac ion es prácticas. La voz
humana y algun os instrumentos, co mo el vio lín o el oboe, generan señales que
2 h=2mm
se le apro ximan .
E Tiempo (ms)
.§. Reconstrucción de parciales por batido
.§ o
ro
a.
W
Vl
-1
Dos sin usoides de distinta frecuencia baten a un a tasa igual a la diferencia de
frecuenc ias entre ambas. Como las compone ntes de Fourier son sinusoides, es
-2 de espera r que este fenómeno tenga .lugar para todo par de comp onentes ar-
mónicos que se conside ren . Si fn y fmson las frecuencias de dos armónicos
Periodo
P= 10 ms cualquiera, la frecuencia de batido seráfb = fm - fn ' La frecuencia de batido en-
tre armó nicos siempre va a co inc idir con la frecuencia de algún armónico de
la serie. En particular, dos com pon entes consecutivas bate n a la frecuencia de
0,64 A=O ,64 mm la funda mental. Por ejemplo fz - f, = fl ; h - f2 = fl; ... ,fn - fn.! = fr·
E La armonicidad de un espec tro refuerza la periodicidad dada por su fun-
.§. f, =1/ P = 100 Hz
"C
dam ental. Incluso, aunq ue falte la fundamental, la frecuenc ia que le corres-
=ª
c. 0.32 r, = nf ,
E
ponde se reconstru ye a partir del batid o de sus armónicos . Este fenómeno , de
« Frecuencia (Hz)
gran importancia musical, se cono ce como fundamental perdida o fantasma de
0,213 .........., I I
la onda .
Un eje mplo de reconstrucción de la fundamental se da cua ndo se repro -
duc e música a través de un altavoz pequeño, incapaz de radiar ond as de baja
f, = 100 Hz f, = 500 Hz f,o = 1000 Hz
frecuencia . Como la mayoría de los instrum entos graves -contrabaj os, fagotes
o bajos eléctricos- produce n seña les espectralmente ricas en armónic os, se
Figura 1. Gráfico temporal y espectral de un a onda diente de sierra pueden oír los bajos de la música porq ue los primeros armó n icos se reconstru-
yen po r bat ido a pesar de no estar presen tes a la salida de l altavoz. El fenóme -
no de fund amental reconstruida ta mbién puede originarse durante el proces o
conocemos su período, sabe mos inmedi at amente: 1) que el espectro corres- de percepc ión . Ocurre, por eje mp lo, cuando dos seña les acceden, a través de
pondiente será armónico, y 2) cuáles serán las frecuencias de cada uno de los auriculares, de man era independient e a cada un o de los oídos : en ese caso no .
armón icos (la co rrespondiente al período de la señal origi na l y sus múlt iplos). ex iste bat ido físico, de man era que la fundamental se reconstruye en algún lu-
I)l:scon oceremos, h asta q ue se ap lique completo el teorema de Four ier, las am- gar de la cade na neural de procesamiento superio r.
plitudes de cada uno de esos armónicos .
Co mo ejemplo aplicare mos el aná lisis de Fourier a la función diente de sie-
rm dibujada en la figura 1. El espec tro resultante nos muestra que posee tod os
I( IS armónicos posibles desde la fund amental hasta el infin ito. La amplitud de
cada lino de ellos va decreci end o a medida que aumenta la frecuencia según la
Il:YA" = Al / n, siendo n el número del armón ico, Al la amplitud de la funda -
1IIl:IHal y Al1 la amplitud del armón ico número n , Por ejempl o, el quinto armó -
nico tend r á una amplitud As = A l / 5, cinco veces menor que la fund amental.
En teoría, se de ben sumar todos los infin itos armón icos para sintetizar
cxncramcnte una onda diente de sierra. Es esta gran riqueza armónica un o de
:lóH 269
Apéndice II
Principio acústico de indeterminación
La serie de Fourier se pued e aplicar úni camente a seña les perm an entes perió-
dicas cuyos espectros son siempre armón icos y de líneas. N o es posible ana li-
zar con ella el estado transitorio de una seña l, que se puede definir como el
intervalo temp oral en el que una onda evolucion a de un estado perm an ente,
o estacionario, a otro. Así como ha y seña les totalmen te transi torias -la gene -
rada por el golpe sobre un a mesa es un buen ejernp lo-, ex isten otras que pre -
sentan ca rac te ríst icas trans ito rias en el comienzo y en la ex t inción,
perm an eciend o relati vamente estables dentro de esos límites.
Por oposició n al estado perm an ente, en el que toda oscilac ión es un a
combinac ión de sinusoides de dur ación infinita, el estado transi to rio posee
una dur ación finit a y necesariamente oc urre por lo men os al comenzar y fina -
lizar un a seña l. Cu alqu ier mod ificación de las condicion es de oscilación en
medi o del desarroll o de un a onda, como el ca mbio en la amplitud o la frecuen -
cia de algun a componente, form a part e del estado transitor io. El efecto de vi-
brat o, que cons iste en una variación periódica de la frecuen cia y/o de la
amplitud de aprox imadamente 7 Hz, origina en muchos casos la supresión del
estado permanente en la porción de seña l a la que se aplica. En seña les sin es-
tado perm anente el estado tr an sitori o coincide con su dur ación.
J. B. Fouri er desarroll ó la tranfomuula o integral de Fourier para extender el
alcance de sus series a tod o tipo de seña les, sean perm an entes o tran sitor ias.
Una de las deriv aciones más importantes de la tran sformada de Fourier esta -
blece que las seña les lim itadas en el t iemp o poseen espectros de banda. Se
puede concluir, por simetría, que los espectros de líne as, armón icos o no, co-
rresponden a señales n o limitadas en el tiempo.
Todas las seña les reales, obviament e limitadas en el tiempo, poseen anchos
de banda no nul os. La onda que gene ra un diapasón posee una gran duración
y un pequeño ancho de band a, mientras que la que produce un tamb or se ex-
tingue rápidamente y ocupa un ancho de band a considerable . Podemos pregun -
tar por la existencia de alguna relación general entre duraci ón y anc ho de
271
\
iñ' espectro contendrá una sola línea (como era de esperar). Si se analiza un im-
:2-
i!!
o pulso de duración tlt ~ 0, e! ancho de banda tlf será 1 dividido (casi) cero que
e
se equivale a infinito. Este resultado confirma que e! espectro de un impulso es un
-o
.¡¡; ruido blanco con un ancho de banda infinito. En e! caso intermedio de una se-
~
o.
Q) ñallimitada en e! tiempo -de duración finita- e! principio se aplica sin incon-
"O
Frecuencia (Hz) venientes. En la figura 1 se ilustra lo anterior con los diagramas temporales y
~
Z
/it=oo
f espectrales de una señal sinusoidal, de un impulso y de una señal de duración
M=O intermedia.
iñ'
:2- El principio acústico de indeterminación impone un límite inferior, pero
~ no uno superior: e! producto de la duración por e! ancho de banda puede al-
~
e
'.¡¡;
0
canzar valores considerables. Por ejemplo, e! ruido en una avenida muy tran-
~
o.
sitada posee a la vez una duración (tlt) y un ancho de banda (tlI) muy grandes
Q)
"O liempo (ms) y no viola por ello la relación tlf X tlt ? l.
a;
>
Z Es importante destacar que e! principio de indeterminación no se refiere
/it=o . a una limitación en la tecnología de generación de ondas o en e! mecanismo
!'1f= 00
iñ' de percepción humano, sino que describe e! comportamiento físico propio de
:2-
o
i!! los fenómenos ondulatorios. No existe la posibilidad de construir una señal
e
se que a la vez esté bien determinada en la frecuencia (pequeño tlI) yen el tiem-
-o \
.¡¡; po (pequeño tlt), cualquiera sea la tecnología utilizada. En otras palabras, no
liempo (rns)
~
o.
Q)
"O
a;
\.
Fr~~encia (Hz)
se puede construir un sonido tan corto como e! de un tambor y a la vez tan tó-
nico como e! de una flauta.
>
Z
Figura 1. Aplicación del principio de indeterminación a diferentes señales
banda. De acuerdo con e! desarrollo de Fourier las representaciones tempora-

les y espectrales son dos formas de interpretar el mismo fenómeno. El vínculo
que las relaciona se deduce sin dificultad a partir de la tranformada de Fourier
y se denomina principio acústico de indeterminación. Se lo puede enunciar de hl
siguiente manera: "e! producto entre la duración de! estado transitorio de una
señal y e! ancho de banda que le corresponde no puede ser inferior a un cierto
valor mínimo". Si tlf es e! ancho de banday tlt la duración del estado transi-
torio, el principio acústico de indeterminación establece, para e! caso general:
tlf X tlt ? 1
S i se aplica la relación anterior a una sinusoide, como en ella la duración tlt

tiende a infinito e! ancho de banda correspondiente (tlf? l/tlt ) será nulo y e!
272 273
Referencias bibliográficas
Ando, Yoichi (1998), Architeetural Acoustics. Blending SoundSources, Sound Fields , and
Usteners, Nueva York, Springer-Verlag,
- et al. (1997a) , "Acoustic Design of a Conc ert Ha ll App lying rhe Theory of
Subjective Preference, and th e Aco ustic Measu rement after Construcction" ,
Acustica & Acta Acustica, 83.
- Y Den nis Noson (1997b) , Music and Concert Hall Acoustics, Londres, Academic
Press Limited.
- (1985), Coneert Hall Acoustics, Berlín, Springer-Verlag .
Aronson, L. et al. (2005) , "C aract erísticas acústicas de la vocales del españ ol rio-
platense", public ado en int emet por la Fundación Arau z.
Attneave, E y R. O lson (1971) , "Pitch as a Medium: A New Approach ro
Psychop hysical Sca ling", American}oumal of Psychology, vol. 84.
Backu s, J. (1969) , The Acoustical Foundations of Music, Nueva York, W.W. Narran &
Company Inc,
Barren S. (1994) , "C haos, Self-Organ izatio n and Psycho logy", American Psychologist,
vol. 49.
Basso, G. (2005) , "Orden gen erativo, fract ales y música", en Revista del Instituto
Superior de Música UNL , N 2 lO, Santa Fe.
- (2004) , "Variables de diseñ o en campos acústicos no expon en ciales", en Actas de
las Terceras Jorn adas de Acúst ica Elect roacúst ica y Ár eas Vinculadas (CADAE),
Buenos Aires.
(2002) , "Fractales y estructuras musicales a utos e rnejan tes", en Actas de XV
Conferencia Anual de la Asoci ación Argentina de Musicología, Buenos Aires.
- (200 Ia), Análisis espectral. La transformada de Fourier en la música, La Plata, Ed. A l
• j
Margen - UNLP.
- (200 Ib) , "Fractales, ruido l /f y música", en Acras del Encuentro Nacional 2001 de
Investigación en Artes y Diseño (ENIAD 2001) , La Plata.
- (2000), "Percepción auditiva. Nuevos enfoques", Bemal, UNQ, mimeo.
- .(1999), "El prin cipio de indeterminación en acústica musical", en Acras de la XIII
275
C onfcrencia Anual de la Asociación Argentina de Musicología, Buenos Aires. C ha lmers, D . (1 996) , "El pro blema de la co nciencia" , Investigación y Ciencia, N º 233 .
- (1998a) , "Modelos estáticos y dinámicos en acú st ica mu sical ", en Actas de la 2ª C hion, M . (1998) , "Du son a la chose : hvpotheses sur l'obj et so no re", L'analysemllSi-
Conferencia lberoanericana de Investigación MlISical, Lanús. cale, vol. 11.
- ,J. G ui llén y M . Liut (2000), "Condiciones ne cesar ias para el uso musical efic az del Colburn , H. S. (1 995) , "Cornputa t iona l models of binaural proc essin g", Auditory
desplazamiento acústico temporal", Actas del 11 Congreso Iberoamericano de Co mputation, Nueva York, Springer-Ver lag.
Acústica, Madrid . Cook, P. (1999) , Music, Cognition , and Computarized Sound, Cam bridge , MIT Press.
- er al. (1998a) , "Límites de aplicaci ón del de splazamiento ac úst ico temporal", en C how n ing , J. (1999) , "Perc eptual Fusion and Audi tory Perspective" , MlISic, C ognition ,
Actas de la XII lomadas Argentinas de MlISicología, Buenos Aires. and Computarized Sound, Cook (ed. ) , Cambridge, MIT Pre ss,
- ct al. (1998b) , "El desplazam iento acúst ico tempor al. Ajuste de la expe riencia y uso Cole, R. y B. Scott (1974), "Towa rd a theory of speech perception", Psychological
musical ", en Actasde las III lomaáas del lnstituro l ulio E. Payró, Buenos A ires. RellÍew, vol. 8 1.
I\ékcsy, G . Von (1960), Experimen rs in Hearing, Nueva York, Wil ey.- Crowde r, R. G . (1989), "lmagery for musical ti mbre", l oumal of Experimental
I\cnade, A. H . (1 976), Fundam entals of MlISical Acous ncs, Nueva York , Oxford Psychology: Human Perception and Performance, vo l. 15 .
U nive rsitv Press C ulver, C. A . (1947 ), MlISical Acous ncs, Filadelfia, Black iston.
- (1960) , Horns , Stríngs and Harmony, Nueva York, Anchor Books . Delgut e, B. (1987) , "Pe riphe ra l aud itory processin g of speech in forrn ation", en The
Ilcn o!t, c., T. Mohamadi y S. Kandel (1 994), "Effec ts of ph onetíc context on audio- Psychophysics of Speech Percepnon, Países Bajos, Nijhoff.
visua l inrelligibtlirv of French speech in noise'', l oumal of S/JCcch & Hearing Dennett, D. C. (1 993), Coscienza, Mil án, Rizzoli.
Hesearch. Deutsch, D. (1999 ), The Psychology of Musíc, Nueva York, A cademi c Press.
Ik r:mck, L. (1996) , Concert and Opera Halls : How chey Sound, Nu eva York, Acoust ica l - (1995), MlISicalIUlISions and Patadoxes, La [ oll a, Philomel R. In c.
So ciety of A me rica . - (1992), "Parado jas de la to na lidad musical", Investigación y Ciencia, N º 193.
- ( 1988 ), AcolIStical Measuremenrs , Woodbury, A cou stical Sociery of Am érica. - (19 75) , "Two-cha n ne l listening to musical sca les", l oumal of che Acousnccl Sociery
- ( 1962), MlISic, ACOlIStiCS, and Architecrure, Nu eva Yo rk, W ile y. of America, vol. 57.
- ( 1954 ), Acousncs, McG raw HiIl [trad ., (1961) , Acústica, Buen os A ires, Edi tori al Di Liscia, O . P. (2000), "Sparial lisren ing and its co rnpute r sirnulatio n in elec tro n ic rnusic",
H ispan o Ameri cana]. en <http://de pts.wash ington .edu/smccweb/co urses/40 1-3/402e xamps/spatial.h tm l>.
I\islllark, G. von (1974), "Sharpness as an attribute of rh e timbre of stea dy so unds" , Diven yi, P. (1 992), "Binaura l suppression of non ech oes", l oumal of Experimental
Acustica, vol. 30. Psychology: Human Perception and Performance, vol. 91.
I\laucrt , J. (1997), Spatial Hearing. The psychophysics of human sound localization, - y Zak arauskas, P. (1992), "The effect of bandwidth on aud ito ry localizat ion : An
Ca mbridge, MIT Press. est ima t ion th eorv mod el", Proceedings of rhe 12th Intemational Symposium on
I\rcgma n , A . (1 994) , Audiwry Scene Analysis, C ambridge, MIT Press. Hearing, Lond res, Pergam on Press.
I\row ne ll, W. E. et al. (19 85) , "Evoked Mechanical Response of lsol at ed Coch lea r - y Da n ner, W. (1977) , "Discn mina t ion of ti me in terva ls marked by brief aco ustic
Ou rer Hair Cells", Science, vo l. 227. pulses of va rio us intens it ies and spec tra", Percept . Psychophys., vo l. 2 1.
I\urlc r, R. A . (19 69) , "Mo na ura l and binau rallocali zation of n oise bursts vert ica lly in Du rlac h, N . I. y L. D. Braida (1969) , " ln te ns iry perception, I. Preliminary th eo rv of
th e medi an sagg íra l plan e", l oumal of Audirory Research, vo l. 3 . intensiry resolution ", 1.Acousr, SocoArner. , vo l. 46, pp . 372-383 .
I\ull cr, D. (1 992) , T he MlISician's Guide ro Perception and Cognition , Nueva York, Eh resma n, D. (197 8) , "Perce pt ion of t imb ral ana logies'', Rapp orts IRCAM N ° 13/78.
Sc h irmer Books . Erickson, R. (1975 ), Sound Srructure in MlISic, Berkeley, Un íversirv of Californ ia Press.
•adoz, C. et al. (1993) , "CoRDlS-AN IMA : a Modeling and S irnulation Svstern for Sound Fechner, G. (1 860), "Elementos de psicofísica ", publicado en internet.
and lmage Svnthesis-The General Forma lism", Computer Music loumol, vol. 17. Feyman , R. (1971) , Fesica, Panamá, Fondo Educ ativo Latinoameric an o .
C arlso n , R., B. Granstrorn y S. Hunnicutt (19 82), "A rnulti-language text-t o-speech Fin e, P. A. y B. Moore (1993), "Frequency ana lysis and musi cal ability'', MlISic
module" , Proceedings of ICASSP, vol. 82 . Percepnon, vo l. 11. .
C arlyo n , R. y B. Moore (1984) , " In te ns lrv d iscrimin ati on: asevere departure from Fletc he r, H ., W. A. Mu nson, (1933) , "Loud ness, its definition, me asurem ent and cal -
Wcber's Law", l oumal of che Acousncai Sociery of America, vo l. 76. culat ion", l oumal of che Acousnca! Sociery of America, vo l. 5.
276 277
Flerch er, H. (1995) , "Speech and Hearin g in Co mmun ication - ASA Ed ít íon", reim- Helmh oltz, H. von (1885 ), Die Lehre von den Tonempfidungen [trad. en inglés, (1954 ),
preso, Woodbury, Am erican Institut e of Physics. On me Sensation of Tone, trad. A. J. Ellis, Nu eva York, Dover Publications].
Frnissc P. (1967), Psychologie du temps, París, PUF. Henning, G . B. ( 1970), "Co mparison of th e effects of signa l durat ion on frequenc y and
Fraser, J. T. (1992), 11 Tempo, una Presenza SconosciuU!, Milán, Feltr inelli. arnplitude discriminat ion ", en Frequency analysis and periodiciry detection in hear-
Freed , D. J. (1990 ), "A uditory correlates of perceived mallet hardn ess for a set of ing, ed. Plom p, Leiden , Sijthoff.
rccorded percussive sound eve nts", Journal of me Acoustical Society of America, Hirsch , 1. J. (1959) , "A uditory perception of temporal order", Joumal of the Acoustical
vol. 87. Sociery of America, vol. 31.
Frccrnan, W. (1991) , "Fisiología de la percepción", Investigación y Ciencia, Nº 175. Ho urgast, T. (1976), "Subharmon ic pitc hes of a pure tone at a low S/N ratio", Joumal
Ga rdner, M. (1968) , "H istorical Background of th e Hass and/or Precedence Effect ", of the Acoustical Sociery of America, vol. 60.
Joumal of the Acoustical Sociery of America, vol. 43. - (1972) , "Psycho physical evidence for later al inh ibition in hearing", Joumal of the
Garner, W. R. y G . A. Miller (1947) , "The masking threshold of pure tones as a func- Acoustical Sociery of America, vol. 51.
tion of durati on ", J. Exp. Psychol., vol. 37. - y Steeneken , H.. (1984), "A mu lrí-language evaluation of th e RASTI-Method for
G lasbcrg, B. y B. Moore (1990), "Derivation of audito ry filter shapes from notched estimating speec h int elligibilit y in aud ito ría", Acustica, vol. 54.
noise data" , Hearing Research, vol. 47. Houtsma, A. y J. Go ldste in (1972) , "The central origin of th e pít ch of pure tones: evi-
Gocrtzel, B. (1993), The evolvingmind, Nu eva York, G ordon and Breach Sci. Pub. dence from musical int erval recognition", JoJrnal of the Acoustical Society of
Goldstein, J. L. (1973) , "An opt imum processor theory for the cent ral formation of the America, vol. 51. \
pitch of complex tone s", Journal of the AcousticalSociety of America, vol. 54. - , T. Rossing y W. Wagenaars (1987) , Auditory Dernosrrcnons, ASA (cd y libro).
Goode, R. L. et al. (1994), "N ew knowledge about the functi on of th e hum an ear: Iverson, P. y C. L. Krumhansl (1989) , "Pit ch and timbre interact ion in isolated ton es
developmenr of an improved model ", Am. J. O roí., vol. .15. and in sequences", Joumal of the Acoustical Sociery of America, vol. 86.
G rantham, D. (1995) , "Spatial hearin g and related phenomen a", en Hearing, ed. B. Iverson, P. y C. L. Krumhansl (1993), "lsolat ing the dynamic attributes of musical tim -
Moore, N ueva York, Academic. bre", Joumal of the Acoustical Sociery of America, vol. 94.
G reen, D. M. (1973) , "Tempora l acuity as a functi on of frequen cy", Joumal of the [avel, E. ( 1980), "Codi ng of AM tones in the ch inch illa auditory nerve: implicat ions for
Acoustical Sociery of America, vol. 54. the pitch of complex tones", Joumal of the Acoustical Sociery of America, vol. 68.
G rcy, J. (1975) , An Exploration of Musical Timbre, CCRMA, Stanford Un iversity. [ohnson , D. L. y H. Gie rke (1974) , "A udibility of infrasound ", Joumal of the Acoustical
G uillaume, P. (1975 ), Pisicología de la forma, Buen os A ires, Psique. Sociery of America, vol. 56.
Hnas, H. (1951), "Uber den eingluss eines einfachec hos auf die horsamkeit von Karz, D. (1967), Pisicología de la forma , Madrid , Espasa-Ca lpe,
sprache" , Acustica, vol. 1 [trad. al inglés, (1972) , "The influence of a single echo Kemp, D. T. (19 78), "Stimulated Acoustic Emissions from with in th e Aud itory
on th e audibility of speech", Joumal of the Audio Engineering Sociery, vol. 20). Svstern", Journalof the Acoustical Sociery of America, vol. 64.
Hafter, E. y T. Buell (1990) , "Restart ing [he adapted binaural systern", Joumal of the Kend all R. A. y E. C. Ca rterette (1993) , "Verbal attributes of simultaneous wind
Acoustical Sociery of America, vol. 88. instrument timbres: 11. Adject ives induc ed from Piston 's O rchestration", Music
Hall, J. W.y R. W. Pete rs (1981) , "Pitc h from nonsimultaneous successive harmon ics Perception, vol. 10.
in quiet and noise", Joumal of the AcousticalSociery of America, vol. 69. Kend all, R. A., E. C. Ca rterette y J. M. Hajda (1999), "Na tural vs. syn the tic instru-
Hall, J. W. et al. (1984), "Detection i~ noise by spectro-ternporal pattern analysis", ment tones", Music Perception, vol. 16.
Joumal of me Acoustical Society of America, vol. 76. Klatt , D. H. (1989) , "Review of selected models of speech perception" , en Lexical
- y M. Fern ánd ez (1984), "The role of rnonoaural frecjuency selectivity in binaural Representation and Process, Ca mbridge, MIT Press,
ana lysís'', Jounial of the Acoustical Sociery of America, vol. 76. Klumpp, R. y H . Eadv (1956) , "Sorne measurements of int eraural time differenc e
Hall, D. (1991) , Musical Acoustics, Californi a, Brooks/Cole Publishin g Company. thr esholds", Journal of the Acoustical Society of America, vol. 28.
Handel , S. (1995) , "Timbre perception and auditory object identifícation ", Hearing, Kohler, W. (1972) , Psicología de la forma . Su tarea y últimas experiencias, Madrid ,
ed. B. Moore , Nueva York, Academic Press. Biblioteca Nue va.
- (1989) , Listening, C ambridge , MIT Press. - , K. Koffka y E Sand er (1962), Pisicología de la forma , Buenos A ires, Paidós.
'1
278 279
Kunish i, Masakazu (1993), "A udición bin aural ", Investigación y Ciencia, N " 20l. MiIler, G . y W. Taylor (194 8) , "The perception of repeat ed burst of noise", Journal of
Krumha nsl, C. (1990) , Cognitive Foundations of Musical Piteh, Nueva York , Oxford the Acoustical Sociery of America, vo l. 20, pp. 171-182 .
University Press. Miyara, E (slO, "Introducción a la psicoacústica", mimeo.
- y R. Shepa rd (1979), "Q uantifica rion of th e H íerarchy of Ton al Function s Within Moore , B. (1997) , An intToduction ro the Psychology of Hearing, Londres, Academic
a Diato nic Co ntex t", Journal of Experimental Psychology : Human Percepnon and Press.
I'L'Tfcmnance, vol. 5. - (ed .) (1995), Handbook of Perception and Cognition: Hearing, Londres, Aca demic
Kuhovy, M. (19 81) , "Integral and sepa rable d imen sion s and the theory of ind is- Press.
pensable att rib utes", en PerceptuaI Organiza tion, Erlbaum, HilI sdale . - et al. ( 1993 ), "Comod ulation masking release in subj ect s with un ilat eral and bilat-
Kuh l, 1'. K. ( 1993), "In na te predi sposition s and the effects of experience in speech per- eral cochlear he aring impa irrnent", Journal of me Acoustical Sociery of America,
ception: The narive langu age magnet th eory", en Developmental nenrocogníuon. vol. 93.
S¡Jeech and [ace processing in the [iTst yeaT of life, Países Bajos, Kluwer Academic - Y B. Gl asberg (1983) , "Suggested forrnul ae for ca lculating audito ry-filter bandwidths
Publishers. and exciration pattern s", Joumal of the Acoustical Sociery of America, vol. 74.
l.íhcnnan , A. er al. (1967) , "Perceprion of the speech code ", Psychological Review, vol. 74. Nei sser, U. (1967) , Cognitive psychology, Nue va York, Applet on- C entury-Crofts.
l.ihcnnan , A. y Mattinglv, I. (1985) , "The motor theory of speech perception revisited ", Ol son, H. (1952), Music, Physics and Engineering, Nueva York, Dover Public ati on s.
Cognition, vol. 2l. Ostberg O. , B. Lindstrom y P. O . Renhall (1988), "C ontribution to speech intelligi-
l.ihcrman, A. M. (1995), Speech,'peTception, C ambridge, MIT Press. bilitv by different sizes of videophone displavs", Proc . of the WOTkshop on
Lo , Y. O . (1987) , "Toward a Theory ofTimbre", Stanford , CCRM A , Stanford University. Videophone Terminal Design, Turín.
Mc/vd arns, S. y E. Bigand (1994): Penser les sonso Psychologie cognitive de l'audition, Patterson , J. y D. Green (1970), "Discrimina tion of Transien t S igna ls Having 1dentical
París, PUF. Energy Spectra", Journal of the Acoustical Sociery of America, vo l. 48.
McAd ams, Stephen (1995), Localisation Auditive, París, (RCAM . Patterson, R. D. (197 6) , "A ud ítory filter sha pes deri ved with noise stimuii", JOltmal of
I
Mc lclland , J. L. Y J. L. Elman (1986) , "The TRA CE Model of Speech Perception ", the Acoustical Sociery of America, vol. 59.
Cognitive Psychology, vol. 18. Pickles, J. (1988) , An Inrroducnon ro the Physiology of Hearing, Sa n Diego, Academic
Mcfadden, D. (1989) , "Spectral differences in th e ability of temporal gaps to reset th e Press.
mec han isrns underlying ove rshoo t", loumal of the Acoustical Society of America, Pierce, J. R. (1991), "Per iodicity and Pitch Percept ion ", Joumal of the Acoustical Society
vol. 85. . of America, vol. 90.
McG iIl, W. J. y J. P. G oldberg (1968), "A Study of th e near-rniss in volving Weber's - (1985) , Los sonidos de la música, Barcelon a, Ed. Labor.
l.aw and pure-to ne intensity discrim ination ", Perception and Psychophysics, vol. 4. Pison i, D. B. (1973) , "A uditory and ph on etic memory codes in th e disc rimina tio n of
McU urk , H. y J. MacDonald (1976) , "Hea ring lips and see ing voice s: A new llluslon ",' co nsona nts and vowels", Percepr, Psychophys., vo l. 13.
Naiuse, vo l. 264. Plenge, G . (1974 ), "On th e differen ce bet ween localizati on and lateralizati on ", The
McLeod A. y Q. Summerfield (1987), "Q uantifving the contributi on of vision to Journal of the AcousticalSociety of America, vol. 56 .
specc h perception in noise", BritishJoumal of Audiology, vo l. 21. Plomp, R. (1976), Aspects of Tone Sensation, Londres, Academi c Press.
Majern ík, V. y J. Kaluzn (1979), "On the aud itory uncertainl y relat íon s", Acusncs, vol. - (1967) , "Pitch of cornplex tones ",Journal of the AcousticalSocieryof America, vol. 4l.
43. - y Levelt, J. M. (1965) , "Tona l Co nsonance and C rit ical Bandwith", Joumal of the
Mulluun D. G . (199 8), "Spat ial hearing mechanisms and sound reproduction ", trad. al Acoustical Sociery of America, 38.
espa ño l O . P. Di Liscia, aut~rizada por el auto r, en <http://www.unq.edu.ar/cme/ Pollack, I. (1968), "A ud itory pulsed Doppler discrirninati on" , Joumal of the Acoustical
pcrson ales/odili scia> . I Sociery of America, 44 , pp. 592-598
Muu hew, Robert (1975), "Acoustics in perspectíve", en Auditorium Acoustics, Londres, - (1953) , "The Inform ati on of Elementary Auditory Displays", Journal of me
Appli ed Scie nce Publishers. Acoustical Sociery of America, 25, pp. 765-769.
I
Mathews, M. y J. Pierce (1980) , "Harrnony and nonharm onic partials", Journal of the Rand , T. C. (1974) , "D ichoti c release from maskin g for speech", Journal of me
Acoustical Sociery of America , vol. 68. Acoustical Sociery of America, vol. 55 .
2HO 281
Rund ell, M. (1993), "Mental models and comp lex systems: the adaptive dyn amics of Shackleton , T. M., et al. (1992) , "Across frequency integration in a model of lat eraliza-
cog n ítio n", en intemet, tion", Journal ofme Acoustical SOOety of A meriea, vol. 9 1.
Rasch, R. A. (1978) , "T he percepti on of sirnultaneo us notes such as in polyph on ic Sh ailer, M. y B. Moore (1987), "G ap detecti on and th e aud itory filt er: ph ase effects
rnusic", Acusncc, vol. 40. using sinusoidal stimuli", Joumal of me Acaustieal Society of Ameriea, vol. 81.
R a~ch , R. y R. Plom p, (1999 ), "The percep tion of musical tones", en The psychology of Shep pard, R. N . (196 4) , "Circularity in j udgmenrs of Relativ e Pítch", Joumal of me
music, ed. D. Deutsc h, San Diego , Ac adem ic Press. AeousticalSociety of America, vo l. 35.
It aylc igh , L. (1945) , The Theory ofS ound, Londres, Dover. Slawson , W. (1968), "Vowel qu ali ty and musical timbre as functia ns of spectrum enve -
RCPJ1, B. H. (1987) , "The sou nd of two hands clapping", Journal of me Acoustical lope and fundame nt al freq uency", Journal of Acoustical Sociery of America, vol. 43.
Sociery of America, vo l. 8 1. Sod erqui st, D. R. (1970) , "Frequenc y ana lysis and the critic al band ", Psychonomic
Rcisberg D. y J. McLean (1987 ), "Easy to hear but ha rd to und erstan d: A lip-reading Science, vol. 21.
advan tage with in tact aud itory stimuli", en Hearing by eye: T he psychology of lip- Spiegel, M. E (1981) , "T hresholds for tones in maskers of various bandw idth s and for
reading, New Jersey, Lawrence Erlbau m A ssoc iates. signals of various band widths 3S a function of signa] frequency", Journal of me
R i s~et, J. C. (1986), "Pirch and Rhyth m Paradoxes: Comme nt on A udi tory Paradoxes Acoustical Sociery of America, vol. 69.
Based on Fract al Waveform ", Joumal of me AcousticalSociery of America, vo l. 80. Steeneken, H . y T. Hou tgast (1980) , "A ph ysical meth od for measuri ng speech -trans-
- (l 978a ), "Musical A coustics", París, Rap por ts IRCAM N ° 8. mission quali ty", Journal of the Acoustical Society of America, vol. 67.
- (l 978b) , "Paradoxes de Hauteur ", París, Rapports IRCAM N ° 10. Ste rn , R. y C. Trah iotis (1995) , "M odels of bin aur al in teraction" , en Hearing, ed. B.
- ( 1978c ), "Ha uteur et Tim bre des Sons ", París, Rapports IRCAM N° 11. Moo re, N ueva York, A cade mic Press.
- y M. V. Mathew s (1969) , "A na lysis of Musical ln strument Ton es", Physics Today, Steven s, K. y B1umstein, S . (1981) , "The search for in variant aco ustic cor relates of
vol. 22. ph on etic features", Perspectives on me study of speech, eds, P. Eirnas y J. Miller,
Rissct , J.c., y D. L. Wessel (1999), "Expl orati on of timbre by analysis and svn th esis", HiIlsdale, Lawren ce Erlebaum A ssociates.
en The Psychology of Music, ed. D. Deutsch , San Diego, Acadernic Press. Srevens, S. S. (1975) , Psychophysies: Introduction ca its Percepruei, Neural and Social
Rirsma, R. ( 1967), "Frequenci es dorn in ant in th e percep tion a f t he pitch of co mp lex Prospeces, Nueva York, W iley & Sonso
sound" , Journalof the Acoustical Sociery of America, vo l. 42. _ (1959), "On th e valid ity of loudness sca le" , Journal of me Acoustical Sociery of
- ( 1962), "Ex istence region of the to nal residu e", Journal of me Acoustical Society of America, vol. 3 1.
America, vol. 34. _ (1935) , "The relat ion of pitc h to ín rensitv," Joumal of me Acoustical Sociery of
RllCk, 1. y S. Palmer (199 1), "El legado de la psicología de la forma ", Investigación y America, vol. 6.
C iencia , N º 173. _ et al. (1937), "A scale for the measurem ent of the psych ological magnitude of
Rllcdcrer, Juan (1997), Física y psicafísicade la música, Buen os A ires, Rícordí. pit ch", Journalof the Acoustical Society of America, vol. 8.
Rulz, Ricard o (1995) , Ideas para el estudio de la organización psíquica, La Plata, UNLP. Sund ber g, J. (1991) , T he Science of MusicalSound, Sa n Diego, Ac ade mic Press.
Schaeffer, P. (1966 ), Traite des Objets Musicaux, París, Edition du Se uil. _ ( 1987), T he Science of me Singing Voice, DeKalb, N orthe rn lll inois U niversity Press.
- ( 1952) , A la Recherche d'une Musique Concrete, París, Edition du Seuil [trad . en _ y Lind qvist , J. ( 1973 ), "Musical octaves and pitch," Journal of theAcoustical Sociery
castellano, (1959) , ¿Qué es la música concreta?, Nueva Visión] . of America, va l. 54.
Scho urcn, J. E et al. (1962), "P itch of the residue", Joumal of [he Acaustical Sociery of _ y Verrillo , V. (1980 ), "O n the ana to mv of che ret ard : A stud y of timing in rnusic ,"
America, vo l. 34. Journal of meAcoustical Sociery of America, vo l. 68.
Sc k, A. (1994) , "Mod ulation det ect ion thresholds and critica l mod ulat ion frequency Terhardt, E. (1974) , "Pitch , conso nance and harm on y," Journal of the Acoustical Sociery
based in rand om amplit ude and frequ ency ch anges", Joumal of me Aeoustieal of America, vol. 55 .
Soeiery of Japan, vo l. 15. _ et al. ( 1982a ), "Pitch of complex signa ls according to virtual-pitch theory: Tests,
Se tha res, W. A. (1993 ), "Loca l Conso na nce and th e Relation sh ip betw ee n Ti mbre examples, and predic tion s", J . Acaust. Soc. Am. , 71.
and Scale", Journal of me Aeoustical Soeiery of Ameriea, vo l. 94. _ y W. Dixon Ward (1982b), "Recogn ition of musical key: Expl orato ry study", J .
Sc tharcs, W. A. (1998) , Tuning, Timbre, Speerrum , Seale, Londres, Springer-Verlag. Acoust. Soc. Am., 72.
282 283
U nc moto, T. (1989 ), "The psycho logica l structure of mu sic'', Proccedings of che Firsc
lntemationalConference on Music Perception and Cognition, Ki oro. Índice temático
Vand erv eer, N. J. (197 9) , "Ecological A cou stic s. Human per ception of environmenral
so unds", Doctoral Thesis, U n ivers ity Microfilms N o. 8004002.
Van Dom mele n W. (1990 ), "Aco ustic parameters in human speaker recog n it ion",
Lang Speech, vo l. 33.
Van Noord en, L. (1975), "Te mpora l Coherence in the Perception of To ne Sequcnces'',
lnstituut voor Perceptie Onderzoek, Eindhoven.
Vica rio , G . B. (1997 ), "TIme in Psych ology", Sci. A m.
- ( 1967), Tempo Psicologico ed Eventi, Florencia, Gi un ti-Barbera .
A Blau ert, modelo de, 20 1
Vicm eister, N . F. (19 88) , "Psvchoph vsical aspects of aud ito ry intensity coding", en
Ad apt ación auditiva, 73, 82 Brillo del sonido, 187
Auditory Functions, ed. Edelm an, Nueva York , Wil ey.
Adaptación bínaural, 200
Wa llac h, H. et al. (1949 ), "The Preced en ce Effect in So und Local ízation ", American
Ada ptació n pato lógica, 74 C
[oumai of Psychology, vo l. 57 . Agregado auditivo, 215 Ca mpos acústicos virtuales, 212
Warr en, R . M . (1970) , "Elimination of biases in loudness jud gernen ts for ton es", Algoritm os psicoac ústicos Ca tego rías tempora les, 117
Joumal of the AcousticalSociery of America, vol. 48. de compresión, 113 Células ciliadas, 34
Warrcn, W. H . y R. R. Verbrugge (1 984 ), "A uditorv Percept ion of Breaking and Altura espectral, 133 Cóc lea (caracol), 32
Bounci ng Eve nts: A Case S tudy in Eco logica l Acoust ics'', Journal of Experimental A ltura residual, 140, 143 Color del sonido, 183
l'sychology: Human Perception and Performance, vol. 10. Altura ton al, 133 Co loració n espectra l, 204
Wcgcl, R. y C. Lan e (1924) , "The auditory masking of one sound by ano the r sound and Altura ton al en estímulos diacróni cos, 140 C ornodulaci ón, reducci ón del
A ltura tona l en estímulos sinc rónicos, 140 enmascaramiento por, LOS, 227
its probable relat ion to th e dynam ics of the inner ea r", Physical Review, vol. 23.
A ltura to na l, representación gráfica, 150 Co nducto coclear, 31
Wic r, G . c., W. [esteadt y D. M . Green (1 977) , " lmensi ty di scriminati on as a func t ion
An álisis auditivo del ento rno, 215 Co no de confusión espacial, 195
of frequencv and sensa tio n level", Journal of the AcousticalSociery of America, 6 1,
An álisis espect ro-temporal, 104 Conson ancia y disonancia, 160
pp. 169-177. ' Co nsonantes fricat ivas, 242
Aná lisis rnult idimen slon al, 171
Wc ssel, D. (1 978 ), "Low Dim ens ion al Control of Mu sical TIm bre" , París, Rappor ts A ncho de banda , 272 Co nsonantes nasales, 242
IRCAM N° 12. Ancho de banda rectangular equivalente, 92 Co nsonantes plosivas, 241
Whi ttl e, L. S. et al. (1972) , "T he aud ibility of low freq ue ncy sounds", J. Sound Vib., And o, modelo de, 51, L09, 20 1 Co nstancia de la sonoridad, 207
vol. 21. Aparato vocal, 240 Co nstancia del timbre , 187
Zwicker, E. (1 965) , "Te mporal effects in simulta neous mas king by whi te-noise burst", Ar móni cos, 267 Co nto rnos de igual sono ridad, 6 1
Journal of the Acoustical Sociery of America, vo l. 37. A tenc ión y timbre, 190 Co rresponde ncia tiempo-int ensidad, 200
- , G . Flottorp y S. S. Stevens (1957), "Crit ical Bandwidth in lo udness surnma t ion", e
Atributos dispensables indispensables, 149 Cor t i, órgano de, 3 1, 33
Joumal of the Acoustical Sociery of America, vol. 29. Audición analítica, 134
Audició n fuera de frecuencia, 94 D
- y H. Fastl (1999), Psychoacustics. Fac ts and Models, Berlín, Springe r-Verlag.
Audición sinté tica, 134 Datos espectra les, 198
- y H. Fast l (1990 ), Psychoacustics, Berlín, Sp ringe r-Verlag,
Aur iculares, 22 Decibel (unida d), 54
Zwislocki, J. J. y H. N . [ord an (19 86) , "On the relation of intensitv jnds to loudness Desborde acústico ("overshoot") , 77
Ayuda visual para la inteligibilidad, 265
and neural noise, Joumal of the Acoustical Socie ty of America, vol. 79. Desplazamiento acúst ico temporal, 128
B Desplazamiento permanente del umbral
Bandas críticas, 91, L03 (PTS) ,77
Batid os binaurales, 197 Desplazam iento te mporario del umbral
285
284
(TIS) ,75 Fonación, 24 1 Intensidad, cod ificac ión per iférica, 82 Modelo de supresión , 104
Detecc ión de asincro n ías, 127 Fonemas, 239 Intensidad , diferencia apenas per ceptible Modelos de doble población, 83
Detección de discontin uida des, 124 Formantes, 244 ( DAP ), 66 Mod elos tem po rale s, 142
Detecc ión de seña les en presen cia Fo urier, teor em a de, 267 Intensidad , di scr im inación de la, 66 Mod o ling üístico, 252
de ru ido , 77 Fourier, transformada de, 27 1 Intensidad , factor es espec tra les, 71 Moor e, mod elo de, 145
Diferen cia int eraural de inte ns idad (lID), Frecuencia, diferencia apenas perceptible Interferencia bin aural, 201 Morfofóri co, medio, 149, 189
190 (DAP) , 89 Intervalos di acrónicos, 156 MP3, cod ificac ión, 114
Diferencia int erau ral de tiempo ([TD) , 192 Fuente acús tica, 2 16 Interv alos musicales, 154
Dimensiones tímbri cas excl usivas, 187 Fun ción de t ransfe re ncia de la cabeza Inte rvalos sinc rónicos, 157 N
Disc rimi nación de parciales, 100 (HRTF),1 98 In var iancia de l timb re, 169 Ne rv io audi tivo, 40
Disparida des en el cu erpo de la se ña l, 200 Fun ción de transferen cia del o ído, 47 Inv ar iantes ac ústicas, 178 Neura l, respu estas de a lto ni vel , 48
Distorsión alineal, 110 Fundamental de Fourier, 134 , 140,267 Inv ersión temporal , 169 Nivel de intensidad (NI) , 57 , 61
Distor sión armó n ica , 47 Fundamental recon struida, 140,269 Is ófon as, c urvas , 6 1 Nivel de presión sonora (NPS) , 55
Distribució n de a rmónicos, 168 Fusión por armo n icidad, 2 17 Iso morfismo , 238 N iveles de um bral, 59
Dop pler, efecto, 2 11 Fusión po r ca mbios de a mpli tud y Iverson y Krumhansl, est ud ios de, 174
frecuencia, 220 . o
E Fusión por contraste con sonidos previos, 219 L O bjetos a udi tivos, 166,215
Ecos, 203 Fusión por disp arid ades en el ata q ue, 2 19 Ley de cierr e, 231 Ohm, ley acú sti ca de , lOO, 167
Ecos cocleares, 47 Fusión por locali zación de la fuente, 221 Ley de co ntin uida d, 233 O ído abso luto, 157
Efecto de ca fete ría, 2 17, 223 Fusión por periodi cid ad , 223 Ley de des ti no co mú n, 234 Oído ex te rno, 20
Efecto deprece de nc ia, 202, 222 Fusión y fisión rítm ica , 226 Ley de prox imidad, 230 O ído interno, 30
Emisión vocal, 24 7 Ley de semeja nza, 23 1 O ído medio, 24
Emis iones otoacús ticas, 3 7, 46 G Limen en frecuencia, 89, 137 Orden tempor al, 128, 226
Enmascaram ie n to, 101 G estalt , teor ía de la, 228 Lime n en inte nsidad, 66
En mascaram iento binaur al, 109 Goldste in, modelo de , 142 Lo, modelo de, 184 p
Enmascaramie nto no si multá neo, 106 G rey, mod elo de, 174 Loca lizac ión auditiva, 19 1 Pabellón auric ular, 20
Ensayos de art iculació n, 258 Loca lizac ión de seña les co mplejas, 197 Pascal (unidad), 54
Escala de alturas, 136 H Localización de seña les trans ito rias, 199 Patol ogía s aud iti vas , 77
Especializació n cere bra l para e l h abl a, 248 Hass, efecto , 20 2 Localizac ión mon oau ral, 197 Per cepción ca tegórica , 253
Espec tro de pot encia, mod elo del, 92 Hu esecillos del oído medi o, 26 Loc ali zación temporal , 129 Percep ción del habl a, 239
Espectrogramas audi tivos, 249 Loud ness, co ntrol de, 62 Pe rce pc ión del movimi ento , 2 11
Estado tr ansitor io, 271 Per cepción du al, 253
Estímulos sin usoida les, suma de, 71 Indi cador es acústicos invariantes e n el M Pérd ida de art iculación en consonantes, 265
Eustaquio, t rompa de , 26 habl a, 256 Medidor de nivel sonoro, 64 Perfil espectral, exam en del, 108
Excitac ión impulsiva, 44 Índice de arti culac ión, 262 Medid or es de so no ridad, 8 7 Perspectiva aud it iva, 206
Índice de t ransm isión de la pa labra, 263 Mel (un idad) , 136 Plomp, estudios de , 172
F Integración au diov isua l, 253 Mem brana basilar, 3 1, 43, 46 Potencia acús tica, 56
Factores espect rale s, 98 Integración tempo ral, 70, 119 Mem or ia de la inten sidad , 85 Presión d in ám ica , 54
Fase, informaci ón de , 39 Inteli gibilid ad de la palab ra, 257 Met am éricos, timbres, 189 Principio acústico de indetermi nació n , 95 ,
Fat iga aud it iva , 75 Inteligibilid ad , predicción de la , 260 Mínimo áng ulo de mov imiento 119 ,130,1 86,200, 248,271
Fcchner, ley de , 70 Intensidad ac úst ica, 56 pe rce ptible (MAMA) , 211 Principio de figura y fondo, 235
Filtros de modulación, 126 Intensidad , codificación co n tex tua ], 85 Modelo de cobertura, 104 Pri nci pio de inferencia inc onsciente, 228
Fletc her, ex per imento de , 91 Intensidad, codificación de la , 8 1 Mod elo de reconocim iento de pat ron es, Principio de pertenen cia, 235
Fon (un idad ), 61 Intensidad , codificación de rasgos , 85 141 Prin cipio de pregn ancia, 236
286 287
\1
,\
Propiedades emergentes, 228 'método de, 95
Psicofísica, ley, 62 Supresión lateral, 107
R T
Rango diná mico, problema del, 81 Tasa de ocurrencia en el habla, 251
Reclutamien to auditivo, 79 Tensor del tímpano, 29
Red neuronal, modelo de, 256 Teoría de los rasgos invariant es, 255
Reflejo acústico (en el oído medio), 29 Teoría del lugar, 42, 134
Refractario, estado, 38 Teoría del magnet ismo del lenguaje
Refuerzo electroacústico , 204 nativo, 255
Regularidad de datos físicos, 226 Teoría dob le, 196
Reissner, membrana de, 32 Teoría motora , 255
Relación señal/ruido, 93, 261 Teoría temporal, 134
Resistencia del habla, 257 Terdhardt , modelo de, 142
Resolución temporal, 118 Tiempo, problema de l, 117
Reson ancia de l filtro auditivo, 121 Timbre, 163
Resonancia del tracto voca l, 244 Timbre en la voz humana, estudios sobre
Resona ncia mecán ica el,182
(membrana basilar), 43 Timbre, defin iciones, 164
Reverbe ración , 208 Timbre, modelo clásico, 167
Risset y Math ews, método de, 180 Timbre, modelos de aná lisis por síntesis,
Ruido enmascarante de Patterson, 95, 119 177
Timbre, modelos verbales, 178
S T ímpano, 24
Scho ute n, experimento de, 142 Ton icidad, 134
Secuencias rítmicas, 225 Tonotopía, 42
Segregación auditiva, 217 Transducción en el oído medio, 27,3 7
Sensibilidad a la fase, 98
Seña les cuasi-periódicas, 223 U
Shepa rd, hélice de alturas to na les, 151 Umbral de audiblidad, 58
Shepard, sonidos de, 152 Umbral para estímulos complejos, 98
Sínte sis acústica, 170 Unísono tímbrico, 189
Slawson, estudios de, 183
Son (unidad), 63 V
Sonidos de combi nació n, 110, 112 Variación de datos acústicos en el habla,
Sonidos diferencia les, '110 251
Sonogra mas, 248 Vocales, 243
Sonoridad , 53 Van Békésy, esquema de, 101
Sonoridad, control de, 62 Voz humana, frecuencias fundamentales.
Stapediano, 29 182 .
Stevens, relación de, 64
Suma de locacion es, 203 W
Supresión, 82 Weber, fracción de, 68, 71, 84
Supresión de bandas por cobertura, , Weber, ley de, 68, 8 1
288

Basso Percepción Auditiva 2006 OCR

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Basso Percepción Auditiva 2006 OCR

Cargado por

Copyright:

Formatos disponibles

Gustavo Basso

UNIVERSIDAD N ACIO NAL DE QU ILMES

ISBN 987-558-082-1 Prólogo 17

1. Percepción A uditiva. 2. Sonido. 3. Tono. - 1. T ítulo

Canales semicircu lares

Para su estudio se lo divide en tres partes.:oído externo, oído medio y oí-

las partes del siste ma auditivo periférico . Antihélix - - - - -1'---1--

Concha (plato) ----+-+--~..

l. Ofoo EXT ERNO Concha (cavum) - - - \ - - \ - - \ -

tema completo puede ser ca rac te rizado co mparando -o midiend o- la presión -5

Figura 6. Vibración relativ a de l tímpano ante una excitación de 525 Hz y 121 dB

El tímpan o es una membran a semitranspa rente co n forma de con o co n un a su-

ga con dificultad a la cara interna, aun con la trompa de Eustaqui o abierta. La

Pared del canal

Figura 14. C orte transversal de la cóc lea en su parte media

Proceso de transducción en las células ciliadas internas

Proceso de tmnsducción en las células ciliada: externas

En la figura 30 se co mpa ra a 5(w ) co n la sensi bilida d pro med io de l oí do 30 ,..-----.-----.-----r-----,------,

Figu ra 29. Función de tra nsferencia del oído medio C( oo)

0,1 0,2 0,5 2 5 10 20 50

sea más cercan o a la realid ad pensarlo com o un a estructura bidimension a l -la

terno y gene ra movimientos de amplitud prop orcion al en el t ímpan o, en los

Martill o neu mático

en la que Po es la den sidad media del aire y c es la velocidad de propagac ión

Figu ra 1. Relación entre presión d inámica y n ivel de presión sonora en decibeles

nésimas de pascal (20 IlPa ), o a una amplitud de movim iento de 10-11 m (o O

0.02 0.05 0.01 0.2 0.5 2 5 10

Magnitud Naturale za Unidad Rango audible

Amplitud Física Metro 1O - 1Im _IO - 5 m

Nivel de int en sidad (NI) Física dB OdB - 120 dB

3. DISCRIMI NACiÓN DE LA INTENSIDAD

Varias defi niciones de la diferencia apenas perceptible (DAP o JN D13) en inte n-

En contraste con los resultados anteriores para ruido de banda ancha, la

l x t = cte. k [0.3 < nk (IJn)0.3 , para n > 1

U n eje mp lo nos permitirá co mpre nder cómo se estructura la sonoridad total

~ 10 D etección de señales sin u soidales en presencia de ruido

Figura 16 . Pérdid a perma nente de aud ic ión para f = 4.000 H z

El problema del ran go din ámico

Figur a 20 . Mode lo de Moore en bloques para calcu lar la sonoridad

(l . M ODELOS DE PERCEPCIÓN DE LA SONORIDAD

N' = e [(1señal)ll - (1 umbral )a J

1. D IFERENCIA APEN AS PERCEPTlBLE ( DAP) EN FRECUENCIA

1 En inglés, just noticeable difference.

18 Frecuenc ia Frecue ncia Frecuencia

0,4 Experime nto de Fletcher

Fi¡.:ura 8. Posición de l máximo de resonancia en la membrana basilar al ser estimulada

Fonna del filtro auditivo N úmero de ERB = 21,4 10glO (4,37 f + 1)

'" S ONO RIDA O ANT E ESPECTROS CO M PLEJOS

C)~. Sonidos de combinación de segundo orden

El espectro de los son idos de combinac ión de segundo orden o cuadráticos se

7. A LGORITMOS PSICO ACÚSTICOS DE COM PRESiÓN

El fenóme no de en masca ra m iento se emplea desde la década de 1980 en el di-

Señal de Señal de audio

la música y de siste mas multimedia.!' El algoritmo de compresión/descompre-

11 La pa rte de audio de MPEO - l (norma ISO/lEC 15 11172-3) fue establecid a en 1991 y co n-

o Frecuencia (escala lineal) +

Figura 3. T écn ica de Patrerson aplicada a un a sinusoid~

Efectos de la fre cu encia central en la resolución temporal

En general, los experimentos en los que se int en ta determinar el umbral de de-

Detecc ión de disco n tin u idades en sin us oides

Discriminación en secuencias de Huffman

El desplazam iento acústico temporal

I En la lite ratura en inglés se la denomina pitch chroma.

tUl d incomp leta (Basso, G., 2001a ). -30 _ _ 1_ _ _ __-