La Dimension Sonora Del Lenguaje Audiovisual (Resumen) PDF

LA DIMENSIÓN SONORA DEL LENGUAJE AUDIOVISUAL
Introducción
El sonido es una parte integral e inseparable de la globalidad del lenguaje audiovisual.
El nivel de desarrollo actual del conocimiento sobre lenguaje audiovisual todavía no permite una
aproximación multidimensional y simultánea sonido-imagen, si esta se desarrolla desde una metodología
rigurosamente empírica.
Lenguaje audiovisual/ dimensión auditiva/ universo sonoro
Nos ocuparemos del sonido, de su percepción, y de la expresión a través de él. El criterio de trabajo será
siempre el de entender el audio como parte integrante del sistema global sonido-imagen; y las
sensaciones sonoras como parte integrante del sistema global de la percepción.
Tradicionalmente, en el entorno de la comunicación de masas, el sonido ha sido relegado a un segundo plano

frente a la imagen.
Importante intentar la inversión de esta tendencia.
El universo sonoro es el ámbito en el que se produce la comunicación de las sensaciones más primarias,
esenciales y difícilmente susceptibles de racionalización que el ser humano es capaz de expresar y percibir.
Por ejemplo, el papel fundamental del sonido en la comunicación emocional.
Este libro es una investigación sobre las posibilidades expresivas del sonido en su sentido más amplio,
tomando como referencia esencial los mecanismos perceptivos con independencia del medio que pueda
vehicular el sonido en cada momento.
CAPÍTULO 1
Sobre los planteamientos metodológicos que orientan esta obra
Criterios epistemológicos y metodológicos desde los que abordaremos la comunicación audiovisual como objeto de
estudio y marco conceptual de trabajo
1.1 La subjetividad como problema metodológico en las corrientes clásicas de investigación

sobre lenguaje audiovisual
La investigación sobre lenguaje audiovisual se ha desarrollado hasta ahora siguiendo dos grandes corrientes
paralelas:
1. La primera inspirada en el estructuralismo y apoyada en la lingüística y la semiótica
2. La segunda centrada en los problemas productivos, partiendo de la tecnología. Análisis fragmentado
en función de los distintos medios (cine, radio, tele, internet)
El argumento tradicional y recurrente en contra de los resultados obtenidos a partir de estas dos grandes líneas
de estudio ha sido el de subjetividad.
Con el método introspectivo, el investigador se toma a sí mismo como receptor-tipo, y si el investigador

también es autor de productos audiovisuales, se genera un bucle metodológico.
La mayor parte de la investigación sobre lenguajes están determinados por el punto de vista del emisor
(director, narrador, realizador, escritor, guionista, compositor…) Así que la investigación queda limitada a
una sola parte del modelo clásico de la comunicación: el emisor.
Es necesario que la investigación sobre el lenguaje audiovisual se fije también en el receptor. Se puede lograr
intentando que las investigaciones logren responder a la pregunta:¿es esta interpretación del mensaje
extensible a todos los receptores posibles?
Frente a cualquier estímulo estético o narrativo los distintos receptores perciben sensaciones distintas, pero
tampoco lo es que una parte de estas sensaciones son también coincidentes. Sin coincidencias de
descodificación de todos los receptores frente a un mismo estímulo, la narración audiovisual no sería posible.
1.2. La alternativa de las metodologías cualitativas
La tendencia actual para resolver ese efecto de subjetividad de la investigación centrada en el emisor es la de
estudiar toda la complejidad contextual que envuelve la producción y la recepción de los mensajes.
Mientras la información contextual sea rica estamos en mejores condiciones para intuir algunos de los
elementos que influyen en la interpretación de los mensajes de determinados grupos.
Supone un avance en tanto que con estos criterios no estudiamos ya emisores aislados sino grupos que
comparten contextos, hábitos y culturas: no obstante las mismas características agrupadoras son, a su vez,
elementos diferenciadores de gran trascendencia.
1.3 La percepción humana como punto de partida
Los criterios del emisor que codifica los mensajes no van a coincidir siempre con los del receptor que los
interpreta.
¿Qué es lo que permite que determinados productos mediáticos den la vuelta al mundo sin problemas de
descodificación? ¿Y qué diferencia a éstos de otros que no lo consiguen?
Todos los seres humanos perciben los mismos estímulos físicos mediante los mismos mecanismos
fisiológicos, y estos mecanismos determinan la interpretación de cualquier variación del entorno según
nuestras características biológicas.
Así, uno de los puntos de partida esenciales en la investigación sobre la comunicación debe ser la percepción
humana.
Si la gama de frecuencias sonoras que percibe cualquier ser humano es prácticamente idéntica a la que
perciben todos los demás, y la gama de frecuencias lumínicas también lo es, es posible localizar variables
universales en los mecanismos humanos de interpretación de los mensajes sonoros y visuales.
En este trabajo nos aproximaremos a la percepción contemplándolo como un único sistema global. La lógica
perceptiva del ser humano no aísla el sonido de la luz, o el tacto, los objetos se ven y se oyen a la vez.
1.4. ¿Existe un lenguaje audiovisual distinto para cada medio?
El receptor se limita a ver y a escuchar, no necesita aprender previamente ningún código complejo. O bien
realiza este aprendizaje de un modo inconsciente.
El emisor sí que necesita aprender en profundidad el lenguaje del medio. Se articulan una serie de
convenciones que responden esencialmente a las necesidades de producción narrativa de cada medio de
comunicación en concreto. Estas convenciones no suelen preocupar al receptor, que se expone simplemente al
mensaje que le gusta o no, y lo entiende o no lo entiende.
La necesidad que tiene un realizador de resolver las dificultades narrativas mediante técnicas diferentes se
disuelve en los problemas perceptivos hasta desaparecer.
Sólo tiene sentido hablar de un lenguaje específico de cada medio desde el punto de vista del emisor,
pero no desde el punto de vista del receptor.
El oído actúa para todos los sonidos del mismo modo, sin diferenciar si su origen es radiofónico, televisivo o
cinematográfico.
La clave del conocimiento de los lenguajes está, entonces, en qué relaciones se establecen entre las
perturbaciones físicas del medio percibidas y la interpretación que hace el hombre de ellas.
No confundimos el lenguaje musical, que es la forma de estudio y de codificación de la música, con la música
como composición estética de formas sonoras.
Así, no debemos confundir el lenguaje audiovisual, como estructura organizativa conjunta de la imagen y el
sonido que persigue la comunicación eficaz, con la técnica de cada medio.
Mientras la técnica del medio intenta resolver los problemas derivados de las limitaciones tecnológicas para
organizar imágenes y sonidos, el lenguaje audiovisual responde a la capacidad humana para entender las
composiciones audiovisuales.
El lenguaje audiovisual es el conjunto de los modos de organización artificial de la imagen y el sonido

que utilizamos para transmitir ideas o sensaciones, ajustándonos a la capacidad humana para percibirlas
y comprenderlas.
Objeto de Estudio: partir de la perspectiva del receptor para estudiar los mecanismos de la
expresión/percepción sonora como un objeto de estudio único que alcance y abarque a cualquier medio de
comunicación que utilice el sonido como instrumento expresivo.
1.5 El lenguaje audiovisual como objeto de estudio
1.5.1. Definición y características esenciales
Características específicas del lenguaje audiovisual como objeto de estudio:
- Entenderlo como los modos artificiales de organización de imagen y sonido que usamos para
transmitir ideas o sensaciones, ajustándonos a la capacidad humana para percibirlas y comprenderlas.
- Para estudiarlo, uno de los instrumentos científicos es la psicología de la percepción.
- Aunque el lenguaje audiovisual es más complejo que la percepción humana, pues la incluye
parcialmente en algunos aspectos, y la rebasa en otros.
La psicología de la percepción se preocupa de: (2 definiciones complementarias)

-cómo el ser humano percibe e interpreta la información del entorno o del propio organismo//
-cómo el hombre, de toda la información disponible, recoge sólo la que es importante para su supervivencia
dentro de su ecosistema.
- Otra característica del lenguaje audiovisual es su similitud formal con la información natural¸ simula
artificialmente las perturbaciones físicas del entorno humano, de manera consciente y voluntaria, por una o
varias personas.
- El lenguaje audiovisual es un conjunto sistematizado y gramaticalizado de recursos expresivos,

que han sido siempre previamente imaginados por un narrador, y que permiten estimular en el público
series organizadas de sensaciones y percepciones que se transformarán en mensajes concretos y
complejos.
- El fundamento de este lenguaje es el conocimiento de un sistema de recursos narrativos artificiales

que permiten emular muchas de las sensaciones que suele producir el entorno natural del hombre.
Tres características esenciales que dan una entidad propia y específica al lenguaje audiovisual como objeto de
estudio:
1. El hecho de que exista siempre voluntad previa por parte de unos emisores para estimular en
otras personas series organizadas de percepciones naturalistas simuladas.
2. Su capacidad de generar artificialmente mensajes que estimulan el sistema sensorial humano con
percepciones muy similares a las que se producen las informaciones naturales.
3. Su capacidad de articular dentro de él cualquier otro lenguaje basado en la percepción humana
Estos atributos del lenguaje audiovisual son los que le dan especificidad y lo diferencian tanto de otros
lenguajes, por ejemplo el del habla o el de la música, como de las informaciones indexativas de origen natural.
1.5.2 Sobre la dimensión naturalista del lenguaje audiovisual
El lenguaje audiovisual se construye sobre dos paradojas especialmente interesantes.
Desde el principio de la historia, el hombre desarrolla formas de expresión basadas en la imitación del entorno
mediante medios artificiales que han ido evolucionando.
Estas formas de expresión naturalista son simples desde el punto de vista perceptivo.
Mientras la percepción de los mensajes artificiales se parezca cada vez más a la percepción de la realidad, es
mucho más fácil para el receptor descodificarlos y comprenderlos.
Como lo que se persigue con el len. audiovisual es transmitir mensajes articulando estímulos que el receptor
ya conoce porque existen en el medio natural, el autor intenta trabajar cada vez con mensajes perceptivamente
más completos, para que la necesidad de lenguajes complejos sea cada vez menor.
Cuanto más abstracto es un lenguaje mayor es su dificultad de comprensión.
Así que la alternativa de lo audiovisual es facilitar la tarea al receptor, simplificando los códigos al usar
organizaciones expresivas que generan artificialmente estímulos muy parecidos a los naturales.
1.5.3 Sobre la naturaleza incompleta del lenguaje audiovisual
Una de las características esenciales que definen al lenguaje audiovisual es su capacidad de vehicular
narraciones mediante mensajes dirigidos simultáneamente a varios sentidos, de modo que se perciban de
forma muy similar a cómo son percibidos los fenómenos naturales.
La lógica de este lenguaje no está sólo determinada por el hecho mismo de la similitud formal entre el
mensaje y la realidad a la que se refiere, sino que se fundamenta también en las diferencias reales que
existen entre ellos.
Toda narración audiovisual se apoya siempre en un equilibrio constante entre:

a) la similitud naturalista del mensaje con lo contado
b) los recursos expresivos que escamotean su verdadera naturaleza de copia incompleta
Una de las características más interesantes del lenguaje audiovisual es la posibilidad de transformar su propia
incompletitud y sus propias dificultades técnicas en instrumentos narrativos útiles.
Los códigos narrativos del lenguaje audiovisual se configuran como instrumentos orientados a solucionar los
problemas de interpretación derivados de la diferencia que existe entre la percepción directa de la realidad
referencial y la percepción de las formas audiovisuales que la representan.
1.6 De la física a la percepción de los mensajes audiovisuales
La función básica del lenguaje audiovisual es simular de forma artificial las perturbaciones físicas
naturales del entorno humano para transmitir voluntariamente ideas o sensaciones.
Estas perturbaciones artificiales tienen que adaptarse a las capacidades de la percepción humana.
El lenguaje audiovisual nos permite manipular las formas físicas sonoras y visuales que percibe el ser
humano, a través de sus sentidos, de un modo concreto para estimular unas interpretaciones concretas,
desencadenando en el receptor sensaciones realistas controladas por el emisor.
La fenomenología de la comunicación audiovisual debe estudiarse desde un paradigma que incluya y rebase la
psicología de la percepción, añadiendo el análisis físico de las formas visuales y sonoras artificiales creadas
expresamente para la comunicación.
CAPÍTULO 2
La acústica y la comunicación audiovisual
2.1 La acusmatización
2.1.1 Desarrollo de un nuevo concepto
El concepto acusmatización tiene su origen en una técnica pedagógica utilizada por Pitágoras para
incrementar la efectividad de las enseñanzas que impartía a sus discípulos. Hizo que sus alumnos le
escucharan tras una cortina mientras hablaba para que así el contenido de sus discursos adquiriese toda la
fuerza posible al desvincularse de su propia imagen.
El término acusmático ha pasado a ser utilizado para denominar aquello que se oye sin ver la fuente de donde
proviene.
Hasta que se desarrollaron los sistemas de grabación y de radiotransmisión de los sonidos, para que un sonido
fuese acusmático el objeto físico que lo generaba podía estar escondido a la visión del oyente, pero nunca
alejado de él.
Con la evolución de la tecnología del audio, el objeto original productor del sonido ya no necesita esconderse
de la visión del oyente, sino que realmente desaparece; ya no tiene que coincidir con el receptor ni en el
espacio ni en el tiempo.
Esta independencia física que la tecnología del audio otorga al sonido ha pasado también a ser independencia
semiótica.
La acusmatización aísla los objetos sonoros y los convierte en portadores de conceptos.
Con mucha frecuencia, el sonido prescinde de su fuente y se conecta con un sentido nuevo que ya no tiene
nada que ver con su origen directo sino con su forma sonora y con su situación en el contexto audiovisual.
2.1.2 La acusmatización en la comunicación de masas
La posibilidad de trabajar con el sonido aislado permite a los narradores audiovisuales establecer nuevas
asociaciones virtuales entre sonidos e imágenes que no existen en el universo referencial.
Algunas de las opciones narrativas que ha dado la posibilidad de acusmatizar el sonido:
*El doblaje, permite la construcción de nuevos personajes partiendo de una recomposición del par voz-
imagen y posibilita mezclar los rasgos físicos y de expresión gestual de un actor con la capacidad de
expresión oral y sonora de otro.
*La ambientación musical en el cine etc, permite asociar melodías y ritmos instrumentales a situaciones en
las que desde un punto de vista realista sería absurdo que sonaran allí.
*La creación de efectos sonoros. Mediante la asociación de sonidos pregrabados en distintos lugares a
situaciones visuales filmadas en platós, ha sido posible conferir a las imágenes resultantes sensación de
realismo. (ej; selvas de estudio en hollywood ’50)
Al poder trabajar a voluntad con una nueva recomposición entre sonido-imagen, y en consecuencia, con una
recomposición virtual entre sonido y fuente sonora se han ampliado extraordinariamente las posibilidades
expresivas del universo audiovisual.
2.2 Los conocimientos necesarios para dominar el audio
2.2.1 La tecnología y la experiencia productiva
Cuando nos aproximamos al universo de la producción sonora audiovisual, el dominio de este universo parece
depender casi exclusivamente de un amplio saber sobre aparatos electrónicos y de la experiencia dilatada en
su uso.
La base de la tecnología del audio es la acústica, y la base de la experiencia productiva del realizador son sus
propios mecanismos perceptivos.
2.2.2 La acústica
La base fundamental de la ingeniería de alta fidelidad sonora consiste en garantizar que después de cualquier
manipulación electrónica, grabación, transmisión, edición etc, el audio conserva con exactitud su espectro
sonoro original.
La única forma de observar si esto es cierto es utilizando la acústica como disciplina de apoyo.
Los aparatos de audio, por muy sofisticados que sean, siempre alteran el sonido, y sólo la acústica nos permite
saber de qué modo.
2.2.3 La psicoacústica
La base de toda comunicación humana es la percepción, y en este caso la percepción del sonido.
¿es o no capaz el consumidor medio de valorar la diferencia de calidad de sonido entre ambos sistemas?
La mejora en la calidad del sonido que supone la tecnología digital no es el factor determinante en su
consumo.
La fidelidad en la grabación de audio no ha cesado de mejorar desde que Edison inventó el gramófono en
1877, pero este proceso parece haber llegado a su límite, que es el de la percepción humana.
El ruido de fondo de una pletina de casete analógica está en torno a los 18-20 dB, y el ruido de fondo de un
sistema digital está entre los 9-10 dB, aprox. la mitad.
Esta ventaja resulta poco importante teniendo en cuenta que no existe ningún entorno sonoro absolutamente
silencioso.
El nivel de ruido habitual en un contexto de audición “silencioso” es de unos 30-40 dB
Lo normal es que el ruido ambiente enmascare perceptivamente el levísimo ruido de fondo del audio
analógico, que lo esconda tras él haciéndolo inaudible.
Los sistemas digitales de audio suponen un avance poco útil para el oído humano, puesto que la capacidad de
resolución auditiva en condiciones que no sean las de un laboratorio, no permiten disfrutar de la mejora
acústica que supone el tratamiento digital del audio.
La psicoacústica, la integración sistemática de la acústica y la psicología de la percepción, es una disciplina

de apoyo esencial para todo trabajo sonoro vinculado a la producción audiovisual.
2.2.4 El sentido de aplicar la acústica al lenguaje audiovisual
En la voz.
Al construir dramáticamente un personaje, darle forma sonora y visual, aparece el problema de la elección y
adaptación de la voz del actor o su sustitución por otra voz (doblaje).
En la ficción audiovisual existe el fenómeno por el que ciertas voces transmiten unas determinadas
sensaciones y otras no. A menudo, el efecto que buscamos no aparece completo en ninguna de las voces de las
que disponemos.
El conocimiento de la acústica del espectro de la voz nos puede proporcionar toda esa información con mucha
precisión.
Por ejemplo, es posible saber como actúa el valor expresivo del tono, la frecuencia fundamental del espectro
de la voz.
El tono concreto de cualquier voz y su margen específico de variación son acústicamente cuantificables y
diferenciables de cualquier otra.
En el reconocimiento sonoro del espacio.

Consiste en reconocer las resonancias que se han añadido a sonidos que ya conocemos y que han sido situados
en otros contextos espaciales: pasos, voz, toses, ruido de papeles etc
El análisis previo de los tiempos de reflexión del sonido en cada uno de los espacios sobre los que vamos a
trabajar nos van a dar una información acústica valiosísima para definir la reverberación de cada espacio
visual de acuerdo con la experiencia auditiva natural que tiene cualquier oyente. Esto permite diferenciar unos
espacios de otros de manera verosímil y realista.
Otro problema clásico de la narración audiov. es resolver cuál es el tipo de sonido que le ha de llegar al
espectador en cada momento.
Tiene doble dimensión:

- La reconstrucción auditiva realista y
- la ubicación del espectador en el espacio de la narración.
El análisis acústico previo de los espacios que se van a recrear en una narración, abre un amplio universo de
posibilidades expresivas en la ubicación del espectador en estos espacios.
A partir del análisis de algunos de los parámetros acústicos del espacio:
-intensidad
-tono fundamental
-resonancias
-duración
-y evolución temporal
es posible dominar minuciosamente la situación espacial en la que queremos que se sienta el espectador
mientras escucha.
En la construcción de atmósferas emocionales.
El papel del audio tiene un gran protagonismo, y la adecuada aplicación de la acústica supondría una mejora
esencial.
Un problema habitual es encontrar el sonido capaz de comunicar una gran sensación de soledad.
Ej: en el sonido grillo es mucho más que el concepto de animal que canta por la noche. Es un fenómeno
preciso y matizado como la luz y el punto de vista, y para definirlo el instrumental acústico es imprescindible,
si no se quiere utilizar siempre el mismo decorado sonoro.
En la edición y el control informatizado del sonido.
Este es el ámbito donde la acústica resulta imprescindible para obtener rendimientos profesionales.
Existen sistemas que permiten la edición informatizada del sonido.
También el tratamiento lineal del timbre del sonido mediante la manipulación del espectro de frecuencias en
tiempo real.
Y la aplicación de algoritmos de compresión o de dilatación del sonido mediante el tratamiento de las zonas
estacionarias del oscilograma.
Cuando el sonido no cuadra con la imagen, el sistema lo recorta de manera que los fragmentos se reparten
proporcionalmente. El resultado es que el sonido se acorta sin que se note donde está el golpe de tijera.
2. 3 Del fenómeno acústico al sentido audiovisual
Vamos a desarrollara la definición de los conceptos esenciales que nos permitirán vincular sólidamente la
acústica con la percepción signica del sonido.
Cuatro conceptos básicos: -sonido

-fuente sonora
-objeto sonoro
-ente acústico
2.3.1 El sonido
Concepto de sonido como primera etapa de un proceso expresivo, como material físico perceptible en bruto
sobre el cual se van a efectuar una serie de manipulaciones para modelarlo, transformándolo en material
expresivo.
El sonido es ya en su esencia misma un puente entre la acústica y la percepción.

El sonido es el resultado de percibir auditivamente variaciones oscilantes de algún cuerpo físico, normalmente
a través del aire
El origen de un sonido es siempre la vibración de un objeto físico dentro de la gama de frecuencias y

amplitudes que es capaz de percibir el oído humano.
Definimos el sonido como:
El resultado de percibir auditivamente variaciones oscilantes de algún cuerpo físico, normalmente a

través del aire.
Tener en cuenta que la percepción del sonido no se realiza exclusivamente a través del aire.
Por ejemplo, a través de nuestro propio cuerpo. Este es el caso de la percepción que tiene todo locutor de su
propia voz.
Otra forma relativamente habitual de percibir la influencia del medio que transmite las vibraciones sonoras en
la percepción es comparando como suena algo con los oídos dentro o fuera del agua.
Por ejemplo, el ruido de un motor de lancha, cambia radicalmente según lo escuchemos con los oídos
sumergidos en el agua o no.
La diferencia se debe a la influencia del medio que transmite la vibración.
2.3.2 Fuente sonora
Tenemos que distinguir entre sonido y fuente sonora
Definiremos fuente sonora como:

Cualquier objeto físico mientras está emitiendo un sonido
Esta definición introduce en el concepto de fuente sonora la dimensión temporal, porque existe la posibilidad
de que los objetos físicos capaces de emitir sonidos, suenen o no de manera arbitraria.
Cuando una laringe no está emitiendo sonido no debe ser considerada como una fuente sonora.
2.3.3 Objeto Sonoro
Un objeto sonoro es un sonido concreto que hacemos objeto de nuestra percepción y de nuestro estudio.
Definimos objeto sonoro como:

Cualquier sonido que aislamos físicamente o con instrumentos conceptuales, acotándolo de una forma
precisa para que su estudio sea posible.
Definición inspirada en el concepto metodológico de objeto de estudio.
Como conceptos vinculados al de objeto sonoro, aunque de menor nivel porque los engloba, podemos hablar
de suceso sonoro y forma sonora.
Un suceso sonoro es cualquier sonido acotado en el tiempo.
Definiremos forma sonora como cualquier sonido identificable y reconocible a través de alguna de sus
características acústicas.
2.3.3 Ente acústico
Cuando el oyente reconoce la fuente generadora del sonido, el sonido deja de ser un objeto sonoro para pasar
a actuar en la mente del receptor como si fuese la fuente sonora misma.
Definimos ente acústico como:
Llamaremos ente acústico a cualquier forma sonora que habiendo sido separada de su fuente original
es reconocida por el receptor como una fuente sonora concreta que está situada en algún lugar de un
espacio sonoro.
Los entes acústicos son siempre acusmáticos, es decir, absolutamente independientes de la forma sonora
objetiva original.
Se trata de sonidos aislados que sólo están vinculados a un objeto físico en el cerebro del receptor.
(El sonido trino de pájaros puede haberse creado sintéticamente por un ordenador)
El valor expresivo de un ente acústico no depende de su origen productivo, sino de que éste sea reconocido o
no por parte del receptor como directamente dependiente de una fuente sonora.
El ente acústico es un signo específicamente audiovisual, que tiene como característica principal su enorme
verosimilitud.
Como signo audiovisual es de carácter naturalista.

CAPÍTULO 3
Del análisis acústico a la sensación
3.1 Entre el fenómeno vibratorio y el perceptivo
No todos los fenómenos vibratorios son perceptibles por el ser humano, pero el oído del hombre tiene una
extraordinaria capacidad de análisis para toda vibración simple o compuesta que esté entre los 17 y los 20.000
ciclos por segundo, y los 0 y los 120 decibelios (matizado).
3.1.1 Sonidos puros y sonidos compuestos
Sonidos puros: en referencia a sonidos constituidos por una sola frecuencia
Sensación auditiva extremadamente pobre y simple, poco agradable.
Ej: vibración de un diapasón, pitidos electrónicos,
Sonidos compuestos: aquellos formados por dos o más frecuencias
Este es el estado más natural del sonido
Los sonidos puros están generados por la vibración de cuerpos que tienen una estructura interna muy
homogénea, lo que hace que todas sus moléculas respondan frente a determinado estímulo físico vibrando del
mismo modo.
Las diferencias de densidad, forma, cantidad de masa etc, entre las moléculas de un mismo cuerpo hacen que
al ser estimulado físicamente, por ejemplo de un golpe, se originen dentro de él varias vibraciones distintas.
Imaginemos 2 cuerpos físicos ideales, formado cada uno por 2 moléculas.
Cuerpo 1: las 2 moléculas son iguales, formando un cuerpo homogéneo
Cuerpo 2: 2 moléculas de materias distintas, cuerpo heterogéneo
Movimiento vibratorio del Cuerpo 1
Al golpearlo, cada una de sus dos moléculas idénticas oscilará exactamente del mismo modo, trazando dos
movimientos vibratorio-armónicos simples.
La vibración global del cuerpo 1 es una vibración simple. Vibra de un solo modo, si fuera audible estaría
constituyendo un sonido puro analizable como una única frecuencia.
Movimiento vibratorio del Cuerpo 2
Al recibir el estímulo, cada una de sus dos moléculas C y D responderá de un modo distinto en función de su
propia masa y tamaño.
Cada una de las moléculas que los componen describirá un movimiento vibratorio armónico diferente.
La oscilación de todo el cuerpo 2, en lugar de producir un movimiento vibratorio-armónico simple lo
producirá complejo.
El movimiento global del cuerpo 2 es una única oscilación compleja, que si fuera audible estaría construyendo
un sonido compuesto, y que al analizarlo daría como resultado dos frecuencias diferenciadas.
Normalmente todo cuerpo físico es heterogéneo en su forma, en su masa o en ambas cosas. Al ser estimulados
de modo que vibren con frecuencias audibles, las distintas oscilaciones internas de estos cuerpos heterogéneos
componen un único movimiento complejo global que se traduce perceptivamente en un sonido compuesto.
forma 2 de crear un sonido compuesto.

Cada molécula de un cuerpo físico puede responder también, moviéndose simultáneamente de formas
diferentes frente a estímulos distintos, organizando así vibraciones complejas.
Esto corresponde con el caso de los objetos que suenan de forma completamente distinta según se les golpea
en un lugar o en otro. Cada uno de los golpes hace vibrar al cuerpo en cuestión de manera diferente, y en
consecuencia, produce un ruido distinto.
La tercera forma de construcción de un sonido compuesto es la suma de las dos anteriores.
La de un cuerpo que, además de ser heterogéneo, está sometido a varios estímulos distintos que hacen vibrar
cada una de las moléculas de varias formas diferentes.
El resultado es una vibración muy compleja compuesta por las suma de tantas frecuencias simples como tipos
de movimiento en el interior del cuerpo.
3.1.2 La amplitud y la frecuencia en los sonidos puros
Cualquier sonido compuesto es analizable como una serie de frecuencias simples, o sonidos puros, que al
sumarse linealmente dan como resultado el sonido compuesto estudiado.
En la comunicación audiovisual se confunden a menudo el fenómeno físico de las vibraciones y la sensación

que estas producen en el sentido de la audición.
Toda vibración que está entre las 20 y las 20.000 oscilaciones por segundo es detectada por el hombre como
un sonido, con lo que vibración se asimila a sonido, y sonido a vibración.
El concepto de amplitud y su vinculación a la sensación de intensidad sonora.
Es posible relacionar las distintas dimensiones perceptivas de la audición con la forma de vibrar la fuente
sonora.
La propia experiencia vital nos muestra con frecuencia que cuanto más fuerte es el golpe que asestamos más
fuerte es el sonido que produce.
Existe una relación evidente entre la amplitud con la que vibra la fuente sonora y la sensación de fuerza que
produce el sonido generado por esta vibración.
Dicho de otro modo: existe una relación de dependencia directa entre la amplitud de cualquier vibración y
la sensación de intensidad.
Así, la mayor o menor amplitud de las vibraciones que llegan hasta nuestros tímpanos queda traducida por el
sistema perceptivo humano en sensación de más o menos intensidad.
La relación entre la frecuencia de una vibración y la sensación auditiva de tono.
Cuando hablamos de frecuencia nos estamos refiriendo a la velocidad de vibración de cualquier cuerpo
físico; y cuando hablamos de tono nos referimos a la sensación de agudo o grave que comporta siempre la
percepción de cualquier sonido.
El fenómeno que describimos es exactamente el mismo que se desarrolla en una cuerda de guitarra cuando
tocamos notas cada vez más agudas. Conforme bajamos la mano que trastea en el mástil de la guitarra
reducimos la longitud de la zona vibrante de la cuerda, haciendo así que la sensación auditiva que produce el
tañido sea progresivamente más débil y aguda.
3.1 Los instrumentos para analizar sonidos compuestos
3.2.1. Sobre la concepción analítica de los sonidos compuestos
Sonidos compuestos, aquellos formados por dos o más frecuencias, es decir vibraciones complicadas.
Estas vibraciones complejas son el resultado de una misma masa vibrante moviéndose simultáneamente con
distintos tipos de oscilación.
Resonadores de Helmholtz: esferas huecas de vidrio con dos cuellos tubulares cortos y abiertos, un cuello
opuesto al otro. Uno de los cuellos se ponía en el oído y el otro en la fuente del sonido.
Si la composición del sonido contenía una frecuencia igual o muy próxima a la frecuencia resonante de la
cavidad del resonador, este la amplificaba permitiendo percibirla aisladamente.
Utilizando una serie de resonadores se podía obtener una idea de las frecuencias que componían cada sonido
estudiado.
Los sonidos complicados estaban compuestos por un conjunto organizado de otros sonidos más simples que
era posible aislar y escuchar con los resonadores.
La electrónica ha hecho posible transcodificar el sonido en una señal eléctrica que varía del mismo modo
que la señal sonora utilizando los micrófonos, y esta señal eléctrica variable puede codificarse a su vez en un
dibujo en forma de onda que contiene prácticamente toda la información de la vibración: estamos hablando
del oscilograma.
El oscilograma puede ser medido y tratado como una función matemática que varía al transcurrir el
tiempo.
Con la rapidez de cálculo y toma de muestras que ha proporcionado la informática, y con el descubrimiento en
1965 del algoritmo llamado Transformada rápida de Fourier es posible disponer de equipos de análisis de
audio capaces de analizar con gran rapidez la descomposición en frecuencias simples de cualquier sonido
complejo.
3.2.2 Los métodos gráficos de análisis acústico
Oscilograma
Sonograma
Espectrograma
El oscilograma es la representación gráfica en forma de onda de todas las variaciones eléctricas que ha
generado un micrófono al recoger un sonido durante un tiempo concreto.
Las variaciones se extienden sobre ejes de coordenadas representando la amplitud en el eje vertical y el
tiempo en el eje horizontal.
El oscilograma nos permite medir con mucha precisión la duración de los objetos sonoros.
El uso más cotidiano de la medición sobre el oscilograma es el que se hace en el montaje audio-vídeo
mediante la edición informatizada. Para ajustar la sincronía entre imágenes y sonido se manipula
informáticamente el audio recortando fragmentos sonoros aquí o allá de forma exacta.
El sonograma traduce el aumento de intensidad del sonido en mayor oscuridad y grosor de las líneas. A
mayor intensidad, mayor oscuridad.
Cuantas más frecuencias intensas se concentran en una zona concreta mayor es el grosor de la línea oscura.
Las frecuencias simples obtenidas en el análisis estarán ordenadas de menor a mayor frecuencia según estén
más o menos cerca del punto 0.
El eje de la izquierda del sonograma es el que indica la frecuencia en Hertzios.
El sonograma es la representación gráfica de un sonido compuesto que nos proporciona más cantidad
de información simultánea.
Sobre el eje vertical obtenemos información de la altura tonal.

El grado de oscuridad de las líneas nos proporciona información sobre la intensidad.
Igual que en el oscilograma, el eje situado en la parte inferior del sonograma aporta info. temporal.
Cuando no sabemos absolutamente nada de un sonido que necesitamos tratar expresivamente, el punto de
partida es siempre el análisis sonográfico.
El espectrograma
En lugar de presentar un aspecto simétrico a ambos lados del eje central, el espectrograma muestra el aspecto
de una cresta en la que las diferencias quedan siempre acumuladas en el mismo extremo.
Las diferencias de amplitud (intensidad) se hacen así más evidentes y fáciles de manejar.
La información que proporciona respecto a la composición de frecuencias que tiene un sonidos, y respecto a
la intensidad de cada una de estas frecuencias, está siempre referida a un solo instante concreto de la
evolución del sonido en el tiempo.
Es un corte transversal del suceso sonoro, algo así como una fina rodaja que muestra con mucho detalle el
contenido de un salchichón, pero solo en el lugar exacto donde la hemos cortado, ignorando todo lo demás.
Nos permite analizar al detalle la composición de la materia acústica en un punto temporal preciso, pero
pierde completamente de vista el resto de la evolución sonora anterior y posterior al instante seleccionado.
El espectrograma es un tipo de representación analítica de los sonidos compuestos muy habitual en el ámbito
técnico de la comunicación audiovisual, y veremos a lo largo de esta obra que puede serlo también en el
ámbito expresivo.
Es muy común realizar análisis espectrográficos de los sonidos que están mezclados con ruidos no deseados.
En estos casos se realizan análisis espectrales en varios puntos de la grabación para determinar cual es la
composición frecuencial de estos ruidos e intentar eliminarlos filtrando las frecuencias no deseadas.
Otro de los usos habituales del espectrograma es el estudio de las resonancias típicas de las salas de
proyección cinematográfica, de audición, de teatro etc.
3.2.3 La interrelación entre los tres métodos clásicos de análisis acústico
Del oscilograma al espectrograma
El oscilograma era la primera etapa de referencia visual a partir de la cual se elige un instante concreto del
suceso sonoro para obtener de él su espectro de frecuencias.
El sistema de análisis toma una serie de muestras en el entorno inmediato en el que hemos situado el cursor y
aplicando la Transformación Rápida de Fourier, calcula y representará gráficamente un espectrograma.
La relación básica entre estas dos representaciones gráficas es que el oscilograma actúa como punto de partida
sobre el cual el analista decide los puntos temporales que quiere estudiar, y a partir de ellos el sistema de
análisis toma las muestras, calcula y construye el espectrograma.
Si trabajamos con sonidos estacionarios, es decir, que mantienen su composición de frecuencias

homogéneo a lo largo del tiempo, el espectrograma será el mismo aunque realicemos análisis en distintos
puntos temporales del oscilograma.
Del espectrograma al sonograma
El espectrograma era una vista lateral del perfil que configura todo el conjunto de frecuencias de un sonido en
un punto temporal concreto; y el sonograma era algo así como mirar desde arriba el cuerpo del sonido viendo
toda su extensión temporal.
Al comparar ambas representaciones del mismo sonido, podemos observar cómo en la situación sobre el eje
horizontal (frecuencia) cada una de las puntas de la cresta que constituye el espectrograma se corresponde de
una forma muy aproximada con la situación de este mismo eje, ahora en el sonograma.
Del oscilograma al sonograma
La correspondencia entre el sonograma y el oscilograma es esencialmente temporal.
El oscilograma, como instrumento de análisis, queda limitado básicamente al estudio minucioso de la

duración de los sucesos sonoros.
En representaciones oscilográficas que duren entre 0’5 y 6 o 7 segundos suelen estar muy claras las
variaciones de amplitud del oscilograma. Esto permite medir el principio y el final de las variaciones del
sonido, y por tanto, tomar medidas temporales entre el inicio y la terminación de los distintos sucesos sonoros.
En la observación del sonograma ocurre justamente lo contrario.
Aporta una información mucho más precisa y completa sobre la composición que sobre la duración de los
sucesos sonoros.
El sonograma presenta los sucesos sonoros que analizamos desarrollados en el tiempo. Además,
simultáneamente, una serie de franjas oscuras (frecuencias simples) que evolucionan sufriendo cada una de
ellas variaciones distintas.
La combinación de los dos instrumentos gráficos es perfectamente complementaria.

Aquella información que no puede aportar el sonograma la proporciona el oscilograma y viceversa.
3.3. El tono y el timbre en los sonidos compuestos
3.3.1. La sensación de tono en los sonidos compuestos
Al escuchar un sonido compuesto estamos oyendo a la vez un conjunto muy numeroso de frecuencias que
suenan a la vez.
Cuando se percibe por las características de su composición como un sonido único y no como muchos sonidos
a la vez, produce una sensación de altura tonal concreta.
Cualquiera de los instrumentos musicales a los que estamos habituados se modula en altura tonal a pesar de
que emite sonidos compuestos.
Esta sensación tonal unitaria que producen los sonidos compuestos viene determinada perceptivamente por la
más baja de las frecuencias que componen el sonido- frecuencia fundamental o pitch
Los sonidos no siempre están tan perfectamente organizados. A menudo, se da en los sonidos una mezcla
entre frecuencias que son múltiplos de la fundamental, es decir armónicos, con otras frecuencias que no
tienen este tipo de relación numérica con el pitch.
En estos casos los sonidos producen un efecto de suciedad sonora, o de sonido ruidoso.
Todo sonido tiene siempre una frecuencia inicial más baja que todas las demás, que será su frecuencia
fundamental, y que es la que predomina perceptivamente en la sensación de altura tonal.
Estas otras frecuencias no armónicas con la fundamental, pero que habitualmente forman parte también de la
composición de los sonidos se denominan parciales.
Los sonidos están tanto más organizados armónicamente cuanto mayor es la parte del espectro ocupada por
armónicos.
Cuanto más baja es la frecuencia a la que comienzan a aparecer parciales, mayor es la desorganización
sonora.
Cuando predominan los parciales sobre los armónicos, la sensación tonal es mucho más confusa y resulta
mucho más difícil precisar su altura tonal.
Ejemplo:
Contando sobre el sonograma el número de armónicos que hay desde la frecuencia fundamental o pitch hasta
el lugar en el que está situado el cursor, en el ejemplo son 11. La frecuencia fundamental de este sonido
debería ser la onceava parte de la frecuencia que indica el cursor , en la esquina superior derecha.
3.3.2. El concepto de timbre
Existe una idea social demasiado elemental y simplista respecto a qué es el timbre.
El timbre suele entenderse como la dimensión acústica que da el carácter individual a los sonidos, cuando dos
sonidos, a pesar de tener la misma intensidad y el mismo tono, se perciben como diferentes entre sí, su
diferencia se debe al timbre.
A menudo se define también como aquella parte del sonido de la voz o del sonido de un instrumento musical
que es invariable, para oponerlo al tono o la intensidad como dimensiones sonoras variables y fácilmente
manipulables.
Esa concepción del timbre como una dimensión sonora invariable e inherente supone que una misma voz no
podría variar jamás su timbre. Paradójicamente, una forma esencial de organización sonora de la lengua es el
reconocimiento de las variaciones del timbre fonético.
La variación del timbre en la música occidental se limita al cambio de instrumento. Para conseguir otro tipo
de matiz sonoro sobre una misma altura tonal sencillamente se elige otro instrumento.
Esa forma de organizar y dar cuenta escrita de los sonidos determina claramente una tendencia a no observar
ni clasificar los matices tímbricos que van más allá de las diferencias globales entre un instrumento y otro.
Una tendencia que ha impregnado toda nuestra cultura sonora.
3.3.3. La sensación tímbrica
El concepto de timbre no es acústico sino psicológico.
Es la denominación de un tipo de sensación auditiva. Un concepto ambiguo y complejo.
Definición de timbre:
El timbre es una sensación auditiva compleja (independiente de las de duración, tono e intensidad, y
simultánea a ellas) que nos permite percibir la estructura acústica interna de los sonidos compuestos.
En una primera aproximación, podemos encontrar en la sensación tímbrica tres dimensiones bien
diferenciadaas; armonicidad, impresión espectral, y definición auditiva.
Armonicidad. Concepto parcial para diferenciar entre armónicos (frecuencias múltiplo de la frecuencia
fundamental) y parciales (frecuencias no organizadas respecto a la fundamental)
Definición de armonicidad:
Denominaremos armonicidad al distinto grado de limpieza y agradabilidad que percibimos al escuchar un

sonido compuesto, dependiendo de la relación que existe en su espectro entre armónicos y parciales.
Cuanto mayor sea la gama de frecuencias organizadas armónicamente, mayor será la sensación de limpieza y
agradabilidad, es decir, mayor será la armonicidad.
El análisis acústico, concretamente el espectrograma, refleja con mucha claridad el grado de armonicidad del
sonido.
Los sonidos compuestos que perceptivamente son claros, limpios y agradables son sonidos que tienen una
gran parte de su espectro ocupada por armónicos.
Estos se presentan siempre de izquierda a derecha. Es decir, desde la frecuencia fundamental, hacia las
frecuencias más altas de una forma contigua.
Parece existir una relación directa entre la sensación tímbrica de armonicidad y la relación proporcional
entre armónicos y parciales que podemos observar visualmente al hacer el análisis espectral de un sonido.
Cuanto mayor sea la superficie espectral ocupada por armónicos, mayor será la sensación de armonicidad.
Definición de impresión espectral:
La sensación de diferente matiz auditivo que percibe un receptor, cada vez que escucha un sonido de idéntica
composición de frecuencias, pero con distinta envolvente espectral. Entendiendo como envolvente espectral la
forma obtenida al trazar una línea que une todas las puntas de cresta de cualquiera de los espectrogramas
posibles.
Punto de partida: concepto de resonancia o formante.
Se denomina formante a la gama de frecuencias de un sonido compuesto que han quedado reforzadas en
amplitud por la forma y el volumen del espacio en el que se ha producido, o la forma y el volumen del espacio
en el que se está propagando el sonido en cuestión.
Una resonancia es perfectamente reconocible tanto en el espectrograma como un grupo de frecuencias

contiguas que han aumentado de intensidad en torno a una frecuencia concreta a modo del perfil de una
montaña.
Se puede comprobar cómo es posible matizar el timbre con la propia voz sin variar el tono ni la intensidad,
emitiendo un sonido fuerte con una energía de espiración pulmonar que no varíe (intensidad constante) y sin
alterar en ningún momento el grado de tensión muscular de la laringe (tono constante) pero cambiando la
posición de la boca.
A medida que los labios se cierran el sonido se oscurece. Cuando los labios se abren y la mandíbula se separa
el sonido es claro.
Acústicamente, lo que ocurre es que modificamos la situación de las resonancias del espectro de nuestra voz
al ir cambiando la forma de la cavidad bucal. Al ir cambiando la forma y el volumen de espacio en el que se
estrellan, reflejan y entremezclan las frecuencias del sonido compuesto producido por nuestra laringe,
alteramos la impresión espectral que produce nuestra voz.
Definición de timbre fonético:
En función de cómo hemos definido el concepto de impresión espectral, el timbre fonético es una categoría
de éste.
Concretamente, denominamos timbre fonético al subconjunto de impresiones espectrales que configuran los
sonidos de las lenguas.
En suma, y recuperando todo lo revisado, la organización de las resonancias o formantes a lo largo del
espectro configuran una sensación tímbrica que hemos denominado genéricamente como impresión
espectral.
Definición auditiva: Denominaremos definición auditiva a la sensación de máximo grado de precisión,

exactitud o detalle sonoro que percibe el oyente al escuchar atentamente un sonido.
La sensación de definición auditiva está ligada a la gama de frecuencias que componen un sonido.
Así, la sensación de definición auditiva es tanto mayor cuando el oído dispone de más elementos acústicos
capaces de transmitir información sonora, y a la inversa.
Ejemplos
Los sistemas de alta fidelidad recogen perfectamente toda la gama de frecuencias que puede percibir el oído
humano.
No obstante, a menudo escuchamos sonidos con una definición auditiva bastante baja. Cualquier voz conocida
cambia radicalmente de calidad sonora, es decir de timbre, al ser escuchada a través del teléfono.
La gama de frecuencias que transmite el teléfono está entre 300 y 300 Hz. La capacidad perceptiva del oído
humano está entre 20 y 20.000 Hz, así que la definición auditiva del sonido telefónico es escasa.
El timbre característico del sonido telefónico podría ser descrito perfectamente como de baja definición
auditiva.
La radio de onda larga.
La gama de frecuencias que transmite va de los 160 Hz a los 6.3000 Hz. Su definición auditiva es mayor que
la del teléfono, pero es todavía bastante pobre.
Esa sensación tímbrica tan característica que nos hace identificar el sonido telefónico, o el sonido emitido por
cualquier equipo de audio doméstico, y diferenciarlo inmediatamente del sonido natural es su menor grado de
definición auditiva.
El término habitual dentro del ámbito de tratamiento del audio en las producciones audiovisuales es el
de ancho de banda.
La denominación ancho de banda tiene un carácter exclusivamente acústico.
Podemos decir que existe una relación directamente proporcional entre el concepto acústico de ancho de
banda y el perceptivo de definición auditiva.
Cuanto mayor sea el ancho de banda mayor será el grado de definición auditiva, y viceversa.
Sin embargo, esta relación no es isomórfica, ya que cuanto más alta es la zona de la banda de frecuencias
escuchada, menor es la capacidad de discriminación perceptiva del oído humano.
El filtrado es la forma más habitual de manipular el ancho de banda.
El filtrado consiste en realizar una transmisión de la señal sonora de un lugar a otro utilizando un sistema de
captación que sólo es sensible para una determinada banda de frecuencias.
Las denominaciones clásicas de filtrado son:
-Paso bajo: sólo deja pasar frecuencias graves

-Paso alto: sólo deja pasar frecuencias agudas
-Paso de banda: solo deja pasar algunas frecuencias centrales
En la posproducción de audio se recurre muy frecuentemente al recurso del filtrado para quitar la “suciedad
sonora”, para borrar sonidos no deseados cuando están concentrados en una zona bien definida del espectro.
Todo filtrado altera el timbre del sonido, en concreto hace bajar el grado de definición auditiva del sonido
tratado.
Desde el punto de vista expresivo, los filtrados se utilizan a menudo en la realización audiovisual para simular
sonidos telefónicos o radiofónicos a partir de sonidos que han sido grabados en alta fidelidad.
Se intenta reconstruir el timbre del sonido telefónico reduciendo la definición auditiva de una grabación hecha
con gran definición.
El timbre es una sensación global compleja.
Tres aspectos diferenciados: la armonicidad, la impresión espectral y la definición auditiva.
Las tres dimensiones sensoriales hacen referencia y dependen de la estructura interna del sonido.
El timbre es una sensación compleja en la que influyen de forma simultánea y unívoca armonicidad,
impresión espectral y definición auditiva,
Timbre = armonicidad + impresión espectral + definición auditiva
3.3.4. Sobre la dimensión dinámica del timbre
Nuestro planteamiento sobre el timbre se presenta pretendidamente como algo abierto en tanto que aún no
podemos tratar su dimensión dinámica con la suficiente profundidad. En cualquier caso, sí que tenemos la
certeza de que éste es un camino que necesariamente se deberá recorrer.
3.4. Las magnitudes físicas para la medición del sonido
Dos unidades: el hertzio para la frecuencia y el decibelio para la amplitud
Es importante tener muy presente que aunque estas dos magnitudes dan cuenta adecuadamente de las
dimensiones estrictamente físicas de los fenómenos vibratorios, están muy lejos de resolver satisfactoriamente
la medición de las sensaciones de tono e intensidad.
Lo esencial no es la dimensión física del sonido sino su dimensión perceptiva.
3.4.1. La medición del tono
Técnicamente, la medición física de la frecuencia suele utilizarse en todos los ámbitos como medida de la
sensación tonal, a pesar de que ambos son fenómenos perfectamente diferenciados.
La medida de la frecuencia es sumamente simple. Se mide contando el número de oscilaciones por segundo
que desarrolla cualquier objeto al sufrir una vibración.
El aire transmite esta frecuencia al oído, que se encargará de traducirla en sensación tonal: o al diafragma o al
micrófono, que se encargará de traducir la vibración sonora en variaciones de amplitud eléctrica.
La física toma como magnitud de referencia para medir cualquier frecuencia: una vibración que tarda un
segundo en hacer el recorrido completo desde que parte de su punto de reposo en un segundo y retorna a este
punto en el mismo sentido.
A esta relación entre la rapidez de la vibración y el tiempo se la denomina: 1 ciclo por seg. 1cps
El ciclo por segundo es pues, la magnitud que se utiliza como unidad para el estudio del grado de rapidez de
las vibraciones. A esta unidad también se le llama hertz
1hertz = 1 ciclo por segundo
El umbral mínimo de percepción de la frecuencia es de unos 17cps. Una vibración de 1 cps será detectada por
un instrumento de medición acústica, pero no por el oído humano.
Existe una relación entre la frecuencia de una vibración medida en Hz y la sensación tonal que ésta produce,
ya que cuando aumenta la frecuencia de la vibración sube, también la sensación tonal. Pero esta relación no es
lineal sino geométrica: cada vez que se dobla la frecuencia solo aumenta en un grado nuestra sensación
auditiva de tono.
La magnitud acústica para medir la frecuencia por sí sola, tampoco da cuenta de un modo satisfactorio de los
sonidos compuestos.
El concepto de frecuencia en su sentido estricto sólo es satisfactorio para los sonidos simples.
Con los sonidos compuestos tenemos que diferenciar entre frecuencia fundamental, y armónicos y parciales.
Cuando se habla de frecuencia de un sonido compuesto normalmente se hace referencia a su frecuencia

fundamental, al ser esta la que tiene una influencia perceptiva más clara de la sensación tonal.
3.4.2. La medición de la intensidad
Mientras que la frecuencia hacía referencia exclusivamente al fenómeno vibratorio, y por tanto físico, el
concepto de intensidad hace referencia directamente a la sensación psicológica de energía del sonido.
La definición de la unidad de medida de la intensidad es bastante más compleja que la de frecuencia y hemos
de partir de algunas consideraciones previas sobre la percepción antes de llegar a ella.
El ser humano pierde finura en la sensibilidad de todos los sentidos a medida que aumenta físicamente
la intensidad del estímulo percibido.
Ejemplo: el peso de dos paquetes de 100g y 150 g
Poniendo uno en cada mano somos capaces de percibir la diferencia y decir cual es más pesado.
Si comparamos paquetes de 10.000 y 10.050 g seremos incapaces de notar la diferencia.
Para sentir lo mismo que antes podíamos percibir con 50g, al aumentar la intensidad del estímulo necesitamos
una diferencia de peso 100 veces mayor. La misma proporción con la que ha aumentado el estímulo.
Fenómeno: Ley de Weber y Fechner
La percepción es proporcional al logaritmo de la excitación.

La sensación crece sólo en progresión aritmética mientras que la excitación que la provoca crece en
progresión geométrica.
Unidad de intensidad sonora: Decibel
Esta magnitud intenta relacionar la percepción humana con la cuantificación física de la presión que
producen las vibraciones sonoras del aire en el oído.
Medida relativa, toma como referencia la mínima presión sonora que percibe el oído humano.
Unidad sistema CEGESIMAL
Referencia: frecuencia pura de 1000 Hz, porque la percepción de la intensidad también varía según la
frecuencia.
Fenómeno físico: la presión que ejercen las moléculas del aire que han sido estimuladas por una fuente
sonora, al vibrar sobre el tímpano humano.
La presión mínima que percibe el oído es de 0’0002 dinas/cm2

Es la magnitud de referencia o P0, con la que se compara cualquier otra presión acústica, P1
Así se puede calcular el grado de presión auditiva de cualquier sonido calculando P0
Presión auditiva = P1/P0

La máxima presión sonora que aguanta el oído es 1.000.000.000.0000 la presión mínima, que es igual a 10
elevado a 12 x (0’0002 dinas/cm2)
Desde el umbral mínimo hasta el máximo aparecía una escala de 1 billón de grados, que resultaba
inmanejable.
Pero si se trabajaba con potencias de 10, se podía diseñar una escala de solo 12 grados entre la sensibilidad
mínima y la máxima:
101, 102, 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012
También se conocía que la sensación que percibimos es proporcional al logaritmo de la cantidad de

excitación.
La sensación de intensidad se ajustaría al logaritmo del cociente entre la presión sonora en el oído o P1, y
la presión sonora mínima P0
Intensidad = log (P1/P0)
A la unidad de esta escala se la denominó bel. La máxima intensidad que soporta el oído son 12bels
Como el bel resultó demasiado grande, se dividió en 10 unidades más pequeñas, o decibels
1 bel = 10 decibels
Para calcular la sensación de intensidad en decibels (dB) será necesario multiplicar por 10 el número de bels.
El umbral del dolor es de 12bels x 10= 120 decibels o decibelios
Intensidad (en dB) = 10 log P1/P0
El decibelio ha sido homologado internacionalmente como unidad de medida, dándole un valor concreto de
presión, exactamente el de 0’000204 dinas/cm2
El desarrollo del decibelio está hecho tomando como referencia una vibración simple de 1000Hz
Un sonido que tenga una frecuencia de 100Hz y una presión sonora de 20dB no puede ser percibido por el
oído humano, pero si esta misma presión sonora de 20dB está asociada a una frecuencia de 1000Hz será
audible perfectamente.
Fenómeno formalizado por Fletcher mediante un diagrama de curvas de igual audibilidad.
En el diagrama de Fletcher se ponen en relación sobre una escala logarítmica la presión sonora en
decibelios (eje vertical) con la frecuencia en hertzios (eje horizontal).
Sobre el se trazan curvas isofónicas, que expresan la relación entre potencia sonora en dB y frecuencia en
Hz para que el oído humano tenga la misma sensación de intensidad a medida que va variando el tono.
La sensibilidad del oído se adapta a la medición de decibelios a los 1000 Hz, pero cuando esa frecuencia varía
la percepción humana no se ajusta a esta forma de cuantificar la intensidad.
El decibel no deja de ser una magnitud centrada en el fenómeno físico de la presión y no en el fenómeno
psicológico de la intensidad.
El fon, es una medida que da el mismo valor a todos los puntos de la curva isofónica.
El valor en fones de cada curva es el que se obtiene en decibelios cuando la curva cruza la línea de los
1000Hz.
Para saber la intensidad en fones de un sonido se sitúa como un punto en el diagrama de Fletcher y se busca
la curva isofónica que pasa sobre él.
Pero el aumento de un fon no se ajusta a los saltos naturales de la sensibilidad auditiva.
Se inventó otra medida que sí respondía a los saltos de intensidad que el hombre reconoce como regulares: el
son
40 fones = 1 son
Según esta equivalencia, cuando el oído perciba un sonido el doble de fuerte diremos que la intensidad es
de 2 sones, si la diferencia es triple serán 3 sones y si es de la mitad serán 0’5 sones.
Demasiado a menudo se establece una asociación rígida entre la medición de la presión sonora en dB y la
sensación psicológica de intensidad, y esto supone arrastrar errores importantes.
CAPÍTULO 4
FUNDAMENTOS DE LA PERCEPCIÓN SONORA
4.1 La subjetividad perceptiva como objeto científico
El concepto de subjetividad suele ser utilizado como un instrumento de descalificación.
El concepto de subjetividad, entendido desde el punto de vista de la psicología de la percepción, es

perfectamente objetivable.
Toda sensación que se desencadena en el interior de un sujeto como respuesta a la recepción de estímulos
físicos externos objetivos, y toda interpretación de estas sensaciones que haga el mismo sujeto receptor son
objetivables. Es decir, formalizables como un objeto de estudio científico.
4.1.1. En busca de mecanismos expresivos universales
Revisar los elementos esenciales de la percepción auditiva, con el fin de comprender mejor el funcionamiento
global de los fenómenos expresivos audiovisuales. Cuando descubramos de qué modo actúa la interpretación
subjetiva de los estímulos audiovisuales, estaremos en mejores condiciones para localizar algunos de los
mecanismos expresivos universales en los que se basa el lenguaje audiovisual.
4.2 La percepción de las dimensiones sonoras simples
4.2.1. El concepto de umbral
El concepto de umbral está asociado al de límite de sensibilidad perceptiva.
Umbral mínimo: detectar la cantidad mínima de estímulo por debajo de la cual el fenómeno físico ya no es
percibido por el ser humano.
Umbral máximo: es lo opuesto, detectar la cantidad de estímulo por encima del cual el fenómeno tampoco
puede ser percibido por el hombre.
Umbral diferencial: la cantidad mínima de variación de estímulo que puede ser percibida por el sistema
perceptivo. Cuando esta cantidad de variación física es inferior al umbral diferencial, el ser humano no nota
cambios y lo percibe como un fenómeno constante, a pesar de que se haya producido una variación física
objetiva.
4.2.2. Umbrales de intensidad
El umbral mínimo de intensidad se define como de 0 dB a 1000 Hz. Aunque varía según la frecuencia.
El umbral máximo en audición se denomina umbral de dolor. Esta forma de nombrarlo se debe a que a partir
de él la sensación perceptiva es dolorosa. En torno a 130 dB
El umbral diferencial medio es de 3dB y oscila entre 2dB y 10dB en función del tono.
4.2.3. La sensación de intensidad en los sonidos compuestos
Hasta ahora hemos relacionado la intensidad con una frecuencia pura de 1.000 Hz, pero sabemos que lo
habitual es escuchar sonidos compuestos.
La sensación real de intensidad está directamente relacionada con la suma de todas las frecuencias que
componen globalmente el espectro de un sonido.
El umbral mínimo y el umbral diferencial son variables en función de la frecuencia sonora.
La sensación de intensidad no responde exactamente a la suma de intensidades de las frecuencias que

componen un sonido, sino a una suma ponderada según la sensibilidad que el ser humano tiene de cada
frecuencia.
Técnicamente se ha resuelto estableciendo curvas normalizadas para ponderar la sensación de intensidad

que corresponde a cada zona del espectro, en un diagrama de curvas de ponderación.
4.2.4. Influencia de la distancia en la sensación de intensidad
Cada vez que se dobla la distancia entre la fuente sonora y el receptor la intensidad disminuye en 6 dB.
Y viceversa, cada vez que la distancia se reduce a la mitad, la intensidad aumenta en 6 dB.
Ejemplo:
3m 90 dB
6m 84 dB
4.2.5. Influencia de la intensidad en la sensación de distancia
Resulta bastante más interesante la posibilidad de reconstruir sensaciones de acercamientos, alejamientos, y

distancias concretas sin que existan en la realidad.
Si decimos que el umbral diferencial medio de intensidad está en torno a los 3 dB, es decir, que por debajo de
esta cantidad de variación de intensidad el cambio no es perceptible; y la regla de los 6 dB nos dice que cada
vez que se dobla o se reduce a la mitad la distancia entre fuente sonora y receptor se produce una variación de
la sensación de intensidad de 6 dB.
Una solución simple para garantizar que cualquier receptor percibe las variaciones artificiales de intensidad es
trabajar a partir de la regla de los 6 dB.
De toda esta reflexión podemos deducir el siguiente principio expresivo: cuando un realizador intenta que
los oyentes que contemplan su narración audiovisual perciban y comprendan sólo a través de la intensidad
sonora las distancias y los movimientos de sus entes acústicos, es conveniente manipular esos entes
organizando sus variaciones de intensidad de 6 en 6 dB.
4.2.6. Umbrales de tono (frecuencia)
Umbral mínimo: el oído humano comienza a percibir los fenómenos vibratorios cuando estos se producen
con un mínimo de 16 oscilaciones por segundo. (16 Hz)
Umbral máximo: la frecuencia máxima está en torno a los 20.000 cps, a partir de aquí los sonidos son
inaudibles y se habla de ultrasonidos. El tono más alto o agudo que podemos escuchar es el que genera una
frecuencia a 20.000 Hz.
Umbral diferencial: El umbral diferencial de tono definido a 1000 Hz es de 2 cps. Este umbral cambia
haciéndose más grueso a medida que aumenta la frecuencia.
4.2.7. Sensibilidad absoluta y sensibilidad relativa respecto al tono
Nuestra sensibilidad auditiva es mucho más alta para las relaciones entre estímulos que para los estímulos
aislados.
Toda estructuración tonal responde a una organización global de relaciones de frecuencia y no a las
frecuencias en sí mismas como valor absoluto.
4.2.8. Sensibilidad absoluta y sensibilidad relativa respecto al tono
Umbral mínimo: La duración mínima que ha de tener un sonido aislado para que pueda ser oído es de 5
milésimas de segundo.
Respecto a la intensidad: se observa que manteniendo constante la presión sonora de un tono audible y
haciendo escuchar sucesos sonoros cortísimos de éste que se hacen progresivamente más largos, la sensación
de intensidad comienza muy débilmente cuando los sucesos son de 5 ms, y crece desde los 5 ms del umbral
hasta que los sucesos duran entre 100 o 150 ms, entonces la sensación de intensidad se torna ya estacionaria.
Resumiendo: es necesario que un sonido dure por lo menos 150 milésimas de segundo para que el oído
humano perciba su intensidad real
Respecto al tono: los sucesos sonoros han de superar los 0’1 segundos de duración para que su tono sea
perceptible
Respecto al timbre: para reconocer simultáneamente las características de tono y timbre de un sonido es
necesario que el suceso sonoro escuchado tenga una duración de más de 1 segundo.
Umbral diferencial: podemos percibir variaciones de intensidad de 3 dB cada vez más próximas en el tiempo
unas de otras, hasta que el tiempo entre una y otra se reduce a 2 o 7 milésimas de segundo.
4.3. La percepción de la complejidad sonora interna
4.3.1. La percepción en bandas críticas
La sensación de intensidad subjetiva aumenta a medida que acumulamos frecuencias que suenen
simultáneamente al sumarse auditivamente las energías.
Se asume que la descomposición del espectro de frecuencia en bandas críticas es una de las características
perceptivas fundamentales del oído.
Parece ser que el oído percibe siempre ordenando el sonido en bandas críticas, con independencia del punto
de la escala de frecuencias en que se sitúa el sonido.
Zwicker, después de experimentar sobre toda la superficie auditiva, propuso una división de la zona de
frecuencias que va de los 20 Hz a los 16 kilohertzios en 24 bandas críticas.
Luego, al observarse que la anchura de las bandas críticas es relativamente próxima a los anchos de banda de
1/3 de octava, y que la variabilidad entre sujetos para percibir las bandas críticas puede oscilar un 20% o más,
la división del espectro propuesta en principio ha sido modificada de manera que se ajusta a los filtros
convencionales normalizados de 1/3, 2/3 o 3/3 de octava.
4.3.2. El enmascaramiento
Se denomina enmascaramiento a la pérdida de sensación de presencia auditiva de un sonido determinado

cuando aparece otro similar más fuerte que el primero.
4.3.3. Los diagramas de Zwicker
Zwicker ha desarrollado una experimentación sistemática sobre percepción psicoacústica en una parte muy
amplia del espectro audible
Un campo sonoro libre es aquel que se genera al emitir sonido en un espacio en el que no existe ningún tipo
de posibilidad de reflexión.
En él el sonido lega al punto de medida desde una única dirección.
Un campo sonoro difuso es el que se produce cuando el sonido proviene de todas partes, sin que haya ninguna
dirección de propagación del sonido que predomine con claridad sobre las otras.
En un campo sonoro difuso el sonido llega al punto de medida desde todas las direcciones a la vez.
5. LAS FORMAS DEL SONIDO
5.1 La percepción de formas sonoras
Estudiaremos el siguiente nivel expresivo el nivel de las formas.
Es decir, el nivel en el que la sustancia sonora se organiza en modos y distribuciones concretas, componiendo
formas, para que a estas formas se les pueda asignar sentido.
Para poder reconocer una forma sonora es necesario haberle asignado antes un sentido, haber experimentado
que esa forma es relevante.
La relevancia puede otorgarse por varias vías: repetición de la misma forma, impacto emocional de la
situación a la que está asociada, el valor que significa identificarla para la supervivencia etc.
Como consecuencia de esa experiencia, la forma en cuestión se almacenará en nuestra memoria como un
patrón sonoro.
Pero antes de esta etapa ha sido necesaria la percepción estricta de la forma. Ha sido necesario poder
percibirla antes de poder reconocerla.
Tenemos que diferenciar entre la percepción de formas sonoras, y el reconocimiento de formas sonoras.
Definiremos forma sonora como:

Toda configuración acústica que, aun siendo analizable en dimensiones más simples, tiende a ser percibida
como un bloque sonoro unitario y coherente.
5.1.1 El ruido
El concepto de ruido en la com. audiovisual es poco concreto.
La palabra ruido hace referencia a: cualquier sonido no deseado, efectos sonoros, concepto de sonido, y
también todo aquello que dificulta la comunicación.
Para concretar qué es exactamente el ruido y poder diferenciarlo de todas aquellas formas sonoras que no sean
ruidos, necesitamos definir algunos rasgos formales que lo caractericen.
La concepción psicoacústica del ruido propone una definición concreta.
Zwicker y Feldtkeller objetivan el concepto de ruido definiéndolo como sonido que no tiene altura ni
timbre. Un sonido en el cual ninguna zona de frecuencia difiere de ninguna otra y ningún segmento
temporal difiere de ningún otro.
Esta definición distingue perfectamente el ruido de otros efectos sonoros, definiéndolo como una clase
concreta de formas sonoras cuya característica es no tener características acústicas definidas.
Dos ejemplos característicos de esto son el ruido blanco y el ruido rosa:
- el ruido blanco se obtiene sumando un gran número de vibraciones sinusoidales de frecuencia muy
próxima que tienen las siguientes condiciones técnicas: amplitudes similares, frecuentas entre 20 Hz y 20.000
y sus fases deben estar repartidas sobre todo el dominio angular.
- el ruido rosa tiene las mismas características que el blanco, pero sus frecuencias sufren una atenuación
progresiva de -3 dB desde la primera frecuencia más baja hasta la última que es la más alta.
La sensación auditiva que producen ambos ruidos es similar, viene a ser algo parecido a ese soplido
característico que hace el altavoz de un televisor cuando no recibe señal y la pantalla tiene nieve.
La concepción más universal de ruido es la de “como un sonido no deseado”
Esta definición no diferencia, en principio, entre unas formas sonoras y otras. Su criterio es solo funcional, y
centrado en eliminar cualquier sonido que sobrepase una determinada potencia sonora.
La concepción de ruido como “todo aquello que perturba un proceso de comunicación” es una definición
demasiado amplia, que depende de un criterio de preferencia arbitrario, distinto para cada situación.
La ingeniería complementa con una tipología que caracteriza formal y perceptivamente el ruido en categorías:
ruido de fondo, ruido aleatorio, ruido continuo constante etc.
La concepción de ruido como “todo sonido no deseable” nos parece absolutamente inoperante para
discriminar unas formas sonoras de otras.
La concepción de ruido de la ingeniería de telecomunicaciones como “todo aquello que perturba un proceso
de comunicación”, ha sido adoptada por muchos teóricos de la comunicación.
Etiquetar como ruido a todo aquello que nos molesta es muy poco útil.
Resulta mucho más eficaz que intentemos denominar y etiquetar con precisión cada una de las distintas
formas sonoras, con el objeto de poder nombrar exactamente aquella forma que deseamos eliminar en cada
momento y situación.
En la literatura sobre radio se pueden encontrar como muestra las dos concepciones de ruido que aún nos
quedan por comentar: el ruido como sinónimo de sonido, y el ruido como efecto sonoro.
Los componentes sonoros del len. radiofónico se suelen establecer como: palabra, música, ruidos o efectos
sonoros, y silencio.
Se confunden con bastante frecuencia los conceptos de sonido, ruido, y efecto sonoro.
Categoría para todos aquellos sonidos que, sin pertenecer al sistema musical ni al de la palabra, tienen valor
significativo, suele ser la de efectos sonoros o ruidos.
En la radio, los ruidos no son ni mucho menos algo que sea necesario eliminar, sino un conjunto de sonidos
de alto valor significativo que tienen un valor muy importante dentro del mensaje radiofónico.
Definición de efectos sonoros
Conjunto de formas sonoras representadas por sonidos inarticulados o de estructura musical, de fuentes
sonoras naturales y/o artificiales, que restituyen objetiva y subjetivamente la realidad construyendo
una imagen (Balsebre)
Desde esta perspectiva, podemos deducir que efecto sonoro es cualquier objeto sonoro que no podamos
clasificar como habla, siempre que este sea suficientemente sugerente.
Como no hay frontera entre música y efecto sonoro, esta definición permite introducir en la categoría de ruido
o efecto sonoro todos los objetos sonoros posibles.
Lo que ocurre con los efectos sonoros es precisamente, que no hay para ellos más código cultural que la
propia experiencia auditiva de cada oyente.
El concepto de ruido debe ser entendido como una forma sonora concreta, que puede ser localizable tanto
aislada, como dentro del habla, o dentro de la música.
La definición de ruido que defendemos aquí como idónea es la propuesta por Zwicker y Feldtkeller, la
que define el ruido como un sonido sin altura tonal ni diferenciación temporal definidas.
5.1.2 El silencio
La concepción automática de silencio suele ser la de “ausencia total de sonido”. Esta definición es demasiado
simple desde el punto de vista acústico, y desde el perceptivo también.
Resulta muy difícil conseguir una situación en la que no aparezca ningún tipo de señal sonora. En el interior
de una cámara aneoica vacía existen vibraciones detectables por un micrófono, y por supuesto, en cualquier
entorno natural “silencioso” existen siempre numerosas vibraciones audibles de baja intensidad.
La solución de los manuales de acústica es desterrar el concepto de silencio del vocabulario científico y
técnico.
Pero no podemos ni debemos ignorar, que perceptivamente la sensación de silencio es tan cotidiana como la
sensación de oscuridad o de quietud.
Así, el silencio no es ausencia de sonido puesto que la ausencia absoluta de sonido no es posible, el silencio
en realidad, es el efecto perceptivo producido por un determinado tipo de formas sonoras.
Desde el punto de vista perceptivo, la palabra silencio expresa en realidad un efecto auditivo.
Si el silencio no es ausencia de sonido, sino sensación de ausencia de sonido, al localizar el tipo de formas
sonoras que producen la sensación de silencio habremos eliminado definitivamente la contradicción entre la
percepción del silencio y la imposibilidad acústica de que exista una ausencia total de sonido.
Para que se produzca el efecto de placidez que caracteriza la sensación de silencio, es necesario que el fondo
sonoro de baja intensidad tenga una duración de más de 3 segundos.
Con fondos silenciosos menores de 3 segundos, relaciones señal/fondo en las que el fondo de baja intensidad
sea demasiado corto, no se va a producir el efecto silencio, es decir el silencio no va a ser perceptible.
Tampoco los valores expresivos que se suelen asociar al efecto silencio: vacío, muerte, suspense, etc, podían
ser transmitidos.
El rango mínimo de caída de intensidad que es necesario para que se produzca la sensación de silencio, es de
unos 30 dB, proporcionará al narrador audiovisual la garantía de que las formas sonoras inevitables en
cualquier fondo de poca intensidad no van a ser relevantes para el oyente, y por lo tanto, que el efecto/silencio
se producirá y se cargará de sentido expresivo.
Si la caída súbita de intensidad para pasar de la señal fuerte al fondo de intensidad muy débil está por debajo
del rango mínimo, el receptor oirá y escuchará las formas sonoras del fondo, y estos sonidos pasarán a ser
importantes.
5.1.2 El uso expresivo del efecto silencio
El problema del narrador audiovisual es diseñar ese contexto de modo que el efecto-silencio adquiera el valor
expresivo que él desea y no otro.
Un fondo sonoro difuso y de poca intensidad no tiene valor expresivo por si mismo sino por lo que se sitúa
inmediatamente antes.
Los márgenes temporales del efecto-silencio oscilan entre los 3 y los 10 segundos.
Para que adquiera valor expresivo el efecto silencio debe extenderse durante más de 3 segundos.
Clasificación con los tres usos expresivos fundamentales que se suelen dar al efecto-silencio en los discursos
audiovisuales: uso sintáctico, uso naturalista y uso dramático.
-Uso sintáctico: los efectos-silencio se utilizan para organizar y estructurar los contenidos audiovisuales.
Cuando actúan simplemente como instrumento de separación. Este tipo de uso viene determinado por un
contexto que podríamos denominar “de contenidos neutros”.
El efecto-silencio es de separador, indicando con mucha claridad al oyente que se ha llegado al final de una
etapa, y que, a continuación, va a comenzar algo completamente distinto que tendrá muy poca o ninguna
relación con todo lo anterior.
-Uso naturalista: corresponde a los efectos-silencio que se utilizan imitando estrictamente los sonidos de la
realidad referencial: el sonido de pasos se elimina, la respiración deja de sonar, el sonido de rodadura de los
neumáticos cesa y se resuelve el ruido de motor etc. El efecto-silencio se carga de un valor esencialmente
descriptivo.
En este tipo de situación contextual, los efectos silencio actúan expresando informaciones objetivas muy
concretas sobre la acción narrada.
-Uso dramático: uso consciente del efecto silencio por parte del narrador para expresar algún tipo de
información simbólica concreta como: muerte, suspense, vacío, angustia, etc.
Relación directa con la reproducción objetiva del paisaje sonoro de la realidad referencial. Su uso es
extremadamente abierto y el tipo de carga simbólica que adquiere depende de la presencia de ciertas
incongruencias narrativas, y del tipo de información emocional que contiene el discurso que la precede.
5.1.4. Formas estacionarias y formas dinámicas
Localizar y sistematizar los mecanismos básicos que utiliza el oído humano para agrupar las dimensiones de
cualquier sonido complejo, organizándolo en formas sonoras simples.
Forma sonora es toda configuración acústica que, aun siendo analizable en dimensiones más simples, tiende
a ser percibida como un bloque sonoro unitario y coherente.
Las percepciones auditivas producidas por las formas sonoras que varían en el tiempo, las dinámicas, son
diferentes a aquellas que emanan de formas sonoras que no se alteran al transcurrir el tiempo, las
estacionarias.
Diferenciación entre formas sonoras dinámicas y formas sonoras estacionarias.
La duración de un segundo se configura como el umbral temporal mínimo de una forma sonora.
O sea, que la mínima cantidad de tiempo necesaria a partir de la cual podemos ya considerar que un sonido ha
sido percibido con todas las posibilidades informativas al completo es 1 segundo.
Llamaremos forma sonora estacionaria a todo suceso sonoro de duración igual o superior a 1 segundo que no
haya sufrido variación acústica alguna.
Llamaremos forma sonora dinámica a todo suceso sonoro que haya sufrido más de una variación en alguna o
varias de sus dimensiones acústicas, en todos y cada uno de sus sucesivos intervalos de un segundo.
Modelo de análisis temporal: tras estudiar cualquier objeto sonoro en intervalos de un segundo permite
descomponerlo en formas dinámicas y formas estacionarias.
Responde a esta concepción de la percepción auditiva: El oído humano tiende a simplificar cualquier
estructura sonora compleja.
Agrupa en formas unitarias todos los intervalos sonoros contiguos con características acústicas similares.
Separa en formas distintas los intervalos sonoros contiguos con características acústicas muy diferentes.
5.2 Inercia acústica y discriminación entre formas sonoras
Nuestro sistema auditivo reconoce esa lógica inercial y la explota para interpretar el mundo.
La lógica inercial del entorno sonoro es una de las claves que explica cómo actúan los mecanismos de
composición y discriminación de formas sonoras en el sistema auditivo humano.
Nuestro sistema perceptivo selecciona, desprecia, separa o agrupa la información acústica en formas sonoras
en función de esa lógica.
Los principios de la inercia sonora que explota nuestro sistema auditivo son los siguientes:
Principio de la coherencia espectral: la relación de multiplicidad que existe entre las frecuencias de una
señal sonora, de una misma fuente, tiende a no verse afectada por ninguna de las variaciones que sufre esta
señal.
Principio de la estabilidad tonal: la frecuencia de un sonido continuo que emana de una misma fuente no
tiende a cambiar súbitamente.
Principio de la sincronía: Cuando distintos componentes acústicos que se superponen en el tiempo

provienen de la misma fuente sonora, tienden a arrancar y a pararse en el mismo instante.
Principio de la asincronía: Cuando distintos componentes acústicos que se superponen en el tiempo

provienen de fuentes sonoras diferentes, tienden a no arrancar ni pararse en el mismo momento.
En todos estos principios subyace la vinculación entre sonido y fuente sonora
En nuestro entorno físico cotidiano la organización de la complejidad acústica había dependido

exclusivamente de las fuentes sonoras naturales.
A cada sonido corresponde siempre un objeto físico colocado en algún lugar próximo. Hemos aprendido a
utilizar nuestra capacidad de percepción auditiva de acuerdo con esa lógica acústica.
Consiste en discriminar como formas sonoras distintas a todo conjunto de componentes acústicos que puedan
ser identificados perceptivamente como provenientes de fuentes distintas, y agrupar en una misma forma
sonora los componentes que identificamos como emanados de la misma fuente.
5.2.1 Principio de la coherencia espectral
El principio de la coherencia espectral lo usa nuestro sentido de la audición cuando se presenta una mezcla
sonora de muchos componentes acústicos que coexisten simultáneamente en el tiempo.
Nuestro oído ha aprendido a reconocer como una forma sonora única todo el haz de frecuencias que
siguen un mismo patrón relacional de armonicidad.
También a identificar como formas sonoras distintas los distintos haces de frecuencias sonoras organizados
con patrones relacionales de armonicidad diferentes.
La explotación perceptiva del principio de la coherencia espectral responde en su nivel primigenio a la

necesidad de agrupar los componentes sonoros en función de las fuentes que los han generado.
5.2.2 Principio de la estabilidad espectral
El principio de la estabilidad espectral indica que la composición de un espectro, su envolvente o impresión

espectral suele ser estable y sólo tiende a variar bruscamente cuando existen elementos externos o
variaciones físicas de la fuente que influyen sobre él.
Utilizamos este principio para identificar cambios espaciales o para reconocer alteraciones físicas de la propia
fuente generadora del sonido.
También influyen sobre la envolvente espectral las alteraciones de la propia fuente sonora.
Si cada cambio súbito de impresión espectral está sistemáticamente asociado a una influencia espacial nueva,
son reconocidos y segregados por el oído como formas sonoras distintas porque aportan información
importante sobre el contexto espacial de la fuente sonora.
El sistema auditivo explota el principio de estabilidad espectral identificando como una única forma
sonora aquel sonido que mantiene su envolvente espectral estable, y discriminando como dos formas
sonoras distintas aquello que percibimos antes y después de un cambio súbito en la envolvente espectral.
5.2.3 Principio de la estabilidad tonal
El principio de la estabilidad tonal es coherente con la resistencia natural de los cuerpos a cualquier cambio
brusco.
Expresa la sensación auditiva de final-principio que percibimos cuando la evolución del tono de un sonido no
es progresiva, sino que se transforma a saltos.
Explicaremos ahora esto desde la perspectiva de la inercia acústica: la frecuencia de un sonido no tiende a
cambiar súbitamente de forma natural si no existe algún fenómeno externo o interno que influya fuertemente
en la fuente que lo genera.
Nuestro oído utiliza el principio de la estabilidad tonal reconociendo como una forma sonora única a un
sonido mientras su tono no sufre ninguna variación súbita, y discriminando dos formas sonoras distintas
los continuums sonoros que percibimos antes y después de un salto tonal brusco.
Hasta aquí solo hemos hablado de formas sonoras elementales.
5.2.4 Principio de la regularidad
El principio de la regularidad está directamente vinculado a los de estabilidad tonal y estabilidad espectral y es
coherente con ellos.
En el entorno natural las cualidades acústicas de una misma fuente sonora suelen mantenerse estables, a pesar
de que aparezcan interrupciones breves de la emisión del sonido.
Si estas cualidades cambian, tienden a hacerlo de forma lenta y progresiva.
El oído humano tiende a unir los estímulos sonoros de características acústicas similares en un solo grupo y
una única forma, y a segregar los estímulos acústicos de características distintas a grupos diferentes, o sea, en
formas sonoras diferenciadas.
La razón por la que el sistema auditivo humano explota el principio de regularidad está en la necesidad de
recomponer las formas esenciales para la supervivencia, que normalmente son interrumpidas por muchos
sonidos, con objeto de diferenciarlas de otras formas sonoras menos importantes.
Ej: es muy útil recomponer los contenidos de una llamada telefónica internacional cuando esta llega a nuestro
oído llena de parásitos.
El oído da prioridad al tono sobre la proximidad temporal, y agrupa los graves con los graves y los agudos
con los agudos.
Según Bregman, este tipo de segregación auditiva se produce cuando la sucesión se alarga por lo menos 4
segundos. Y son necesarios también 4 segundos para disiparla.
El principio de regularidad es utilizado por el oído de tres modos distintos:

1. Cuando todo un conjunto de sucesos sonoros, separados entre sí por breves interrupciones son
reconocidos como muy similares, van a ser interpretados por el oído humano como provenientes de la
misma fuente, y por tanto recompuestos como una forma sonora única.
2. Cuando en una serie lineal de sonidos acústicamente muy similares surge una única variación
sonora brusca, que afecta ya al resto de la serie; esta variación será interpretada por el oído como un
cambio de fuente sonora.
3. Cuando todo un conjunto de sucesos sonoros acústicamente similares, que evolucionan linealmente
en el tiempo y están separados entre sí por interrupciones muy breves, se configuran como dos flujos sonoros
suficientemente diferenciados, serán segregados por el oído como dos formas sonoras diferentes
percibidas como si evolucionaran en el tiempo simultánea e independientemente.
5.2.5 Principios de la sincronía y de la asincronía
Doble principio: la lógica física de que todos los componentes acústicos de un mismo sonido (de una fuente
sonora concreta) tienden a arrancar, parar y sufrir sus variaciones de manera idéntica y simultánea.
Y viceversa, los componentes acústicos de los sonidos que emanan de distintas fuentes tienden a no
arrancar, para ni sufrir variaciones en el mismo momento.
¿Qué ocurre cuando los sonidos que estamos escuchando son inarmónicos, cómo trabaja el oído para
discriminarlos bien?
Entonces es cuando el oído utiliza el principio de sincronía, agrupando como una única forma sonora todos
los componentes acústicos que sufren sus variaciones de forma sincrónica.
O bien separando en formas sonoras distintas los que sufren variaciones en momentos diferentes.
El principio de la sincronía es utilizado también por la percepción humana para coordinar el sentido de la
vista con el sentido de la audición.
Ej: leer los labios de alguien que apenas oímos en medio de mucho barullo y entender lo que está diciendo.
El principio de la sincronía se utiliza por el sistema perceptivo para separar de entre toda la maraña sonora
sólo aquellos componentes acústicos que arrancan, varían y paran coincidiendo en el tiempo con el
movimiento de la fuente sonora.
5.3 Taxonomía de las formas simples
La clasificación que articularemos pretende establecer una terminología fundamentada en el análisis acústico
y capaz de adaptarse a la capacidad perceptiva y descriptiva de cualquier oyente.
Definíamos forma sonora como toda configuración acústica que tiende a ser percibida como un bloque
sonoro unitario.
Cualquier forma sonora que esté configurada por las tres dimensiones del sonido a la vez será sumamente
complicada.
Así, las formas sonoras más simples serán, lógicamente, aquellas que estén configuradas solamente por las
variaciones de una única dimensión sonora.
Forma sonora simple es cualquier configuración sonora constituida por las variaciones de una única
dimensión acústica, que tiende a ser percibida como un bloque sonoro unitario y coherente.
5.3.1 Contorno y textura
Primera clasificación terminológica de las formas sonoras simples en dos categorías globales: contorno y
textura.
Para observar el carácter perceptivo de un sonido es necesario tener en cuenta la evolución de su inicio
(ataque) en relación con la intensidad.
Una vez que se ha producido el ataque, el suceso sonoro se desarrolla constituyendo un bloque compacto
(cuerpo) que puede mantenerse, o no, invariable hasta que llega al momento de su extinción.
La evolución de las dimensiones acústicas del cuerpo de los sucesos sonoros acostumbra a ser menos
significativa que su ataque.
Todo suceso sonoro tiene un momento en que su energía vibratoria se extingue y deja de sonar, que es la
caída.
Primera categoría: contorno, engloba las formas que dependen de la evolución del tono y la intensidad en el
tiempo.
Segunda categoría: textura, contiene todas las formas dependientes de la evolución de la estructura tímbrica
en el tiempo.
Llamaremos contorno a todas las evoluciones de la intensidad y el tono que se producen a lo largo de un
suceso sonoro concreto.
Llamaremos textura a todas las evoluciones del timbre que se producen a lo largo de un suceso sonoro
concreto.
El contorno de un suceso sonoro está compuesto por las tres fases, ataque, cuerpo y caída que definimos así:
Ataque: es la fase de inicio del suceso sonoro y su característica esencial es que la energía del sonido parte de
0 y llega a un valor X en un tiempo determinado.
Cuerpo: es la etapa central del sonido. Se sitúa entre el instante en que finaliza el ataque, cuando la energía
del sonido se estabiliza para hacerse estacionaria, y el instante en el que la energía del sonido vuelve a
desestabilizarse para iniciar la caída.
Caída: es la fase final de todo suceso sonoro y su característica esencial es que la energía del sonido parte de
un valor X y se extingue hasta 0 en un tiempo determinado.
El contorno de todo suceso sonoro consta siempre de dos dimensiones que evolucionan simultáneamente en
el tiempo:
-la dinámica, que es la intensidad global
- y la tonal, que es la frecuencia fundamental
La evolución del ataque y la caída en los sucesos sonoros, perceptivamente se asocia a la relación tiempo-
intensidad, por lo que podemos apoyarnos en estas variables para nombrar y clasificar cualquier sonido.
5.3.2 Clasificación según el inicio del contorno sonoro
Ataque duro: cuando el cambio de la intensidad del sonido de 0 a 50 dB se produce aproximadamente en 1

centésima parte de un segundo.
La sensación auditiva es la de una explosión o un golpe seco sobre algo duro.
Es el efecto sonoro del inicio de las consonantes explosivas del castellano (0’015s)
Ataque blando: cuando el establecimiento de la intensidad del sonido entre 0 y 50 dB tarda más de 5
centésimas de segundo.
La sensación auditiva que produce esta forma de iniciar el sonido es la de un comienzo brusco pero sin efecto
de chasquido o de explosión, como las sílabas que empiezan por B en castellano.
Ataque lento: cuando el ascenso de la intensidad para llegar de 0 a 50 dB se produce a lo largo de todo 1
segundo.
Este tipo de ataque permite escuchar claramente la subida progresiva del sonido, sensación que no es en
absoluto perceptible en los otros dos ataques. Es el sonido del inicio de un bostezo.
Cuando el ataque se extiende a lo largo de un segundo es sistema auditivo tiene ya capacidad para percibir
fluctuaciones tonales o de intensidad, y cuando aparecen se establece un cuarto tipo de ataque, el ataque
múltiple
Ataque múltiple: cuando el ascenso de la intensidad de 0 a 50 dB se desarrolla a lo largo de todo 1 segundo, y

a la vez, durante este ascenso progresivo se producen variaciones perceptibles del tono o la intensidad.
La sensación es de ascenso sonoro vibrante.
En el ataque duro y el blando, el sistema auditivo no discrimina entre tono e intensidad, porque es
necesario que el sonido dure más de una décima de segundo para que la sensación tonal sea perceptible al
oído humano.
5.3.3 Clasificación según el cuerpo del contorno sonoro
Sólo podremos describir y nombrar con la precisión suficiente el cuerpo de un contorno sonoro cuando éste se
extienda como mínimo durante un segundo. 1s
El concepto de cuerpo solo toma sentido cuando en el suceso sonoro existe una etapa central durante la cual
se estabilizan las dimensiones del sonido.
A menudo, nos podemos encontrar contornos sonoros que no tengan un cuerpo central bien definido porque la
configuración de sus formas pasa directamente del ataque a la caída.
A lo largo del cuerpo de un sonido son perceptibles siempre las evoluciones paralelas del tono y la intensidad.
Ambas dimensiones van a estar configurando, a la vez, formas sonoras, y esto desencadena la percepción de
formas sonoras complejas de doble articulación.
La primera diferenciación perceptiva que salta al oído es si la intensidad es dinámica o estacionaria, es decir,
si permanece estable o está variando.
Según la condición variable o estable de la intensidad, definiremos tres tipos de formas: intensidad estable,
intensidad variable e intensidad oscilante.
Intensidad estable: cuando ésta permanezca sin sufrir ninguna variación un periodo de tiempo igual o
superior a 1 segundo.
Sólo se le podrá denominar estable durante el periodo que ha permanecido invariable.
Intensidad variable: cuando sufre más de una alteración en sus sucesivos intervalos de 1 segundo, siempre
que todas estas variaciones no retornen cíclicamente al mismo valor.
Intensidad oscilante: mientras esté sufriendo más de una variación de su intensidad en sus sucesivos
intervalos de 1 segundo, de modo que esas variaciones se repitan cíclicamente en cada intervalo volviendo
siempre al mismo valor.
Perceptivamente la sensación auditiva que produce una intensidad oscilante es la de un sonido vibrante que
mantiene su intensidad modulada de manera globalmente estable.
Contrariamente, cuando la intensidad es variable, la sensación que produce es de cambio permanente.
Cada una de estas tres categorías sonoras puede subdividirse a su vez en varias más.
Intensidad estable.
Una forma sonora de intensidad estable puede ser:
• Fuerte: de unos 100 dB, como la

intensidad de un martillo neumático
• Media alta: de unos 70 dB, como la
intensidad de voz muy fuerte
• Media baja: de unos 40 dB, como la
intensidad de voz muy baja
• Débil: de unos 20 dB, como la intensidad
del ambiente en una habitación cerrada silenciosa
Intensidad variable
Una forma sonora de intensidad variable puede ser:
• Ascendente: que aumenta de intensidad

progresivamente
• Descendente: que disminuye de intensidad
progresivamente.
Intensidad oscilante
Sabemos que un sonido de intensidad oscilante producirá sensación de vibración rápida si la pulsación cíclica
de su intensidad supera las 80 variaciones por minuto.
Así, puede ser:
• Pulsación rápida: más de 80 variaciones

cíclicas por minuto
• Pulsación media: entre 70 y 80 variaciones
• Pulsación lenta: menos de 70 variaciones
Hemos clasificado la intensidad, y nos queda clasificar el tono.
Tono estable: cuando éste permanezca sin sufrir ninguna variación un periodo de tiempo igual o superior a 1
segundo. Sólo se le podrá denominar tono estable durante el periodo que ha permanecido invariable.
Tono variable: mientras esté sufriendo más de una alteración en sus sucesivos intervalos de 1 segundo,
siempre que todas estas variaciones no retornen cíclicamente al mismo valor.
Tono oscilante: mientras esté sufriendo más de una variación de su frecuencia fundamental en sus sucesivos
intervalos de 1 segundo, de modo que esas variaciones tonales se repitan cíclicamente dentro de cada intervalo
retornando siempre a un mismo valor.
Para desarrollar la clasificación del cuerpo de un sonido con tono estable recurriremos otra vez a la voz
humana.
Según esta referencia, clasificaremos las formas de tono estable como:
• Agudo: 500Hz, tono de una voz femenina

muy aguda
• Medio alto: 240Hz, tono de una voz
femenina normal
• Medio bajo: 120 Hz, tono de una voz
masculina normal
• Grave: 70 Hz, tono de una voz masculina
muy grave
Clasificaremos las formas sonoras de tono variable como:
• Ascendentes: aumentan de frecuencia

progresivamente
• Descendentes: disminuyen de frecuencia
progresivamente
• Melódicas: sufren variaciones de
frecuencia ascendentes-descendentes o descendentes-ascendentes sin ningún cambio brusco.
En las variaciones de tono melódicas la condición de que no haya alteraciones bruscas es porque si las hay el
oído tiende a descomponerla en dos formas simples, una ascendente y otra descendente.
El tono oscilante puede ser:

• Pulsación rápida: más de 80 variaciones
cíclicas por min
• Pulsación media: entre 70 y 80
• Pulsación lenta: menos de 70
5.3.4 Clasificación según el final del contorno sonoro
Igual que ocurría con el inicio, el final de un contorno sonoro aporta información muy importante sobre la
percepción formal de un suceso sonoro. Al final se le denomina caída.
La terminología que proponemos para nombrar los sonidos según el carácter de su caída es:
Caída dura: cuando la disminución de la intensidad del sonido desde 50 hasta 0 dB se produce
aproximadamente en 0’01 segundos.
La sensación auditiva es de obstrucción seca y brusca.
Ej: consonantes oclusivas después de vocal, o cerrar con un interruptor un canal de audio
Caída blanda: cuando la desaparición de la intensidad de 50 a 0 dB tarda en producirse más de 5 centésimas

de segundo.
La sensación auditiva es la de un final rápido pero sin oclusión.
Ej: una vocal al acabar un grupo fónico, que termina de golpe pero sin oclusión.
Caída lenta: cuando el descenso de la intensidad para bajar de 50 a 0 dB se produce a lo largo de todo 1
segundo.
Efecto auditivo de resonancia.
Ej: una nota de piano, guitarra, un grito en una sala vacía.
Igual que ocurre con el ataque, cuando la caída de un sonido se extiende durante un segundo, el sistema
auditivo puede percibir ya fluctuaciones tonales o de intensidad. Cuando se producen, se establece el cuarto
tipo de caída, la caída múltiple.
Caída múltiple: cuando el descenso de identidad se extiende a lo largo de 1 segundo, y a la vez se producen
variaciones perceptibles de tono o intensidad.
Ej: Sonido de un gong o una campana.
5.3.5 La duración
No vamos a establecer una clasificación concreta en función de las duraciones, porque esta es una variable del
sonido extremadamente abierta desde el punto de vista perceptivo.
Así que siempre se añade la duración aproximada en segundos.
Hay que decir la duración completa aproximada en segundos, desde el inicio hasta el final, de cada forma
sonora simple. Lógicamente, cuando un sonido quede desglosado en varias formas sonoras simples deberemos
describir cada una de ellas y añadir también sus respectivas duraciones en segundos.
5.3.6 Clasificación según la textura
Textura es la sensación auditiva global que se produce al percibir como evoluciona el timbre en el tiempo.
O sea, la textura es el resultado perceptivo que desencadena la variabilidad del timbre a lo largo del tiempo.
Ej: símil forestal, contorno sonoro con la silueta de un árbol centenario. Color y rugosidad que tiene la
superficie del tronco.
El concepto de timbre está vinculado rígidamente a la estructura acústica de los sonidos compuestos.
Es la sensación que produce esta estructura.
Y el modo de aproximarnos a la estructura acústica global de un sonido, en un primer momento, es siempre
sincrónico.
Ej: Estudiar la forma superficial del tronco cortándolo en rodajas para observar con detalle el perfil de cada
una de ellas.
El concepto de timbre está asociado a un perfil acústico concreto en un instante determinado, pero al ir
transcurriendo el tiempo la composición acústica evoluciona, y va configurando timbres distintos.
No hay que confundir los timbres de distintos instantes determinados con la sensación que produce al oído
todo su conjunto tras configurar una forma en el tiempo.
O sea, no hemos de confundir el perfil tímbrico de un instante determinado, con la sensación de textura que
produce al oído el resultado global de su evolución temporal. El timbre es la textura de un suceso sonoro.
El efecto de textura de un sonido depende de su composición acústica global, y en consecuencia, de la

evolución temporal de timbre.
La textura de un sonido dependerá siempre, simultáneamente, de su armonicidad, de su definición y de su

impresión espectral.
Definición: definición auditiva es la sensación de máximo grado de precisión, exactitud o detalle sonoro que
percibe el oyente al escuchar atentamente un sonido.
Decíamos que esta sensación depende de la riqueza de frecuencias que componen un sonido. A mayor gama
de frecuencias mayor sensación de definición auditiva.
Tres grados de nivel de definición, dependiendo de la gama de frecuencias:

• Definición baja: cuando esté compuesto
por una gama de frecuencias muy reducida, como la que va de los 300 Hz a los 3000.
Sensación de calidad auditiva muy pobre y poco matizada
Ej: sonidos a través de un auricular de teléfono
• Definición media: cuando esté compuesto

por una gama de frecuencias intermedia, entre 160 y 6000 Hz.
La sensación auditiva es la de la radio de onda media y larga, o el sonido del cine de los años 40 o 50.
• Definición alta: si está compuesto por una

gama de frecuencias tan extensa como la que puede percibir el oído humano, de 20 a 20.000 Hz.
Sensación auditiva de exactitud, como los sonidos naturales con la fuente cercana al oído, o una cadena hi-fi
La dimensión de la textura de los sonidos a la que nos vamos a dedicar ahora es la impresión espectral
La impresión espectral es la sensación de diferente matiz auditivo que percibe un receptor, cada vez que
escucha un sonido de idéntica composición de frecuencias, pero con distinta envolvente espectral.
La envolvente espectral de un sonido es la forma obtenida al trazar una línea que une todas las puntas de
cresta de sus espectrogramas.
La forma más habitual de construir o alterar esta impresión espectral es influyendo sobre la caja de resonancia
en la que se produce el sonido.
Tres categoría diferenciadas dentro de la sensación de impresión espectral, según una división del espectro de
frecuencias audibles en tres zonas: frecuencias bajas (20 a 200 Hz), frecuencias medias (200 a 3000 Hz), y
frecuencias altas (3000 a 20.000Hz).
A los tres tipos de textura que se configuran siguiendo estos criterios los denominamos:
Impresión espectral oscura: cuando la intensidad de su zona de frecuencias baja es superior a la intensidad
del resto de frecuencias.
Matiz de una voz grave.
Impresión espectral brillante: Cuando la intensidad de su zona de frecuencias altas es superior a la intensidad
del resto de frecuencias.
Matiz que adquiere una voz cuando se emite en una habitación vacía de paredes lisas y duras.
Impresión espectral mate: cuando la intensidad de su zona de frecuencias medias es proporcionalmente

superior a la intensidad del resto de frecuencias.
Matiz de una voz en un estudio de radio.
Armonicidad
Los oyentes discriminamos el grado de transparencia de las voces sólo en función de la cantidad de armónicos
que aparecen en la anda de los primeros 5000 Hz.
Tomaremos como referencia acústica los 5000 primeros hertzios del espectro y los dividiremos en tres
bandas: 0 a 1700 Hz, de 1700 a 3300Hz y de 3300 a 5000 Hz.
Según el grado de armonicidad hay tres matices de textura:
Sucia: cuando la organización armónica de su espectro de frecuencias esté por debajo de los 1.700 Hz.
Ej: molinillo de café
Basta: cuando la organización armónica de su espectro de frecuencias esté por debajo de los 3.000 Hz
Ej: Trompetilla de juguete
Transparente: cuando la organización armónica de su espectro de frecuencias esté por encima de los 3.300
Hz.
Ej: sonido de un diapasón, o una copa de cristal de bohemia.
La textura de un sonido tiene siempre las tres dimensiones simultáneamente, es necesario nombrar su grado
de definición, de armonicidad y decir además que tipo de impresión espectral produce.
5.3.7 Cuadro global
CONTORNO Ataque + Cuerpo + Caída + duración
Duro 0’001s
Ataque Blando +0’005s
Lento 1s Fuerte 100 dB
Múltiple 1s+var Media Alta 70 dB
Estable Media Baja 40 dB
1s o + Débil 20dB
Intensidad Variable Ascendente

+ de 1 var x 1s Descendente
Pulsación rápida + de 80 var. x min

Oscilante Pulsa. media 70-80 var x min
var retornan cíclic. Pulsa. lenta - de 70 var x min
Agudo 500 Hz
Cuerpo Medio alto 240 Hz
(Intensidad + Estable Medio bajo 120 Hz
tono) 1s o +
Grave 70 Hz
Tono Ascendente
Variable Descendente
+ de 1 var x seg. Forma melódica
Pulsa. rápida + de 80 var. x min

Oscilante Pulsa. media 70-80 var x min
var retornan cíclic. Pulsa. lenta - de 70 var x min
Dura
Blanda
Caída Lenta
Oscilante
Duración Se anotan los segundos que dura La forma sonora
TEXTURA (definición + Impresión Armonicidad)

Espectral +
Alta 20 a 20.000Hz
Definición Media 160 a 6.300 Hz
Baja 300 a 3.000 Hz Oscura + intensidad
frecuencias bajas
Impresión Brillante + in.frecuencias
Espectral altas
Sucia -1.700Hz Mate + frecuencias medias
Armonicidad Basta -3.300Hz
Transparente + de 3.300Hz
6. DE LA FORMA SONORA AL SENTIDO
6.1 El modelo semiótico
La semiología proporciona el concepto de signo, explicando la construcción de sentido a partir de la

interacción de los conceptos de significante, forma reconocible de cualquier sustancia expresiva, significado,
sentido asociado a esa forma reconocible, y referente, la parte del universo referencial a la que se asocia el
significado.
Podemos reducir este modelo solo al sonido, y explicar la producción de sentido por la interacción que se
produce entre las formas sonoras reconocibles, la asociación de cada forma sonora a un contenido, y la parte
del universo que estamos nombrando o escuchando.
Saussure:
El signo es una forma perceptible que se elige arbitrariamente para asociarla a un sentido determinado.
Signo arbitrario
Peirce:
El signo es una forma perceptible que está vinculada físicamente con algún fenómeno real del que emana su
sentido. Signo motivado
6.1.1. Signos sonoros motivados y signos sonoros arbitrarios
Los signos sonoros motivados son aquellos que tienen su origen en formas sonoras que al reconocerlas nos
remiten a un ente o fenómeno concreto en el universo referencial que es su fuente de producción.
Sonidos como: pitido telefónico, claxon coche, instrumento musical, sonido de la lluvia, etc
Este modelo funciona bien en los ámbitos naturales, donde estamos en contacto directo con las fuentes
generadoras del sonido. Pero no cuando vemos algo por la tele, por ejemplo.
Los signos sonoros arbitrarios son esas formas sonoras asociadas mediante elección arbitraria a una clase de
objetos o acciones del universo referencial.
Son estructuras sonoras como las palabras: árbol, coche, papel, correr, hablar etc
Les caracteriza el hecho de que no existe ninguna razón que explique porqué cada una de estas secuencias de
sonidos ha sido asociada a determinado objeto o acción.
Este modelo funciona bien en la lectura y escritura, pero también funciona peor en un contexto audiovisual,
porque la forma de decir las palabras está siempre vinculada al estado emocional del individuo o a las
características objetivas de aquello que se nombra.
6.1.2. La construcción de sentido sonoro en el ámbito audiovisual
En el lenguaje audiovisual, podemos construir artificialmente el sonido de una tormenta sumando los sonidos
de viento, lluvia y truenos, y utilizar este sonido para aumentar la sensación de dramatismo de una situación
determinada.
Ej; el desplazamiento del héroe en el interior del castillo del vampiro.
El sonido de “tormenta”(viento+lluvia+truenos) han dejado de tener el valor de indicar que hay tormenta
porque lo esencial de estos sonidos es su capacidad de comunicar sensación de inseguridad y peligro al
espectador que contempla la secuencia.
Así hemos creado un nuevo sentido que no es el de índice (pierce) ni el de signo lingüístico arbitrario
(saussure)
Este desbordamiento de la concepción tradicional de signo se debe a que el oyente ejerce un papel activo.
El receptor parte de sus propios automatismos perceptivos y de la acumulación de una larga

experiencia vital para asociar formas sonoras y sentido, para conducir activamente su escucha.
El oyente decide activamente en cada ocasión cómo debe oír y luego interpreta lo que oye para darle sentido.
Pero este sentido no tiene porqué estar en repertorios prefijados, puede ser un sentido nuevo: modificado,
recompuesto o recién descubierto.
Hay que desarrollar un modelo más amplio que el modelo clásico de la semiología, para explicar situaciones
variadas de producción de sentido.
6.2. El modelo de los mecanismos de escucha
Cuatro tipos de escucha propuestos por Schaeffer: oír, escuchar, reconocer y comprender
6.2.1 Oír
Supone recibir información a través de nuestro sistema auditivo.
Cuando recibimos sonido sin prestarle atención activa es cuando estamos oyendo.
La mayor parte de los estímulos sonoros que llegan a nuestro sistema auditivo son sólo oídos y muy pocos
escuchados.
El concepto de escucha de Schaeffer está ligado al concepto perceptivo de atención.
Aunque no prestemos ninguna atención a los estímulos sonoros no dejamos nunca de oírlos, ni siquiera
durmiendo.
Cuanto más familiar es el estímulo que oímos, más fácil es que lo escuchemos.
6.2.2 Escuchar
Escuchar supone prestar al sonido una atención activa que tiene como objetivo extraer de él una información
determinada que nos interesa por alguna razón.
Escuchar supone prestar atención al sonido con voluntad de identificarlo o interpretarlo. Pero la atención
activa suele utilizar el sonido sólo como correa de transmisión. La escucha no atiende al sonido mismo, a su
forma, sino solamente a la información que éste transporta.
El sonido mismo como fenómeno físico muy a menudo suele ser ignorado por el receptor. Y en el lenguaje
cotidiano se sustituyen los sonidos por aquello de lo que informan. Ej. Suena el reloj por Escucho el tic-tac
del reloj.
El objetivo de la escucha también puede ser el intento de oír mejor. También podemos escuchar los sonidos
con voluntad de identificación precisa.
Este tipo de escucha analítica es la que se propone en este libro, y es muy poco habitual. La capacidad para
desarrollar una escucha analítica y el rendimiento informativo que le podamos sacar depende del
conocimiento aprendido sobre las formas sonoras.
6.2.3. Reconocer
Reconocer un sonido supone identificar su forma y asociarla a una fuente sonora.
O también encontrar en nuestra memoria auditiva una forma sonora similar a la escuchada que nos da la clave
del origen de ésta que ahora estamos escuchando. Esto sería la clave del reconocimiento de las formas sonoras
de la lengua.
Hay que diferenciar el reconocimiento, o la identificación de una forma, de la producción de sentido o

comprensión, que sería el siguiente nivel.
En el lenguaje audiovisual, el acto de reconocer un sonido supone su asociación a una fuente sonora virtual, y
así la configuración de un ente acústico.
No obstante, no todos los sonidos han de ser reconocidos y transformados en entes acústicos. También pueden
ser comprendidos directamente sin que los ubiquemos en un punto exacto del espacio.
Por ejemplo: podemos comprender que una música me explica la emoción de un personaje sin preocuparme
de cual es el instrumento que la emite ni de donde está el músico.
6.2.4 Comprender
Comprender es obtener la información final que buscábamos en el sonido con el acto de escucha.
En el lenguaje audiovisual se asocial recursos sonoros e imágenes para conducir la interpretación que ha de
hacer el espectador del conjunto audiovisual. El oyente comprende el sentido de cada forma sonora mediante
la influencia mutua sonido-imagen.
Comprender es ir más allá de la identificación de la forma y de la fuente, y producir un nuevo nivel de sentido
a partir de la interpretación de aquello que estamos oyendo en función del contexto perceptivo y de nuestra
propia experiencia auditiva.
6.2.5 El aprendizaje en la construcción del sentido sonoro
El proceso de asignación de sentido a las formas sonoras está organizado en tres niveles de especialización.
El primer nivel, es el que utiliza la memoria auditiva del entorno inmediato. Es una fase de aprendizaje
auditivo que cursa todo ser humano con un sentido de la audición normal en sus primeros años de vida.
El segundo nivel depende del ámbito específico en el que se desarrolla cada individuo. El segundo nivel se
adquiere ya con el apoyo de una experiencia auditiva especializada. Se basa en un aprendizaje de síntomas
acústicos que sólo resultan útiles en ámbitos muy concretos.
Ej. El cazador que reconoce los sonidos de los animales que persigue.
La diferencia entre memoria auditiva del entorno y la experiencia auditiva especializada está en la dimensión
más restringida de la segunda. Este saber sonoro no es universal, sino que se ha desarrollado en función de
intereses específicos no generalizables, de grupos reducidos.
El último y más complejo nivel de especialización es el aprendizaje de lenguajes sonoros arbitrarios, como
las lenguas, el morse o la música.
El elemento definitorio de este tercer nivel constituido por el aprendizaje de lenguajes sonoros arbitrarios
frente a los otros dos niveles es el grado de especialización auditiva.
6.2.6 Un modelo sobre dos ejes: el perceptivo y el cultural
El aprendizaje se inserta en el proceso de reconocimiento auditivo para desarrollarlo y especializarlo de

acuerdo con unos intereses concretos de grupo.
Es un proceso que reorienta la percepción y la hace dependiente de la cultura de cada grupo humano.
Esta nueva línea dentro de los mecanismos auditivos se inserta y encaja perfectamente en el proceso
perceptivo respetando su estructura. Y no sólo la respeta sino que precisa de ella y también del asentamiento
del primer nivel de aprendizaje para poder existir.
Construir la memoria auditiva del entorno inmediato supone construir una base que será imprescindible para
todo aprendizaje perceptivo posterior.
Ej: problemas de los sordos con aparato fonador sano, no pueden dominar jamás los matices sonoros de la
lengua hablada. No disponen de la memoria auditiva del entorno inmediato
El Modelo de los mecanismos de escucha está estructurado en 2 ejes:

P AUDICIÓN
R /
O ESCUCHA
C /
E RECONOCIMIENTO
S /
O /
Identificación del ___________ Experiencia Auditiva ________ Aprendizaje de lenguajes
P Entorno inmediato especializada arbitrarios
E (forma sonora primaria) (formas sonoras especializadas) (formas sonoras culturales)
R /
C /
E COMPRENSIÓN
P. ___________________________ PROCESO CULTURAL ______________________________
La aplicación del modelo de los mecanismos de escucha para explicar los procesos de creación de sentido
sonoro en la com. audiovisual es más útil que los modelos lingüísticos y semiológicos.
Este modelo inserta el discurso lingüístico en su contexto sonoro real, que es mucho más amplio y complejo
que el escrito/literario
Este modelo permite explicar cómo se crea sentido a partir de las formas sonoras primarias, y permite
explicar además como se vinculan con las formas sonoras culturales en un único sistema expresivo
multidimensional.
6.3. Teoría de la coherencia perceptiva
El sistema perceptivo tiende siempre a interactuar de manera global y coherente, haciendo interactuar a la vez
todos sus sentidos y todos los niveles de cada sentido.
El modelo de los mecanismos de escucha no funciona de manera lineal sino simultánea en sus dos ejes, sus
dos sentidos y todos sus niveles.
El resultado es la capacidad del oído para extraer múltiples dimensiones informativas relacionadas entre sí.
6.3.1 El sentido sonoro como construcción multidimensional
Durante todo el proceso de producción de sentido sonoro, la escucha , el reconocimiento y la comprensión

actúan estrechamente relacionados entre sí, con un grado de interacción muy importante entre los tres niveles
de especialización auditiva.
Se configura un sistema de superposición de informaciones que hace que el sentido sonoro sea siempre una
construcción multidimensional.
Ej: mensaje de mi novio en el contestador “¡soy X! ¡ no pienso volver a hablarte nunca más!
Buscando sentido a este mensaje, que no tiene explicación previa.
Primer momento: la lengua me permite saber el contenido semántico del mensaje.

Después: Ese contenido lingüístico estricto ha dejado de ser el centro de mi interés
Abandono el nivel de reconocimiento de las formas lingüísticas y vuelvo a escuchar el timbre y el estilo de la
voz utilizando mi memoria auditiva para comprobar que es la voz de mi novio. Efectivamente así es. Este
trabajo de construcción de sentido es mucho más primario, sólo he identificado la fuente sonora.
Vuelvo a escuchar la grabación para detectar ironía en la voz; he regresado a la fase de escucha pero recurro a
mi experiencia auditiva especializada.
La voz intenta ser agresiva pero es fingida, la intensidad es fuerte pero no hay tensión, habla con rapidez pero
los ataques de las consonantes no son lo bastante duros. Es la voz de X, pero ahora tengo la sensación de que
hace teatro. Es una broma pesada.
En el momento de comprender el sentido de la broma se están superponiendo en esta secuencia sonora por lo
menos tres dimensiones de sentido: el contenido semántico del texto, la identificación del locutor y el
reconocimiento de una contradicción entre lo que debería ser el sonido lógico del discurso y su matiz
expresivo real.
Pero ese mecanismo de construcción del sentido sonoro en múltiples dimensiones no ha producido una
interpretación concreta hasta que ha sido posible encontrar su coherencia real.
La construcción de sentido desde las formas sonoras se articula siempre en varias dimensiones
simultáneamente.
En las formas sonoras culturales como el habla, la identificación de las palabras aisladas y de su sentido se
articula con el reconocimiento de las formas sonoras que organizan y matizan el contenido semántico global
de estas palabras cuando están agrupadas y asociadas entre sí (entonación y pausas)
Estos dos primeros sentidos se suman al que podemos extraer cuando reconocemos acústicamente los matices
emocionales.
Todo esto ocurre a la vez y se organiza desencadenando un sentido coherente y unívoco de tres dimensiones.
Las formas sonoras primarias tampoco quedan excluidas de esta multiplicidad de sentido. Se suelen articular
la identificación de la fuente y una minuciosa extracción de información sobre su ubicación espacial.
Ej: ruido de automóvil, acercándose rápido por la derecha.
6.3.2 El sentido audiovisual y la coherencia perceptiva
Hemos visto como las formas sonoras pueden desencadenar múltiples líneas de sentido que actúan a la vez
componiendo un mensaje multidimensional unívoco y coherente, tanto en las formas sonoras simples como en
las culturales.
Tenemos que ubicar este sistema para la construcción de sentido.
Además de toda la multiplicidad de sentidos que desencadena cualquier forma sonora en un contexto real,
cuando esta forma se introduce en un discurso audiovisual queda moralizada por otros mensajes sonoros y
visuales que han sido colocados junto a ella por alguien con voluntad de configurar una narración global.
Necesidad de coherencia de nuestro sistema perceptivo.

Los sentidos no actúan nunca aisladamente, el sentido de la audición actúa siempre de forma simultánea con
todos los demás.
Todo proceso perceptivo es múltiple, simultáneo, complementario, de apoyo mutuo y tiende siempre a una
coherencia global.
Sólo podemos obtener una concepción completa de la realidad exterior mediante la percepción simultánea
complementaria y coherente de todos nuestros sentidos.
Esta misma lógica perceptiva es la que permite inducir sensaciones desde sentidos que no les son propios, es
la percepción sinestésica.
Gracias a ella es posible alterar el sentido del equilibrio mediante la visión de imágenes artificiales que
ocupen un ángulo de 180 grados, sentir frío a través de la audición de sonidos de viento y lluvia, o inducir
sensaciones y estímulos de movimiento escuchando estructuras sonoras rítmicas.
Estos mecanismos de coherencia y recomposición perceptiva son los que explican el nivel más complejo de
construcción de sentido dentro del universo de la narrativa audiovisual.
Cuando en una narración audiovisual aparecen informaciones perceptivas que desde un punto de vista
naturalista serían incongruentes, tendemos a resolverlas buscando respuestas lógicas.
Ejemplos:
• Cine: una voz asociada a la imagen de una
cara que no mueve los labios, interpretamos que “escuchamos su pensamiento”
• Escuchamos un sonido de locución
vinculado visualmente a una mímica bocal que sólo sincroniza de manera parcial, tendemos a
integrarlo al movimiento de los labios
• Una persona se aleja mientras habla, pero
el sonido de su voz no disminuye de intensidad, seguimos asociando la voz a la persona que se
marcha.
Nuestro sistema perceptivo no está preparado para las contradicciones entre los distintos sentidos, así que
cuando estas aparecen en un discurso audiovisual tendemos:
a) ignorar una parte de la información y

observar sólo la coherente (doblaje)
b) interpretar estas contradicciones
asociándolas a experiencias sensoriales mucho más complejas como el recuerdo, los sueños, la
imaginación (elipsis, flash-backs, sucesos en la mente…)
c) dar prioridad a una de las informaciones
frente a las otras: en las contradicciones de sonido suele predominar la información visual
Esta tendencia a la coherencia perceptiva se utiliza habitualmente en el lenguaje audiovisual como

instrumento narrativo.
El narrador audiovisual es consciente de que esa asociación no natural entre sonidos e imágenes va a ser
integrada por el receptor con un sentido único. También se utilizan a menudo sonidos naturalistas.
Pero todos los sonidos necesitan ser escuchados y comprendidos por el receptor según la propuesta del
narrador.
Cuando un realizador fuerza la base naturalista de su narración transgrediendo la lógica perceptiva,

está forzando al receptor a pasar del nivel auditivo del reconocimiento al de la interpretación.
Desencadena en el receptor una construcción de sentido a través de la mezcla de sonidos e imágenes

propuesta.
El narrador comprueba siempre en sí mismo y en su gente alrededor, cuál es el efecto perceptivo que
desencadena cada nueva combinatoria audiovisual. Es decir, experimenta sobre audiencias cautivas para
estudiar el grado de eficacia expresiva que tiene cada una de las transgresiones que acaba de inventar.
Gracias a la tecnología audio y foto mimética que lo soporta, el lenguaje audiovisual tiene capacidad para
incorporar lenguajes arbitrarios.
Pero su fundamento, su base esencial, es naturalista. Reproduce las formas de la realidad que son perceptibles
por el ser humano y las recompone de acuerdo con esa misma lógica perceptiva. Por eso podemos interpretar
la dimensión naturalista del discurso audiovisual del mismo modo que interpretamos la realidad referencial
que nos rodea.
7. EL SONIDO EN LA NARRACIÓN AUDIOVISUAL
7.1 Sobre la superioridad de la visión
Suele asignarse a la visión y a la imagen un papel muy preponderante sobre los otros sentidos, especialmente
el de la audición.
El conocimiento sobre la percepción y la narración visual ha avanzado mucho más rápidamente que el
conocimiento sobre la narración sonora.
Por eso, los estudiosos de la comunicación disponen de más material y facilidades, y se sienten más atraídos
por el estudio de la imagen que por el sonido.
En realidad no se dispone de comparaciones experimentales fiables que puedan demostrar esta idea de
preponderancia visual, que está demasiado arraigada. Para apoyarla, se suele argumentar que
a) podemos asimilar más información por vía visual que por vía auditiva
b) el sistema auditivo se rige por el sistema visual
c) la visión actúa simultáneamente en distintas dimensiones, mientras que la audición es llana y lineal.
Se pueden rebatir fácilmente estos tres argumentos:

a) el ojo humano puede ser cerrado, y
descansa durante el sueño (3ª parte de la vida), mientras el oído permanece en funcionamiento activo
noche y día durante toda la vida. En los periodos de descanso el oído es el sentido que permanece
vigilante enviando al cerebro información sobre cualquier cambio del entorno para que nos
despierte.
b) Una de las funciones de la audición es
indicar la presencia de estímulos en las zonas que no son cubiertas por la visión. El oído cubre los
360º del contorno humano, mientras que la vista solo la mitad y depende de la luz y la postura. El
doblaje demuestra también lo fácil que es engañar desde el oído a la vista.
c) El oído es capaz de percibir perspectivas,
sensación de profundidad, a partir de la diferencia de intensidades entre los distintos objetos sonoros.
También especialidad, orientación izquierda derecha, usando las diferencias de tiempo que tarda en
llegar un sonido a un oído o a otro. Esto supone sensación de profundidad y de dirección,
simultáneamente.
El oído es capaz de realizar tres funciones distintas simultáneamente en el tiempo:

1) análisis de la complejidad frecuencial o
timbre
2) análisis de la evolución de la dinámica o
variaciones de intensidad
3) análisis de la evolución del tono o
entonación y melodía.
Ej:
Escuchando a un locutor que habla en nuestra propia lengua realizamos análisis de:
Timbre:
1. timbre de la voz del locutor
2. timbre de reconocimiento de las vocales
3. reconocimiento de las resonancias de la
sala
Intensidad:
1. Reconocimiento de la distancia locutor-
oyente
2. reconocimiento de la intensidad a la que
habla el locutor
3. reconocimiento de las diferencias de
intensidad entre oídos
Tono:
1. tono natural del locutor
2. entonación del discurso
3. variaciones micromelódicas emocionales
Se pueden contabilizar nueve niveles simultáneos de captación y procesamiento de información acústica.
Es un error enfrentarse a una discusión que divide entre sentidos prioritarios y secundarios.
7.2 ¿Qué aporta el sonido a lo audiovisual?
Michel Chion afirma que la asociación del sonido y la imagen genera una percepción completamente distinta
a la que produce cada uno de ellos por separado, proponiendo el concepto de valor añadido: es el valor
expresivo e informativo con el que un sonido enriquece una imagen dada.
Pensar que el papel del sonido en una narración audiov. es enriquecer la imagen supone, en realidad, seguir
dándole la primacía absoluta al sentido de la visión.
En el contexto del lenguaje audiov. el sonido no enriquece la imagen sino que modifica la percepción
global del receptor.
El audio no actúa en función de la imagen y dependiendo de ella, sino que actúa como ella y a la vez,
aportando información que el receptor procesará de manera complementaria gracias a la coherencia
perceptiva.
La importancia del sonido en la interpretación de la narración audiovisual no es una cuestión genérica y tonta,
su trascendencia es sistemática y responde a una lógica que es posible investigar y poner de manifiesto.
El audio actúa en la narrativa audiovisual siguiendo tres líneas expresivas bien diferenciadas:
1. transmite con gran precisión sensaciones

espaciales
El oído tiene gran capacidad para identificar formas y volúmenes espaciales reconociendo las reflexiones del
sonido y su envolvente espectral.
La radio y el cine sonoro han usado mucho esa capacidad auditiva para introducir acústicamente al espectador
en cuevas, criptas, pozos y salones palaciegos. Esa vieja tradición, con la ayuda de las técnicas del Surround y
el Dolby-Stereo, ha desembocado en un cine que da cada vez más importancia a la construcción de espacios
sonoros, a sus detalles y a su exactitud acústica.
2. Conducción de la interpretación
audiovisual.
Esta línea expresiva del sonido es la que emana más directamente de la naturaleza unificadora y coherente del
sistema perceptivo. Cuando a una propuesta narrativa sonora se le añade una imagen, o a una visual se le
añade un sonido, la simbiosis de ambas configura un mensaje nuevo, distinto del que transmiten aisladamente
cada una de ellas.
El realizador suele iniciar siempre su trabajo con una propuesta visual, pero luego, consciente del poder
narrativo del audio, recurre al sonido para conseguir los efectos perceptivos que no ha logrado desencadenar
solo con la imagen.
3. Organización narrativa del flujo

audiovisual
La organización de la cadena audiovisual es el uso más racional que el realizador hace del sonido.
Su fundamento sigue teniendo la base en la coherencia perceptiva.
En virtud del principio de la regularidad, nuestro sistema sensorial sabe que todo cambio brusco en el
sonido supone el final de un fenómeno y el comienzo de otro.
Los realizadores agrupan o separan los materiales visuales en secuencias coherentes utilizando el audio. Un
mismo grupo de varios planos visuales puede ser comprendido como una secuencia única o como varias
secuencias separadas según se haya manejado el sonido.
7.3 El espacio sonoro

La percepción auditiva del espacio es, después del habla, la información sonora más importante y compleja de
las que procesa el sistema auditivo.
Es una categoría perfectamente definida dentro de las formas sonoras primarias, que explotamos
constantemente para identificar el entorno y desenvolvernos en él.
La narrativa audiovisual ha sido consciente de eso desde que empezó a utilizar el sonido, e intenta imitar,
reconstruir o crear sensación de espacio sonoro.
La radio, entre los años 30 y 60, desarrolló una sofisticada técnica de tratamiento del sonido orientada a la
reconstrucción narrativa de sensaciones espaciales: estudios con paredes acolchadas, para recrear espacios
abiertos, y paredes lisas para recrear espacios interiores; paredes móviles para controlar la reverberación;
distancias entre los locutores y los micrófonos…
El cine actual es heredero directo de toda esa sofisticada técnica de reconstrucción sonora del espacio, aunque
ayudado ya por las inagotables posibilidades que aporta el tratamiento informático electrónico del sonido.
En las grandes producciones actuales se trabaja a fondo con las sensaciones de espacio auditivo para aumentar
el grado de realismo.
7.3.1 La necesidad de una teoría del espacio sonoro
En nuestra memoria auditiva está presente la experiencia de una asociación inmediata y lógica entre el
alejamiento o acercamiento de las fuentes sonoras y la intensidad de los sonidos que emanan de ellas.
También recordar la relación entre los movimientos laterales de las fuentes sonoras y la sensación de
direccionalidad del sonido, o la asociación entre el volumen del lugar donde se encuentra la fuente sonora y la
sensación de reverberación o de eco en el sonido.
La reconstrucción sonora de los cambios de punto de vista, para que suenen como los escucharía un ser
humano que mira sufriendo las mismas variaciones de posición que la cámara, supone tantas alteraciones del
paisaje sonoro como cambios haya de plano visual.
El primer criterio obliga a una simplificación considerable de los movimientos del punto de vista-audición.
El cine de los años 30 es buen ejemplo de lógica narrativa con relación sonido-imagen estrictamente
naturalista. Había una gran austeridad de cambios o movimientos del punto de vista. Se hacía un tipo de cine
en el que la alternancia de planos cercanos y alejados para narrar una misma situación sólo se utilizaba cuando
los contenidos sonoros eran muy poco relevantes, y no era grave alterarlos de manera antinatural.
Más tarde se observó que cuando el micro se dejaba muy próximo a la situación, aunque la cámara se moviese
constantemente, todo se comprendía mucho mejor.
Lo que se descubrió es que la independencia entre imagen y sonido facilitada por la tecnología permite
desarrollar dos líneas distintas de trabajo narrativo, una de audio y otra de vídeo.
Acusmatización.
Esta forma de producción que separa vídeo y audio casi por completo nos lleva a un universo narrativo
totalmente nuevo en el que es imprescindible conocer a fondo la lógica espacial del sistema auditivo para
poder asociar sonidos e imágenes.
El problema actual es mantener un nivel suficiente de coherencia narrativa audiovisual, que responda a la
lógica perceptiva del espectador-oyente.
En la narración audiovisual, las imágenes que vemos no son las fuentes que han producido el sonido, el
espacio que escuchamos no es siempre el que vemos, las distancias que escuchamos a menudo no se
corresponden con las que vemos.
El espacio que vemos y oímos no existe. No existen los objetos, ni el espacio, ni distancia entre ellos y el
receptor. Sólo existe una serie de sonidos organizados que configuran un paisaje sonoro que tiene que ser
interpretado.
7.3.2 El concepto de espacio sonoro
Nuestra memoria y nuestra experiencia auditiva nos permiten:

a) reconocer distancias que existen entre las
fuentes sonoras y nosotros (receptores)
b) reconocer la dirección de la que provienen
los sonidos
c) reconstruir el volumen espacial del lugar
donde está situada una fuente sonora
Estos tres mecanismos perceptivos configuran una sensación global que definimos como sensación espacial.
Espacio sonoro
Como la percepción volumétrica que surge en la mente de un receptor, a medida que va procesando
sincrónicamente todas las formas sonoras relacionadas con el espacio. Estas formas sonoras llegan
regularmente al oyente como parte de la información acústica que recibe su sistema auditivo.
7.3 El espacio sonoro

La percepción auditiva del espacio es, después del habla la información sonora más importante y compleja de
las que procesa el sistema auditivo.
Dentro de las formas sonoras primarias es una categoría bien definida.
La narrativa audiovisual ha sido consciente de eso desde el primer momento en que comenzó a utilizar el
sonido, y constantemente ha intentado imitar, reconstruir o crear sensación de espacio sonoro.
La radio entre los años 30 y 60, desarrolló una sofisticada técnica de tratamiento del sonido orientada a la
reconstrucción narrativa de sensaciones espaciales.
El cine actual es heredero directo de toda esa sofisticada técnica de reconstrucción sonora del espacio, aunque
ayudado ya por las inagotables posibilidades que aporta el tratamiento informático electrónico del sonido.
7.3.1La necesidad de una teoría del espacio sonoro
En nuestra memoria auditiva está presente la experiencia de una asociación inmediata y lógica entre el
alejamiento o acercamiento de las fuentes sonoras y la intensidad de los sonidos que emanan de ellas.
También recordamos la relación que existe entre los movimientos laterales de las fuentes sonoras y la
sensación de direccionalidad del sonido, o la asociación del volumen del lugar donde se encuentra la fuente
sonora y la sensación de reverberación.
La reconstrucción sonora de los cambios de punto de vista, para que suenen tal como los escucharía una
persona sufriendo las mismas variaciones de posición que la cámara, supone tantas alteraciones del paisaje
sonoro como cambios haya de plano visual.
El primer criterio obliga a una simplificación considerable de los movimientos del punto de vista audición.
Ej: El cine de los años treinta, tenía una lógica narrativa con relación sonido-imagen estrictamente naturalista.
Había una gran austeridad de cambios o movimientos del punto de vista. Se hacía un tipo de cine en el que la
alternancia de planos cercanos y alejados para narrar una misma situación sólo se utilizaba cuando los
contenidos sonoros eran muy poco relevantes y por tanto, no era grave alterarlos de manera antinatural.
Más tarde se observó que cuando el micro se dejaba quieto muy próximo a la situación, aunque la cámara se
moviese constantemente, todo se comprendía mucho mejor.
Lo que se descubre, en realidad, es que la independencia entre imagen y sonido facilitada por la tecnología
permite desarrollar dos líneas distintas de trabajo narrativo, una de audio y otra de vídeo.
Se empiezan a explorar las posibilidades de la acusmatización. Esta forma de producción que separa vídeo y
audio casi por completo nos lleva a un universo narrativo totalmente nuevo en el que es imprescindible
conocer a fondo la lógica espacial del sistema auditivo para poder asociar sonidos e imágenes.
El problema actual es mantener un nivel suficiente de coherencia narrativa audiovisual que responda a la
lógica perceptiva del espectador-oyente. Los ejemplos más claros son los spots y los videoclips.
En la narración audiovisual las imágenes que vemos no son las fuentes que han producido el sonido, el
espacio que escuchamos no es siempre el espacio que vemos, las distancias que escuchamos a menudo
no se corresponden con las que vemos. El espacio que vemos y oímos no existe. No existen los objetos, ni
el espacio, ni distancia entre ellos y el receptor. Sólo existen una serie de sonidos organizados que
configuran un paisaje sonoro que tiene que ser interpretado.
7.3.2 El concepto de espacio sonoro
Nuestra memoria y experiencia auditiva nos permiten pues:
a) reconocer distancias que existen entre las

fuentes sonoras y nosotros como receptores
b) reconocer la dirección de la que provienen
los sonidos
c) reconstruir el volumen espacial del lugar
donde está situada una fuente sonora.
Estos tres mecanismos perceptivos configuran una sensación global que podemos definir perfectamente como
sensación espacial.
Definición de espacio sonoro

Definiremos espacio sonoro como la percepción volumétrica que surge en la mente de un receptor, a
medida que va procesando sincrónicamente todas las formas sonoras relacionadas con el espacio. Estas
formas sonoras llegan regularmente al oyente como parte de la información acústica que recibe su
sistema auditivo.
La definición sitúa el concepto de espacio sonoro en la mente del receptor.

Los estímulos que configuran la percepción espacial son formas sonoras generadas por la reflexión acústica en
un volumen de aire situado entre obstáculos.
La percepción de espacio sonoro aparece en la mente del oyente en el momento en que este reconoce alguna
de las formas acústicas vinculadas a la influencia del espacio: diferencias o variaciones coherentes de
intensidad, reverberación, direccionalidad etc.
En el momento en el que el sonido que llega de los altavoces (de la tele, radio o el cine) se convierte en
ente acústico.
El concepto de espacio sonoro es diferente al de paisaje sonoro.
El concepto de paisaje sonoro propuesto por Moles comprende cualquier tipo de conjunto sonoro que perciba
el oyente, suponga este una recomposición espacial o no.
Desde el punto de vista de la narratividad audiovisual esta diferenciación es importante.

En las composiciones sonoras audiovisuales que distribuyen los medios de comunicación de masas, a menudo
recibimos composiciones sonoras en las que no se hace ningún tipo de tratamiento espacial en el sentido de
recomposición volumétrica del entorno.
Todos los programas informativos radiofónicos o televisivos se configuran, efectivamente, paisajes sonoros,
pero su composición desde el punto de vista espacial es totalmente plana.
En el paisaje sonoro no existe voluntad de construcción de espacio: todas las voces y las músicas que
configuran la información están tratadas técnicamente de manera que generan casi exactamente el mismo
nivel de intensidad.
Así, el concepto molesiano de paisaje sonoro es mucho más amplio y menos preciso que el de espacio
sonoro. Mientras un paisaje sonoro es cualquier mezcla de sonidos que llega al oído, el espacio sonoro es una
sensación volumétrica que sólo puede producir en el oyente un tipo muy determinado de paisajes sonoros.
7.3.3 El espacio sonoro en el contexto audiovisual
La percepción del espacio sonoro se rige por unas leyes perfectamente diferenciadas de las del espacio visual.
En el contexto audiovisual, la posibilidad de dominar los mecanismos que rigen la percepción del espacio
sonoro es una aportación esencial que nos permite construir y dominar artificialmente.
La posibilidad de acusmatizar, sumada a las posibilidades de manipulación técnica de la intensidad, de la

reverberación y de la direccionalidad, nos permiten controlar con mucha eficacia la reconstrucción de
cualquier tipo de efectos acústicos espaciales.
Partiendo de un conocimiento detallado del tipo de alteraciones acústicas que producen en el sonido
determinados obstáculos y volúmenes, es posible reconstruir artificialmente la sensación espacial.
Es decir, manipular un sonido concreto para que transmita acústicamente al oyente la sensación de que
su fuente sonora está ubicada en un túnel, un pozo, frente a una pared, en un espacio abierto, en una
habitación pequeña… o que comunique distancias, perspectivas y movimientos a voluntad del
narrador.
7.3.4 Acústica de la sensación de distancia

La Dimension Sonora Del Lenguaje Audiovisual (Resumen) PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

La Dimension Sonora Del Lenguaje Audiovisual (Resumen) PDF

Cargado por

Copyright:

Formatos disponibles

LA DIMENSIÓN SONORA DEL LENGUAJE AUDIOVISUAL

El sonido es una parte integral e inseparable de la globalidad del lenguaje audiovisual.

Lenguaje audiovisual/ dimensión auditiva/ universo sonoro

Tradicionalmente, en el entorno de la comunicación de masas, el sonido ha sido relegado a un segundo plano

Importante intentar la inversión de esta tendencia.

Por ejemplo, el papel fundamental del sonido en la comunicación emocional.

1.1 La subjetividad como problema metodológico en las corrientes clásicas de investigación

Con el método introspectivo, el investigador se toma a sí mismo como receptor-tipo, y si el investigador

1.2. La alternativa de las metodologías cualitativas

1.4. ¿Existe un lenguaje audiovisual distinto para cada medio?

El lenguaje audiovisual es el conjunto de los modos de organización artificial de la imagen y el sonido

1.5 El lenguaje audiovisual como objeto de estudio

1.5.1. Definición y características esenciales

Características específicas del lenguaje audiovisual como objeto de estudio:

- Para estudiarlo, uno de los instrumentos científicos es la psicología de la percepción.

La psicología de la percepción se preocupa de: (2 definiciones complementarias)

- El lenguaje audiovisual es un conjunto sistematizado y gramaticalizado de recursos expresivos,

- El fundamento de este lenguaje es el conocimiento de un sistema de recursos narrativos artificiales

3. Su capacidad de articular dentro de él cualquier otro lenguaje basado en la percepción humana

1.5.2 Sobre la dimensión naturalista del lenguaje audiovisual

El lenguaje audiovisual se construye sobre dos paradojas especialmente interesantes.

Cuanto más abstracto es un lenguaje mayor es su dificultad de comprensión.

1.5.3 Sobre la naturaleza incompleta del lenguaje audiovisual

Toda narración audiovisual se apoya siempre en un equilibrio constante entre:

1.6 De la física a la percepción de los mensajes audiovisuales

2.1.1 Desarrollo de un nuevo concepto

La acusmatización aísla los objetos sonoros y los convierte en portadores de conceptos.

2.1.2 La acusmatización en la comunicación de masas

Algunas de las opciones narrativas que ha dado la posibilidad de acusmatizar el sonido:

2.2 Los conocimientos necesarios para dominar el audio

2.2.1 La tecnología y la experiencia productiva

El nivel de ruido habitual en un contexto de audición “silencioso” es de unos 30-40 dB

La psicoacústica, la integración sistemática de la acústica y la psicología de la percepción, es una disciplina

2.2.4 El sentido de aplicar la acústica al lenguaje audiovisual

En el reconocimiento sonoro del espacio.

Tiene doble dimensión:

En la construcción de atmósferas emocionales.

En la edición y el control informatizado del sonido.

Existen sistemas que permiten la edición informatizada del sonido.

2. 3 Del fenómeno acústico al sentido audiovisual

Cuatro conceptos básicos: -sonido

El sonido es ya en su esencia misma un puente entre la acústica y la percepción.

El origen de un sonido es siempre la vibración de un objeto físico dentro de la gama de frecuencias y

Definimos el sonido como:

El resultado de percibir auditivamente variaciones oscilantes de algún cuerpo físico, normalmente a

La diferencia se debe a la influencia del medio que transmite la vibración.

2.3.2 Fuente sonora

Tenemos que distinguir entre sonido y fuente sonora

Definiremos fuente sonora como:

2.3.3 Objeto Sonoro

Definimos objeto sonoro como:

Definición inspirada en el concepto metodológico de objeto de estudio.

2.3.3 Ente acústico

Definimos ente acústico como:

Como signo audiovisual es de carácter naturalista.

3.1 Entre el fenómeno vibratorio y el perceptivo

3.1.1 Sonidos puros y sonidos compuestos

Sonidos puros: en referencia a sonidos constituidos por una sola frecuencia

Sensación auditiva extremadamente pobre y simple, poco agradable.

Ej: vibración de un diapasón, pitidos electrónicos,

Sonidos compuestos: aquellos formados por dos o más frecuencias

Este es el estado más natural del sonido

Imaginemos 2 cuerpos físicos ideales, formado cada uno por 2 moléculas.