Metahodos PDF

1
1
2
INTRODUCCION DEL EDITOR
Meta+Hodos fue originalmente escrito por James Tenney como su tesis en la Universidad de
Ilinois, en Champaign-Urbana, en 1961. Fue publicado en una muy limitada edición por
Gilbert Chase algunos años después, pero ha sido casi imposible de conseguir desde su
creación. Aún así ha tenido un amplio y poderoso impacto en la teoría de la música y
composición durante los últimos 25 años, en un grado altamente desproporcionado en relación
con la posibilidad de obtenerlo.
META META+HODOS, escrito en 1975, fue originalmente publicado en el “Journal of
Experimental Aesthetics” (Volumen 1, Numero 1, 1977). Esta presente edición de Frog Piak
Music de Meta+Hodos y META Meta+Hodos es un intento de hacer que estos seminales
documentos teóricos estén disponibles para una más amplia comunidad de artistas.
Esta segunda edición incluye correcciones y revisiones por el autor.
Larry Polansky
Oakland, 1988
Traducción: Wim Forstman
2
3
James Tenney
Meta+Hodos
“Una buena descripción de un fenómeno puede por si misma

determinar un número de teorías e indicar rasgos definidos
que una teoría autentica debe poseer. Llamamos 'fenomenología'
a este tipo de observación, una palabra que significa...
una descripción tan completa e ingenua como sea posible.”
Kurt Koffka, Principios de la Psicología de la Gestalt, p.73.
“Uno debe estar convencido de la infalibilidad de la propia fantasía,

y debe creer en su propia inspiración.
De todos modos, el deseo de un control consiente de los nuevos
medios y formas surgirá en la mente de cada artista,
y el querrá conocer conscientemente las leyes y reglas que gobiernan
las formas que ha concebido 'como en un sueño'.
Aunque este sueños puedan haber sido fuertemente convincentes,
la convicción de que esos nuevos sonidos obedecen a las leyes de la naturaleza
y a nuestra manera de pensar...
fuerzan al compositor por el camino de la exploración.”
Arnold Schoenberg, Estilo e Idea, p.218.
“El primer paso en la dirección de la belleza es entender

el marco y el alcance de la imaginación,
para comprender el acto mismo de la aprehensión estética.”
James Joyce, Retrato del Artista Adolescente, p.208.
3
4
Sección I
Los Nuevos Materiales Musicales
La aumentada complejidad auditiva de buena parte del siglo XX es una característica

tan evidente que no se debiera necesitar ninguna demostración. De todos modos, un
examen de los muchos factores que producen esta complejidad, y de algunos de sus
efectos sobre nuestra percepción de la música, serán necesarios antes de que podamos
esperar describir los materiales musicales en un modo realmente significativo. La
complejidad no es tan solo de estructura, si no también de substancia. Es decir, no es
simplemente el resultado de una nueva disposición de los materiales o elementos
tradicionales (empleare la palabra elemento en el sentido de “parte” o “porción” antes
que en el de “aspecto” o “factor”). Los elementos mismos han cambiado y los
cambios afectan no solo la estructura musical, si no también nuestro modo de
escuchar la música.Y los problemas que resultan de estos hechos parecen extenderse
mas allá de la mera cuestión de la cantidad de tiempo requerido por el oído y por la
mente para asimilar las novedades de un nuevo estilo hasta que ellas ya no posean lo
que Schoenberg describió en una ocasión como “un efecto de interrupción de los
sentidos”. El tiempo nos ha dado algún grado de familiaridad incluso con
realizaciones musicales más avanzadas de los primeros años del siglo XX, y todavía
nuestros acercamientos descriptivos y analíticos a esta música están marcados por el
uso de términos negativos- “atonales”, “atemáticos”, etc.- Que nos dicen que cosa no
es esta música en lugar de decirnos que es. La estrechez de los conceptos de la
música tradicional se evidencia en este negativismo, y por el hecho de que muchas
obras significativas de este periodo temprano son relegadas con demasiada frecuencia
al campo de las “excepciones”, “desviaciones” o “experimentos interesantes”. Y la
disparidad entre los conceptos tradicionales y el “objeto” musical actual se torna aún
más grande en la música electrónica (no instrumental) y la música para cinta
magnética más recientes. Pero incluso aquí, el problema no consiste realmente en una
falta de familiaridad, si no de un hiato casi completo entre la teoría y la práctica
musical. Así, incluso cuando las novedades de los varios estilos y técnicas del siglo
XX han devenido profundamente familiares, ciertas “complejidades” aún permanecen
fuera de nuestro marco conceptual presente, y es claro que éste necesita expandirse.
He dicho que los materiales de la música han cambiado, y esto ha de verse en

incontables ejemplos en que las ideas musicales primarias son configuraciones de
sonido altamente complejas cuyos elementos básicos son estructuras más o menos
complejas antes que notas individuales.
Estas elementales “estructuras sonoras” ocurren en una gran variedad de formas, con
respecto a su estructura vertical y a sus cambios en el tiempo.
Las examinaré primero desde el punto de vista de su estructura vertical, con
particular atención a elementos en los cuales las estructura vertical es una
característica mas notoria que cualquier forma temporal que ellos pudieran tener.
4
5
5
6
Los ejemplos más claros de tan complejos elementos sonoros son racimos de notas
(Clusters) y otros acordes altamente densos y disonantes como en estos tres primeros
ejemplos- estructuras sonoras que parecen relativamente “opacas” para el oído Tales
acordes usualmente no pueden ser analizados por el oído en sus notas constitutivas, y
pienso que no están pensados para que se las analice de esta manera. Están raramente
sujetos a orientaciones armónicas porque la percepción que uno tiene de las alturas en
esos densos complejos sonoros se limita, en el mejor de los casos, a la altura de sus
notas más altas o más bajas, o a un nivel de alturas medio, cuando no se puede
reconocer más que el rango y registro aproximado de los acordes.
Su semejanza con los sonidos de percusión es muy cercana, y es significativo que el
uso de tales complejos elementos sonoros coincida históricamente con un uso
creciente de los instrumentos de percusión de la orquesta, así como también que ellos
se encuentren frecuentemente en música de un carácter intencionalmente “rítmico” o
motor, tal como ocurre con la Sonata de Bartok, de la cual se ha tomado el ejemplo 3.
Tales acordes representan de hecho, una especie de puente entre estructuras
armónicas más tradicionales, sonidos puramente percusivos y ruidos, y sería difícil
encontrar alguna clara linea de diferenciación entre dos cualesquiera de esos tres
tipos de elementos sonoros. Se distinguen entre ellos solo en las respectivas
dificultades que presentan a la capacidad del oído para analizar las alturas, y así en su
relativa especificidad de definición de las alturas, y en la posibilidad de orientación
armónica que depende de esa definición de alturas. La batería de percusión en sí
misma incluye tanto instrumentos de tonalidad definida como de tonalidad
indefinida, y los sonidos producidos por estos últimos no son más que “racimos de
notas” (clusters) de un más alto grado de complejidad.
Hay así un “espectro” continuo de elementos sonoros compuestos variando desde
acordes simples cuyas notas constituyentes pueden ser analizadas por el oído,
pasando por sonidos más complejos y opacos, cuyas características de altura son más
o menos indefinidas o solo parcialmente perceptibles hasta sonidos sin ninguna altura
definida que caracterizamos como ruido.
Pero a pesar de la amplitud de este espectro, pueden hallarse ejemplos del uso de
cada uno de estos tres tipos de sonidos compuestos como elementos esencialmente
irreductibles de ideas musicales- ejemplos en que tales complejos sonoros son
substancialmente equivalentes a notas individuales.
Una manifestación del uso gradual de más y más complejas unidades de sonido
reemplazando a las notas individuales ha de ser visto en la expansión del concepto
mismo de linea melódica a través de varios tipos de duplicaciones. Este concepto ha
sido ya de alguna manera complicado en la música anterior al siglo XX por las
frecuentes duplicaciones en terceras y en sextas, y a finales del siglo XIX por el uso
de acordes paralelos de séptima y novena. Esos recursos fueron creados para
enriquecer la sonoridad de una sola linea melódica, sin agregar lineas realmente
independientes a la textura, y puede decirse que los intervalos y acordes así usados
son equivalentes a notas individuales, con respecto a la mayoría de las funciones
formales. Pero alrededor de 1910 esos dispositivos ya se habían extendido
considerablemente, hasta incluir no solo otros intervalos y acordes mas disonantes, si
no también doblajes mas complejos, en los cuales los intervalos cambian en el curso
de una sola linea, o en los cuales el numero de notas en cada elemento varia entre
elementos consecutivos- y a menudo varios tipos de variación son empleados dentro
de una misma linea como se ve en el ejemplo nº 4.
6
7
Arnold Schoenberg – op 11 ( ·2)
Hubo un tiempo en que los teóricos podían referirse a ruidos como a sonidos no musicales,
y esta actitud todavía existe, en alguna medida. Pero es poco realista hacer esta distinción
ahora, a las luz de los desarrollos musicales del siglo XX. Los elementales materiales de
armado de esta música ya no se limitan más a notas “musicales” si no que pueden incluir
otros sonidos, más complejos, que en una música más temprana rara vez hubieran
funcionado como elementos, si es que tenían en absoluto lugar.
La substancia y el material de esta música es el sonido- la definición es inevitable- y es de
importancia secundaria si este material es una nota con una altura claramente definida, o si
tiene la forma de sonido altamente complejo y de tonalidad indefinida de un címbalo.
Cualquier sonido puede ocurrir en algún punto de una pieza musical, con una función que
es virtualmente independiente de la constitución o estructura del sonido mismo, siendo
determinada esta función en cambio por el contexto musical más amplio en que ocurre. Una
vez que se reconoce esto, se torna evidente que el primer requisito de un marco de trabajo
conceptual expandido para la música de nuestro tiempo será un principio de equivalencia,
por el cual se reconoce la idéntica potencialidad de cualquier sonido que esta siendo usado
como un elemento básico en una idea musical.
Las plenas implicancias de este principio se tornaran mas claras en el transcurso de
este libro, pero puede notarse aquí que hay un cercano paralelismo entre esta idea, y
la idea de equivalencia en los argumentos de Schoenberg acerca de la consonancia y
la disonancia, y un examen de este paralelismo puede ayudar a elucidar el concepto
que se presenta aquí. En Estilo e Idea [1] dice Schoenberg:
“Lo que distingue a las disonancias de las consonancias no es un

grado mayor o menor de belleza, si no un grado mayor o menor de
comprensibilidad. En mi Tratado de Armonía presenté la teoría de
que los armónicos disonantes aparecen más tarde entre los
armónicos, razón por las cual el oído se encuentra menos
íntimamente familiarizado con ellos. Este fenómeno no justifica
términos tan agudamente contradictorios como concordancia y
discordancia. Una más intima familiaridad con las consonancias
más remotas- es decir, las disonancias- eliminó gradualmente la
dificultad de comprensión y finalmente admitió no solo
emancipación de acordes dominantes y otros acordes de séptima,
séptima disminuida y triadas aumentadas, si no que también
permitió la emancipación de las disonancias más remotas de
Wagner, Strauss, Moussorgsky, Debussy, Mahler, Puccini y Reger.
El termino “emancipación de la disonancia” se refiere a su
comprensibilidad, que es considerada como equivalente a la
comprensibilidad de la consonancia. Un estilo basado en esta
premisa trata a las disonancias como consonancias, y renuncia a
un centro tonal.”
7
8
Ahora, existe una aparente inconsistencia en este argumento --esto es, si entendemos
la palabra “equivalente” (en el segundo párrafo) de un modo innecesariamente
restringido- porque él no ha establecido una equivalencia real de la comprensibilidad
como tal, sino simplemente una relatividad de consonancia y disonancia, y la falta de
un corte claro entre ellas, que las distinga u oponga. Sugiero que él se refiere a un tipo
distinto de equivalencia, uno que es análogo al principio de equivalencia que estoy
proponiendo aquí. Es una equivalencia funcional la que Schoenberg esta
describiendo, la cual postula la idéntica potencialidad de consonancias y disonancias
que se emplean como material en la textura musical -- a pesar de sus diferencias con
respecto a la “comprensibilidad”. En otras palabras, la relativa consonancia o
disonancia de un sonido ya no se considera como una característica funcionalmente
relevante de aquel sonido, y dos sonidos que difieren solo en sus grados relativos de
consonancia (o disonancia) son, en consecuencia, funcionalmente equivalentes, o lo
son potencialmente.
Esta interpretación es consistente con nuestra comprensión del significado de la
disonancia en la practica armónica tradicional, y con el hecho de que la música de
Schoenberg y la de otros compositores de los cuales nos ocuparemos aquí representa
una suspensión mas o menos completa de los procedimientos armónicos
tradicionales. La distinción funcional entre consonancia y disonancia fue uno de los
caracteres esenciales del sistema tonal de los siglos XVIII y XIX, y un resultado
natural de la suspensión de ese sistema seria el desmoronamiento de esta distinción
funcional.
El paralelismo entre esta equivalencia de consonancias y disonancias (según mi
interpretación de la afirmación Schoenberg) y mi propio principio de equivalencia
encierra más que la idea de equivalencia que es común a ambas. Hay una semejanza
suplementaria en que las “consonancias” de Schoenberg son análogas a los acordes
más simples, auditivamente analizables (“comprensibles”) mencionados
anteriormente, y sus “disonancias” corresponden a los elementos sonoros más
complejos, a los ruidos de altura indefinida. Una de mis primeras descripciones de
estos tipos de sonido remitía a “racimos de notas y otros acordes altamente densos y
disonantes”, y realmente hay una relación obvia- acústica y psicológicamente- entre
disonancia, complejidad y ruido.
El tipo de equivalencia que estoy sugiriendo, sin embargo, no es quizás “funcional”
en el mismo sentido en que lo es la equivalencia de consonancias y disonancias
descripta por Schoenberg. Podría denominarse antes bien equivalencia “substancial”
o “material”.
Las técnicas de ejecución a sido condicionadas también por este hecho, como por
ejemplo la técnica de superponer notas sucesivas en una linea, en orden a simular un
legato que sólo es en verdad posible en instrumentos que pueden sostener una nota en
un nivel dinámico determinado.
En algunos casos, sin embargo, el contexto musical favorece la toma de consciencia
sobre la envolvente o acerca de variaciones en la silueta dinámica de los sonidos,
explotando las variadas posibilidades del “toque” del piano, por ejemplo, o de
diferentes tipos de articulación en otros instrumentos. Tales variedades de “toque” o
articulación no son- físicamente- más que formas de variar la envolvente temporal del
sonido. Pero si son de alguna manera percibidos, es usualmente como diferencias en
la cualidad del sonido, antes que como variaciones dinámicas per se. La envolvente
temporal puede tornarse totalmente perceptible (ya sea que se la aprehenda como
variaciones de intensidad o como cualidad tímbrica) cuando el rango perceptual de la
música se reduce en tal forma como para favorecer la percepción de detalles más
pequeños, tal como ocurre con buena parte de la música de Webern, y en ciertas
piezas de John Cage (particularmente para piano preparado). Pero hay casos en que
incluso ésta reducción en el rango es innecesaria.
En el ejemplo de la pieza de Ruggles (ejemplo 5) el oyente es dirigido evidentemente
a escuchar no sólo el desvanecimiento del sonido después de que ha sido tocado el
último acorde, si no también una especie de juego de interferencia entre varias notas
en el acorde, por el cual éstas parecen henchirse y desvanecerse y henchirse otra vez,
8
9
cada una con un ritmo diferente, de tal forma que en un momento es una la más fuerte
y luego otra, resultando pues un efecto de movimiento melodico interno. El sonido
es bastante similar al de una campana, cuyos parciales superiores inarmónicos se
golpean mutuamente en una forma similar, así que lo que uno escucha son cambios
en la estructura de alturas del sonido en el tiempo, así como también cambios en el
nivel dinámico.
Mientras las variaciones en amplitud mencionadas previamente estaban en la línea

divisoria entre los campos de lo perceptible y lo imperceptible, las variaciones en el
tiempo en el ejemplo de Ruggles son claramente perceptibles. Y podemos movernos
paulatinamente y por grados a situaciones en las que no puede haber duda a cerca de
que las variaciones de un sonido en el tiempo no son ya más “subliminales”, si no en
las que el sonido puede aún sólo tener el carácter y función de un elemento básico en
la configuración más amplia o idea de sonido. Trinos, trémolos, y notas rápidamente
repetidas caen en esta categoría, como lo hacen ciertos tipos de arpegiaciones, figuras
repetidas, pasajes escalísticos muy rápidos, y otros casos semejantes. (Ver ejemplos 6
a 8). Ellos tendrán “el carácter y la función” de elementos básicos cuando- a causa
del contexto musical- son efectivamente absorbidos dentro de configuraciones más
amplias, o cuando su función dentro de la configuración es ser similar a aquellas de
las contrapartes mas estáticas (por ejemplo trinos y notas repetidas como notas largas,
trémolos y arpegios como acordes sostenidos, etc.). Ahora, debe decirse que esos
sonidos que varían de esta manera en el tiempo no son idénticos a sus “contrapartes
estáticas”, puesto que hay siempre alguna razón (habitualmente rítmica) de porqué
una forma del sonido se usa en lugar de otra en un pasaje en particular; ellas no son
intercambiables. Pero sugiero que puede considerárselas como “equivalentes
materialmente”, en el sentido definido previamente, como teniendo idéntica
potencialidad para servir como elementos básicos en las configuraciones de sonido
más grandes que constituyen las ideas musicales de una pieza.
Si desplazamos nuestra atención de los elementos básicos a las configuraciones más
amplias- las que corresponderían aproximadamente en extensión a los motivos y
frases de la música más temprana- se torna evidente que la naturaleza de tales ideas
sonoras será afectada por la variedad y la complejidad de los materiales de las que
están compuestas, así como también por la variedad y la complejidad de disposición
u
organización de esos materiales. Antes de examinar tales ideas de sonido, parece
justificado reseñar algunos de los muchos factores que contribuyen a esta “variedad y
complejidad” en una forma más general.
9
10
10
11
Hay dos factores que son particularmente importantes a este respecto: (1) La
extensión de
la gama o del espectro de posibilidades dentro de prácticamente cada uno de los
varios parámetros (por ejemplo, altura, intensidad, timbre, densidad temporal, etc.
[2]), y (2) Un ritmo mas rápido de cambio en los valores paramétricos.
[3] Estos dos factores se relacionan en la medida en que un ritmo más rápido de
cambio generalmente significará la cobertura de un espectro mayor dentro de un
lapso determinado. Con respecto a ciertos parámetros, ha habido una extensión del
espectro y un aumento en el ritmo de cambio, mientras que en otros solo este ultimo a
tomado lugar de forma significativa. El rango dinámico, por ejemplo, difícilmente
pueda decirse que se haya extendido en algún sentido absoluto- al menos no desde
Beethoven, cuyos niveles dinámicos más altos y más bajos son comparables a los de
la música del siglo XX.
Pero seguramente jamás ha habido un ritmo de cambio del nivel dinámico tan alto
como el que encontramos en la música de nuestra época. La situación es similar para
la dimensión temporal también. Los contrastes de densidad temporal se han
convertido en un rasgo prominente de la música, y nuevamente es el creciente ritmo
de cambio en la densidad temporal lo que resulta más evidente antes que el rango
absoluto de diferencias entre los extremos más lento y más rápido.
La frase/estructura asimétrica que es tan característica de la música del Siglo XX
puede ser observada bajo esta luz, como también el desarrollo rítmico más cercano a
la prosa que ella engendra. Estos son, parcialmente, los resultados de la
frecuentemente observada tendencia a evitar exactas repeticiones, y de un deseo de
reemplazar la medida simplicidad del verso de los ritmos de danza, por los ritmos
más libres del discurso – y así representar, en alguna medida, los desarrollos de ritmo
por el ritmo mismo-. Pero estas asimetrías están también provocadas por los
crecientes cambios en otros aspectos de la música.
Es decir, ellas son originadas en la gran variedad, en forma y substancia, de las
sucesivas
configuraciones y elementos sonoros en la música. Hay frecuentemente un cambio
continuo en la densidad vertical, por ejemplo (a una textura de dos partes le puede
suceder una de seis u ocho partes; un estrecho orden en lo vertical puede súbitamente
ser reemplazado por una amplia distribución de las notas, etc.),y esta variedad parece
requerir una variedad equivalente en la extensión. Ello torna finalmente difícil, e
incluso carente de sentido, hablar de una “estructura de frase”, y se necesitarán
nuevos términos para esas configuraciones de sonido que tomen en cuenta esta
variedad en extensión, así como en forma y “substancia” o material.
Como la intensidad y la densidad, la altura y el timbre han sufrido también un
desarrollo en la dirección del incrementado ritmo de cambio en los valores
paramétricos. Un característico rasgo de la escritura melódica de muchos
compositores del Siglo XX -el uso de amplios saltos o de intervalos más largos a
expensas de los intervalos diatonicos menores- puede ser interpretado de este modo.
Esto, y la tendencia generalizada a emplear el rango total de un instrumento o de una
voz, significa recorrer más el ámbito de las alturas en un lapso más breve, y así se
produce un incremento del ritmo de cambio en el parámetro altura.
Pero además de esto, los espectros absolutos de altura y timbre se han extendido
considerablemente.Con respecto a la altura, por ejemplo, puede señalarse que los
instrumentos que suenan en los registros extremos (más alto o más bajo) son usados
ahora menos frecuentemente para “doblar” -a una octava más alta o más baja- ciertas
partes principalmente asumidas por los instrumentos usualmente más empleados del
registro medio del campo total de las alturas. Esos instrumentos antes“auxiliares” han
adquirido una independencia mucho mayor dentro del ensamble total, y existe por
consiguiente una ampliación del “campo” efectivo de los eventos de altura como tales
(en cuanto se diferencian de las elaboraciones de sonoridad como las duplicaciones
antes mencionadas).
El uso de la extensión total de un instrumento – y más específicamente, de los
registros extremos de un instrumento- es también una de las formas en que el rango
11
12
timbrico se ha ampliado. Otras extensiones incluyen el empleo de técnicas especiales
tales como “sul ponticello” y “col legno” en las cuerdas, el frulatto en los vientos,
sordinas en los bronces, glissandos en los trombones, etc., así como también un
mayor empleo de la batería de percusión de la orquesta.
Un ritmo incrementado de cambio en el timbre se ha convertido, así mismo, en una
característica común de la música de nuestra época, y la siguiente afirmación de
Schoenberg es ilustrativa al respecto.
“Es verdad que el sonido en mi música cambia con cada giro

de la idea -emocional, estructural o cualquier otro-. Es cierto
además, que tales cambios tienen lugar en una sucesión más
rápida que lo habitual, y admito que es más difícil percibirlos
simultáneamente....Pero no es verdad que el otro tipo de
sonoridad sea ajeno a mi música.” [4]
Al decir “sonido” se refiere a lo que yo llamo timbre -una cualidad del tono
instrumental- y con el “otro tipo de sonoridad” podría aludir a un genero de textura
musical en que el timbre no cambia con cada giro de la idea. la comparación es
realizada con una música anterior y con un estilo instrumental más convencional, y se
presenta la pregunta de si los dos tipos de “sonoridad” son simplemente una
diferencia de grado o de género. Yo pienso que es una diferencia de género, y que la
distinción que él hace es plenamente justificada. Una pieza orquestal del Siglo XIX
podría mostrar una gran variedad tímbrica, e incluso quizás un rápido ritmo de
cambio en este parámetro,pero rara vez “con cada giro de la idea”- lo cual pienso que
significa dentro de una idea – sino que ocurre , en cambio, con la aparición de cada
nueva idea, en la mayoría de los casos. Hay usualmente un alto grado de
homogeneidad tímbrica dentro de los limites de una idea, y es porque el factor
formativo primario en estas configuraciones es principalmente la altura y no el
timbre. Si estos representan, entonces, dos diferentes géneros de “sonoridad”, es sin
embargo cierto que el desarrollo desde el anterior al posterior fue un proceso
escalonado, moviendose por grados, y que seria difícil sino imposible encontrar una
linea divisoria clara entre ambos estados de ese proceso. Pero hay seguramente
muchos procesos naturales que muestran una completa metamorfosis de una forma a
la otra, y en los cuales no hay una ruptura en el proceso mismo o en su evolución.
Con esta interpretación de la declaración de Schoenberg, nosotros tal vez tengamos la
clave para la solución del problema que se erige a raíz de todas estas innovaciones
que han sido descriptas aquí bajo las categorías generales de incrementos de los
rangos y el ritmo de cambio en la música. “Admito que es más dificultoso percibirlos
simultáneamente” dice Schoenberg acerca de los rápidos cambios en “sonoridad” en
su música, y puede ser dicho no solamente del timbre, sino de todos los otros
parámetros musicales en los cuales ha ocurrido esta expansión del rango de
posibilidades -y no solo acerca de la música de Schoenberg, sino acerca de los
compositores del Siglo XX en general. Un resultado de estas innovaciones es la
impresión de discontinuidad que a menudo recibe el oyente en las primeras
audiciones de una pieza, levantando un importante interrogante: como o donde
encontrará uno el hilo de continuidad que suponemos inherente a toda obra de arte
integral?
Yo pienso que la respuesta envuelve las maneras en que nuestra mente y nuestro oído
organizan los componentes sonoros en unidades mas grandes o estructuras, y que esto
va a depender tanto de la manera en que uno escucha ,como de las configuraciones
que componen la música.
El problema de las “configuraciones en si” será estudiado mas detalladamente en la
Sección II, pero algo debemos decir ahora acerca de “la manera en que uno escucha”.
Me parece a mí que el primer paso para encontrar continuidad entre la aparente
discontinuidad provocada por esta extensiones del rango es la aceptación de estas
más amplias gamas como algo normal, admitiendo que los nuevos eventos que
ocurren en los “registros” extremos de cada parámetro están dentro del “Rango de
12
13
posibilidades”, más que fuera de él. Esto no parecería ir más lejos que la asimilación
de “novedades de un nuevo estilo” mencionadas al comienzo del libro, pero es más
que eso, y es un factor que debe ser considerado en nuestro intento de arribar a una
base plena de sentido para la descripción y el análisis musical.
El segundo paso involucra la comprensión de la naturaleza relativa de la continuidad
y la discontinuidad, y de algunos de los factores que causan esa relatividad.
Esta relatividad puede ser ilustrada mejor por analogía con una situación similar en el
campo de la visión. Ocurre con frecuencia que las primeras impresiones recibidas por
uno de una pintura moderna no se corresponden con las impresiones posteriores, o
con las intenciones del pintor. Inicialmente uno podría ver una distribución
aparentemente azarosa de colores, formas o lineas, para solo luego descubrir tal vez
una figura, o los objetos de una naturaleza muerta, o elementos de un paisaje. En
algún punto en el proceso de estudiar la pintura los elementos aparentemente
aleatorios son integrados subjetivamente, haciendo perceptibles las configuraciones
que son esenciales para la aprehensión de la obra.
En términos de la discusión previa, podemos decir que ha sido encontrada una
continuidad entre lo que en principio parecía una discontinuidad; relaciones son ahora
percibidas entre elementos que habían parecido anteriormente desconectados o no
relacionados.
Ahora, cuales son los factores que conducen al descubrimiento de la continuidad-
factores cuyo efecto negativo es prevenir este descubrimiento? Uno de estos factores
ya ha sido discutido- la “predisposición mental” que puede causar que los eventos
que ocurren en los registros extremos de los parámetros provoquen la sensación de
interrupción de la continuidad. Pero hay otros dos factores que son todavía mas
importantes que este. Y estos son el factor de escala y el factor de foco. hay al menos
dos formas de este ultimo. Y voy a considerar a estos en primer lugar, para luego
recién examinar la cuestión de la escala.
Estas dos formas son: (1) Foco textural, y (2) Foco paramétrico.
El primero es el mas obvio y poco necesitamos decir acerca de él, excepto que si
nuestra atención es dirigida hacia una o más de las partes menos esenciales en una
textura compleja, los más importantes rasgos estructurales de la configuración más
grande podrían perderse.
Esto asume , por supuesto, una situación en la cual hay una jerarquía de elementos
más y menos esenciales.- lo cual podría no ser siempre así- pero la situación ocurre
con una frecuencia suficiente como para hacer a este factor digo de ser considerado.
En un análisis final, tal vez, la misma riqueza de una obra de arte -en cualquier
medio- podría deberse a las ambigüedades que permite al respecto, y a la posibilidad
de dirigir la atención hacia elementos secundarios y encontrarlos significativos.
Pero en el principio , al menos, debe haber alguna estimación acerca de cuales
puedan ser las partes más importantes.
El foco paramétrico es análogo al foco textural en muchos sentidos, pero es algo
diferente, y quizás no tan obvio como éste. En el curso de este libro se hace un
intento por demostrar la creciente importancia que se ha dado en la música del Siglo
XX a todos los parámetros del sonido; que, mientras en la música precedente la
responsabilidad de la articulación de las ideas musicales le fuera otorgada
mayormente al parámetro altura, luego los otros parámetros empezaron a hacerse
cargo de esa responsabilidad en medida creciente, hasta a veces reemplazar en esa
función al parámetro altura por completo. Se sugiere , más aún, que el grado de
articulación relativo en los varios parámetros (una manifestación del ritmo de
cambio discutido previamente) puede variar -y con esto, el foco paramétrico variará-
no solo de una pieza a otra, sino dentro de una misma pieza, o aun dentro de un
pasaje de una pieza. Si esto es así, “la manera en que uno escucha” será ciertamente
afectada. Esta clase de cambios en el foco parametrico requerirá una flexibilidad
correspondiente de parte del oyente, y será necesario reconocer la posibilidad de
estos cambios del foco paramétrico o de la articulación paramétrica, y permitirlos en
nuestro acercamiento conceptual a la música. Es parcialmente el fracaso de aceptar
esto lo que ha conducido a la actitud tan frecuente en las criticas a algunas técnicas de
13
14
la música
del Siglo XX, que las reducirían a “meros efectos de color” o “ nada más que
experimentos rítmicos”, etc. El oyente que sólo puede aceptar las alturas como único
factor formante primario en la articulación de las ideas musicales, esta condenado a
escuchar “espacios vacíos” en mucha de la música del Siglo XX, y podría
eventualmente tener que rechazar de plano algunas de las más avanzadas expresiones
del arte musical, como por ejemplo Ionización de Varese, para instrumentos de
percusión, o las piezas para piano preparado de John Cage, la música electrónica o
para cinta magnetofónica, etc.
Esto es desafortunado e innecesario, cuando todo lo que se requiere para incluir esta
música dentro de la “corriente principal” de la evolución musical es ensanchar
nuestro marco de trabajo conceptual para incluir este fenómeno de cambio del foco
paramétrico.
El otro factor en la creación de una aparente discontinuidad que he llamado escala es
aún más importante que el foco textural o el paramétrico, y nos llevará directamente
al punto esencial para esta sección del libro. No estoy usando la palabra escala en su
sentido tradicional aquí, sino en el sentido en que un dibujante o un realizador de
mapaspodría usarla, y más generalmente, como es usada en el campo visual, del cual
podemos, otra vez, tomar la mejor ilustración. Nosotros sabemos, por nuestra
experiencia visual, que un cambio en la escala de una fotografía de un objeto, o un
cambio en la distancia desde la cual miramos un objeto -sea esta una pintura, un
paisaje o la figura de una persona- puede alterar sustancialmente la impresión que
tendremos de ello.
La estructura general o carácter del objeto visto es así, en gran medida, determinado o
condicionado por la escala en que nosotros lo vemos, y esto depende no solo de las
condiciones físicas como tamaño o distancia, sino también de la predisposición
mental y la intencionalidad del espectador. Si nosotros imaginamos otra vez la
situación descripta anteriormente -una persona cuyas impresiones de una pintura
están todavía no relacionadas e inconexas- es notorio que las configuraciones que
percibe podrían ser sólo los detalles de una configuración más grande, y que su
atención a esas unidades más pequeñas podrían realmente prevenir su percepción de
las configuraciones mayores y más esenciales. el proceso también funciona en la
dirección inversa -confundiendo las configuraciones mayores con detalles- en cuyo
caso la estructura total lucirá inevitablemente incompleta. El completo alcance de
este proceso puede ser ilustrado imaginando una escena -digamos un campo de trigo-
el cual desde una cierta distancia se apreciará como algo continuo, teniendo una
textura homogénea , no interrumpida por elementos contrastantes. Si uno se acerca,
esta textura devendrá menos y menos homogénea, hasta que finalmente la distancia
se ha acortado tanto que nuestro campo visual solo puede abarcar unos pocos
elementos -las espigas de trigo- . En este punto, aquellos elementos que
anteriormente habían sido absorbidos en la unidad más grande -percibidos como una
textura, pero no discernibles por separado- devienen unidades completas por derecho
propio, y los espacios entre ellas se precian como brechas reales en la continuidad.
Similarmente, si uno vuelve a la posición original y aumenta la distancia que lo
separa del campo, uno alcanzará eventualmente un punto donde el campo completo
es solamente un elemento en una escena más grande -una estructura mayor- que
incluye casas y quizás un camino, y otros campos de diferente color o textura. Otra
vez una continuidad ha sido reemplazada por una discontinuidad.
Si nosotros transferimos esto ahora al campo de la percepción musical, debería ser
evidente como esto aplica al aparente problema de la discontinuidad en la música, y a
la relatividad de la continuidad y la discontinuidad. Si la escala en la cual el oyente
esta preparado para comprender la sucesión de configuraciones sonoras no es acorde
con la escala en que la música está realmente organizada, habrá un sentido de
discontinuidad mayor que el que en realidad está implícito en la música. Si la música
es altamente compleja, con elementos múltiples y abigarrados contenidos entre los
limites de cada idea musical, semejante oyente estará en la posición del observador
descripto anteriormente, cuya atención esta absorbida por los detalles , siendo incapaz
14
15
por lo tanto de ver las configuraciones más amplias del cuadro. O será como la
persona que esta aprendiendo un nuevo idioma, que pierde el significado de la frase
escuchada en ese idioma porque su mente se ha “detenido” a traducir la primera o
segunda palabra de la frase. Nuevamente aquí, la indebida atención a los detalles ha
prevenido la aprehensión de la configuración mayor como una estructura singular. Es
más probable que una situación de este tipo surja frente a una pieza de Schoenberg o
Ives, que usualmente requieren la percepción simultánea de muchos más elementos
que la música de la mayoría de los otros compositores.
Pero, en general, la música del Siglo XX es mucho más exigente en este sentido que
la de los siglos anteriores.
En buena parte de la música de Webern, sin embargo, encontramos la situación
inversa. Nos encontramos aquí frente a una muy diferente escala de organización
musical, que exige una diferente escala de percepción. En estas pequeñas estructuras
sonoras – que en otras músicas no serian más que elementos, no pensados para ser
oídos separadamente- se convierten con Webern en las ideas musicales esenciales,
estructuras musicales primarias que deben ser percibidas como relativamente
completas o autosuficientes en si mismas. Aquí el resultado de la disparidad entre las
escalas del compositor (es decir, de la música) y la del oyente dará una sensación de
cosa inconclusa, sino de discontinuidad.
Finalmente, y no menos importante que lo anterior, debe notarse que la escala de
organización de las sucesivas configuraciones musicales en cualquier pieza de música
podrían presentar cambios considerables entre una y otra, y esto requiere de una
mayor flexibilidad de la escala perceptiva del oyente. La diferencia entre la música
del Siglo XX y la anterior a éste, con respecto a la variabilidad de la escala, es similar
a la diferencia entre las dos clases de “sonoridad” descriptas anteriórmente. El
desarrollo ha sido paulatino, pero se convierte en algo de diferente género en la
música de este último período. En la música de los Siglos XVIII y XIX
esta clase de variaciones pueden generalmente estar relacionadas a algún estándar o
norma aproximados, y de hecho, las importantes potencialidades estructurales de esta
clase de variaciones deben su fuerza a la misma existencia de estas normas. estas
normas ya no funcionan más en la música contemporánea, sin embargo, y el rango de
variación es mayor, así que la variabilidad en si misma debe ser reconocida como
una especie de norma. Y esta última afirmación obviamente aplica no sólo a la
variabilidad de escala, sino también a las otras innovaciones discutidas hasta el
momento -cambio de foco textural y paramétrico, el ritmo mas rápido de cambio de
los valores paramétricos y la extensión de los rangos en los distintos parámetros. En
una gran medida, la impresión de discontinuidad y los “efectos de interrupción de los
sentidos” podrían ser reducidos o neutralizados por la mera aceptación de esta
variabilidad como un hecho normal. Y, así como es con la percepción, así debe ser
con el análisis y la descripción, y un marco de trabajo conceptual que permita todas
estas nuevas posibilidades es necesario. Sólo con un marco de trabajo más amplio
como éste podremos proceder a un análisis de las fuerzas estructurales especificas
que están activas en la música del Siglo XX.
El reconocimiento de la variabilidad de la escala con respecto a las configuraciones
de sonido o a las ideas musicales más amplias, lleva a una extensión final del
principio de equivalencia, para hacerlo aplicable ahora no sólo a los elementos
componentes de las configuraciones sonoras, sino también a estas mismas. Esto es,
tenemos que admitir una “equivalencia material”-con respecto a su potencialidad
funcional (como ideas musicales) de una mucho mayor variedad de sonidos y
configuraciones sonoras de los que habrían sido justificables o necesarios en la
música anterior al Siglo XX. Yo digo “sonidos y configuraciones sonoras”
deliberadamente, porque -como fue señalado sobre la escala reducida en la
organización de la música de Webern- sonidos relativamente simples, que en otra
música podrían ser sólo elementos, son a veces capaces de funcionar como ideas por
derecho propio. Recordando ahora lo que ya se dicho sobre el mayor rango de
complejidad de los elementos sonoros, debería ser evidente que hay algún grado de
superposición entre el rango de los elementos y el de las ideas sonoras, y el principio
15
16
de equivalencia debe comprenderse ahora de modo que incluya esta potencialidad
ambivalente de sonidos y configuraciones sonoras que caiga dentro de las porciones
superpuestas de sus respectivos rangos.
Cuando un sonido o configuración sonora dada han de ser considerados como un
elemento o una idea musical autosuficiente depende casi por completo del contexto
musical en que son escuchados. No hay virtualmente ninguna característica objetiva
del sonido (excepto la duración) que indique al analista en cual de esas dos categorías
debiera ubicárselo. Solo su función dentro del diseño mayor puede revelar esto- es
decir sus relaciones con otros sonidos o configuraciones sonoras-. Pero el estudio de
tales relaciones, y por lo tanto el estudio de la función, no puede comenzar sin alguna
definición de los objetos involucrados en las relaciones -las entidades que están
funcionando- los sonidos y configuraciones sonoras en si mismas.
Como resultado de esta última extensión del principio de equivalencia, la distinción
entre elemento e “idea” ha sido relegada al campo del contexto. Calificada de este
modo la diferencia, surge la incógnita en torno a que características son comunes a
los sonidos y configuraciones de sonido que han sido hasta ahora el tema de nuestro
análisis. Se vera en el curso de este libro que hay muchas cualidades especificas que
pueden estar involucradas en la respuesta a esta pregunta, pero la característica mas
general común a todas ellas -y que ha estado siempre, al menos implícitamente, en las
discusiones previas- es el hecho de que son percibidas como unidades. Casi por
definición ,los sonidos y configuraciones de sonido que hemos estado considerando
aquí, muestran aquella unidad o singularidad que -en el dominio visual- se caracteriza
por el término Estructura (Gestalt), y es evidente que debería concederse alguna
atención a los principios de la psicología perceptual de la Gestalt en nuestra búsqueda
de un marco conceptual expandido para la música del Siglo XX. En sus “Principios
de la Psicología de la Gestalt”, Kurt Koffka dice:
“Las leyes de organización que hemos encontrado

operativas, explican por qué nuestro entorno
conductual es ordenado pese a la desconcertante
complejidad de estimulación espacial y temporal.
Unidades están siendo formadas y se mantienen
separadas y en relativo aislamiento respecto de las
otras...sin nuestros principios de organización...los
extraordinarios cambios producidos por estos
cambios de estimulación serían tan desordenados
como éstos mismos...el orden es una consecuencia
de la organización, y ésta el resultado de fuerzas
naturales.”
Esta declaración tiene una obvia relevancia para los problemas musicales que hemos
estado considerando aquí, y en la próxima sección del libro trataré de demostrar la
aplicabilidad de algunas de estas “leyes de organización” a la percepción musical. En
este punto, sin embargo, quiero enfatizar que la primera condición mencionada por
Koffka para la aparición del orden, dentro de una “desconcertante complejidad de
estimulación”, es la formación perceptual de unidades, “mantenidas separadas y en
relativo aislamiento respecto de las otras.” Esto será asumido como premisa en todos
los argumento que siguen. Y una de las primeras preguntas que debemos hacer acerca
de los diversos sonidos y configuraciones sonoras que ocurren en la música es: ¿que
factores son responsables por su unidad y singularidad, y que factores logran su
aislamiento relativo respecto de otras unidades?
Para facilitar el examen de estas preguntas, voy a introducir aquí algunas definiciones
básicas -o más bien, algunos nuevos términos que pueden sernos útiles como puntos
de partida para posteriores definiciones y diferenciaciones. El continuado uso de
términos como “configuración sonora”, “idea musical” etc., me parece insatisfactorio,
el primero por ser demasiado general, el último demasiado especifico, y seria
engañoso tratar de adaptar terminología familiar para el propósito de esta
16
17
investigación. Palabras como “frase”, “tema”, “acorde” y “progresión armónica”,y
hasta “melodía” y “armonía” tendrían que ser tan re-interpretadas que dejarían de
tener mucho significado. He más bien tratado de desarrollar una terminología que sea
suficientemente especifica para hacer posibles las diferenciaciones significativas, y
sin embargo seguir siendo lo bastante general como para permitir algún grado de
expansión interna.
En lugar de “sonido”, “configuración sonora”, o “idea musical” (ya que estos

términos han sido usados hasta este momento en el libro), propongo la palabra clang
-que se entenderá como refiriéndose a cualquier sonido o configuración sonora que
sea percibida como una unidad musical primaria -una estructura auditiva singular.
Para las partes subordinadas de un clang,continuare usando la palabra elemento -sean
estos articulados en la dimensión vertical como partes “lineales” o simultáneas, o en
la dimensión temporal como partes sucesivas -es decir notas, acordes, o sonidos de
cualquier tipo. Finalmente, algún termino es necesario para designar una sucesión de
clangs que de alguna manera se separa de otras sucesiones, de forma que presenta
algún grado de unidad y singularidad, constituyendo así una estructura musical en un
nivel perceptual o escala temporal mas grande -aunque no será una estructura tan
“fuerte” (un termino usado por Köhler [6]) como lo es el clang. Para esta unidad más
grande usaré la palabra secuencia y más distinciones respecto de su tipo y función se
harán luego de un estudio de sus características más generales, en las Secciones II y
III de este libro.
He adoptado el término clang por varias razones, y alguna explicación de esas
razones puede ayudar a clarificarle al lector mi interpretación del término. Primero,
su único significado actual en ingles (“un fuerte ta!ido, como de objetos metálicos
golpeados entre si”- Webster) sugiere una especie de sonido o sonoridad -complejo y
disonante- que se escuchará con frecuencia en la música del Siglo XX y cuya
consideración me condujo originalmente a la reexaminación de los materiales
musicales y los factores formales como se los resume en este libro. Segundo, aunque
el término ha tenido algún uso en escritos en ingles (británico, no americano) sobre
acústica, no parece haber sido usado mucho o por un periodo muy largo con un
sentido único. En estos escritos sobre acústica es usado a veces para significar un
tono complejo ( es decir uno compuesto de varios parciales armónicos), para en otras
ocasiones referirse al sonido de un intervalo o un acorde. Mi definición de la palabra
puede ser considerada una extensión de estos significados para incluir cualquier
sonido o configuración sonora.
Tercero su derivación de o asociación con la palabra alemana Klang -que significa
tanto “sonido” como “nota”- acarrea consigo alguna implicación de la equivalencia
descripta con anterioridad.
Y por último, clang es una palabra que se refiere específicamente a la percepción
auditiva, y no -como muchas otras que usamos o estamos tentados de usar (como
“configuración”,”patrón”,”objeto”,”idea”,etc.) tomados prestados del visual u
otros campos perceptivos.
La diferenciación entre clang y secuencia se comprende primariamente como una
distinción funcional general, y no siempre será de limites muy precisos o carente de
ambigüedad en los ejemplos musicales concretos. Pero en general, el clang es un
sonido o configuración de sonido que es inmediatamente perceptible como una
estructura auditiva, mientras que la secuencia -siendo aprehendida en un modo menos
inmediato que el clang- seria lo que Köhler llamaba una “estructura débil”.
Similarmente la diferencia entre un elemento y un clang más completo o
autosuficiente, será siempre algo relativo – siendo el elemento, en algún sentido, un
clang “más pequeño” que es absorbido en un clang más amplio, perdiendo de esa
manera buena parte de su individualidad como estructura musical.
Debería ser evidente, entonces, que aunque el clang pueda ser equivalente en
duración o carácter a los motivos o frases de la música tradicional, la palabra no esta
destinada a definir un tipo estructural o formal a este nivel perceptivo, como lo hacen
17
18
las palabras “motivo” o “frase”, sino más bien una clase de evento musical y
situación perceptual que puede involucrar muchos otros tipos de estructura sonora
además de aquellas. Lo único que es común a todos ellos es su inmediatez perceptual,
y su singularidad -es decir su carácter de estructura auditiva o musical. El principio
de equivalencia podría ser comprendido como significando que cualquier sonido o
configuración sonora -no importa cuán simple o complejo pueda ser desde un punto
de vista acústico- puede funcionar en el contexto musical mas amplio como un clang,
solo con ser percibido en ese contexto como una estructura musical primaria.
Existen algunas importantes semejanzas entre este concepto del clang o estructura
auditiva con el “objeto sonoro” de Pierre Schaeffer (o más específicamente la clase
de objeto sonoro que él llama “célula”) -y debo reconocer aquí mi deuda con los
escritos de Schaeffer, [7] en el desarrollo inicial de las ideas presentadas en este libro.
El objeto sonoro es definido como prácticamente cualquier sonido o serie de sonidos
grabados en disco o cinta (dentro ciertos obvios limites de duración, por supuesto), de
manera que el proceso de composición automáticamente involucra la “equivalencia
potencial” de varios elementos, como fue descripto aquí, así como también ciertas
implicancias de carácter gestaltico con respecto a los sonidos.
Pero hay también algunas importantes diferencias entre las ideas de Schaeffer y las
mías, y estas deben señalarse aquí junto a las semejanzas. Las definiciones de
Schaeffer son generalmente “operacionales”, a tal punto que tienden a restringir su
aplicabilidad al medio particular con que él esta trabajando -”música concreta”, la
organización composicional de sonidos grabados en cinta. Las técnicas de
“transmutación y transformación” que él emplea involucran claramente la posibilidad
de que el mismo “objeto sonoro” pueda funcionar en un lugar de una composición
como un clang, en otro como un elemento, o hasta como una secuencia, y puede ser
separado en partes o re-arreglado en maneras en que se vean alteradas completamente
sus originales características gestálticas. De esta manera las definiciones de
Schaeffer se refieren menos a los eventos perceptuales en la música (o mas allá, en la
experiencia musical) como a los materiales físicos o acústicos que son manipulados
en el proceso de la composición. Y es por esta razón, tal vez, que el ha enfatizado las
diferencias entre la música “abstracta” del pasado – incluyendo aún la mayor parte de
la música del Siglo XX- y su propia “música concreta”. Yo pienso que la diferencia
esencial entre ellas no es una diferencia musical, sin embargo si no una diferencia
técnica, y -desde un punto de vista puramente musical- difícilmente justifica esta
clase de diferencia en el nombre, como entre “abstracta” y “concreta”.
Desde un punto de vista mas amplio, siempre me pareció que las mayores
innovaciones en la música del Siglo XX han tendido desde el mismo principio a
involucrar algo como el “objeto sonoro” -si esto es interpretado como un “objeto” de
percepción, más que un objeto de manipulación técnica. El concepto de clang, en
consecuencia, podria considerarse una ramificacion del “objeto sonoro” de Schaeffer
--pero dirigido hacia el evento perceptual mismo, antes que a la fuente acústica de
aquel evento. Asi, el concepto de clang debe ser aplicable a la musica en cualquier
medio, ya sea instrumental o electrónica, ya sea que emplee sonidos naturales o
sintéticos, ya sea que sus implicancias psicológícas sean “abstractas” o “concretas”.
Comenzando entonces con las definiciones elemento, clang y secuencia, y

particularmente la definición del clang como un sonido o configuración sonora que
es percibido como una unidad musical primaria o estructura auditiva, yo trataré en la
próxima sección del libro de contestar las siguiente preguntas: (1) ¿Que factores son
responsables por la unidad o singularidad del clang? -y el forzoso corolario de esta
pregunta- (2) ¿A través de que factores un clang es segregado de otro a lo largo de la
secuencia?
18
19
Sección II
“El espacio de dos o mas dimensiones en el cual las ideas musicales se presentan es una
unidad... Todo lo que ocurre en cualquier punto de este espacio musical tiene un efecto que
va más allá de su propia ubicación. Funciona no sólo en su propio plano, si no también en
todas las otras direcciones y planos, y no carece de influencia aún en los más remotos
puntos.. los elementos de una idea musical están incorporados parcialmente en el plano
horizontal como sonidos sucesivos, y parcialmente en el plano vertical como sonidos
simultáneo. cada configuración musical... tiene que ser comprendida primariamente como
unarelacion mutua de sonidos, de vibraciones oscilatorias, apareciendo en diferentes lugares
y tiempos”.
Arnold Schoenberg, Estilo e Idea, pp. 220-223
“La primera fase de la aprehensión es una linea limítrofe trazada en torno al objeto a ser
aprehendido. Una imagen estética se nos presenta en el espacio o en el tiempo...Pero,
temporal o espacial, la imagen estética es primero aprehendida luminosamente como
autolimitada y autocontenida sobre el fondo inconmensurable del espacio o del tiempo que no
es ella misma. Tu la aprehendes como una cosa. La ves como un todo. Tu aprehendes su
totalidad”.
James Joyce, Retrato del artista adolescente, p 212
“La forma, entonces, de cualquier porción de materia...Y los cambios de forma que se
manifiestan en sus movimientos y en su crecimiento, pueden ser descriptos, en todos los casos
por igual, como resultado de la acción de la fuerza. En breve, la forma de un objeto es un
'diagrama de fuerzas' y es en este sentido, al menos, que a partir de él podemos deducir o
juzgar las fuerzas que están
activas o han actuado sobre ella”.
D'Arcy Wenthworth Thompson, Desarrollo y Forma, p.16
Factores de Cohesión y Segregación de la Estructura (Gestalt)

En 1923 Max Wertheimer publicó un artículo titulado “Leyes de organización en la
percepción de la forma”, [8] en el cual él demostró ciertos factores de formación y
segregación de unidades operando dentro de los sistemas de lineas y puntos en el
campo visual. Este artículo, desde entonces, se ha convertido en una de las piedras
angulares de la Psicología de la Gestalt. El procedimiento de Wertheimer era simple,
pero no menos elegante en el modo en que cada uno de los factores cohesivos era
aislado de los otros, y mostrado como capaz de funcionar independientemente. En el
curso de la demostración, frecuentes analogías son sugeridas con configuraciones
auditivas, pero no hizo ningún intento de analizar este campo de la percepción en
forma exhaustiva. Y en general los estudios realizados por los psicólogos gestálticos
se han dirigido prioritariamente a los problemas visuales, probablemente debido al
carácter directo y la inmediatez conque pueden ser presentadas, descriptas y
percibidas las formas visuales. De todos modos , puede demostrarse que muchos de
los principios de organización de las formas visuales están relacionados con la
percepción auditiva, a menudo sin que haga falta más que una simple traducción de
términos. En otros casos, los problemas no son tan simples, pero lo escritos de los
psicólogos de la Gestalt, [9] en particular de Wertheimer, Koffka y Köhler, pueden
servirnos como una guía y un precedente.
19
20
El primer factor demostrado por Wertheimer fue denominado factor de proximidad, y
podría formularse así: en un grupo de elementos visuales similares, aquellos que se
encuentran próximos entre si en el espacio, tenderán natural y espontáneamente a
formar grupos en nuestra percepción -en tanto los otros factores permanezcan iguales.
Un ejemplo muy simple que muestra el efecto de la proximidad en el agrupamiento
visual es mostrado en la Figura 1:
00 000 00 0000 00 000

Figura 1
La analogía con la percepción musical es obvia, cuando sustituimos tiempo por

espacio y elementos sonoros por elementos visuales. En el Ejemplo 9 , los sonidos
que están separados por los intervalos más breves de tiempo (incluyendo aquellos que
suenan simultáneamente, por supuesto) tienden a formar unidades o grupos, mientras
que los intervalos de tiempo más largos (en este caso los silencios) son un factor de
segregación de unidades. Puede verse, a partir de este ejemplo, que la proximidad
temporal puede manifestarse en una de estas dos maneras (o en ambas): contigüidad o
simultaneidad.
El principio esencial es el mismo en ambos casos. Aplicada a la percepción auditiva o
musical, el factor de proximidad puede ser formulado como sigue: en un grupo de
elementos sonoros, aquellos que son simultáneos o cercanos en el tiempo tenderán a
formar clangs, mientras que separaciones relativamente mayores en el tiempo
producirán segregaciones – en tanto se mantengan constantes los restantes factores.
(La cláusula “en tanto se mantengan constantes los otros factores” es muy importante,
como se verá próximamente.)
Un segundo factor en la formación de grupos visuales fue denominado por Wertheimer factor
de semejanza. En un grupo de elementos visuales aquellos que sean similares tenderán a ser
agrupados por el ojo, como se muestra en la Figura 2 , más abajo, en la cual los elementos
están ubicados a distancias iguales para que el factor de proximidad no tenga efecto sobre los
agrupamientos.
0 0 0 # # # 0 0 0 0 # #
Figura 2
20
21
El mismo principio en la percepción musical se relaciona con el hecho,bien
comprendido por cualquier músico, al menos implícitamente- de que sonidos tocados
por el mismo instrumento (es decir, de timbre similar) o en el mismo registro de
alturas (altura similar) tienden a parecer “conectados” y a formar grupos con más
facilidad que los sonidos que son distintos en estos aspectos. los Ejemplos 10 y 11
representan dos configuraciones típicas, en las que la semejanza de altura (Ej 10) y de
timbre (Ej 11) son el determinante primario de coherencia dentro de cada clang. En el
ejemplo de Varese, la semejanza de altura entre el Fa en la trompeta y el Mib-Re en
el clarinete es un factor cohesivo tan fuerte en este elemento lineal de el clang más
amplio que supera la influencia segregativa de la diferencia de timbres entre los dos
instrumentos. De esta manera, uno no escucha como un elemento unitario el Fa-Fa#-
Fa-Fa#...tocado por la trompeta, sino una linea simple que pasa de la trompeta al
clarinete.
21
22
En el ejemplo de Webern, por otra parte, el efecto de la semejanza de altura es mucho

menos poderoso que la semejanza de timbre que unifica cada una de las dos líneas
instrumentales (es decir clarinete en Mib y violín) como unidades singulares -y la
diferencia de timbre es la que mantiene las líneas separadas y distintas una de otra,
aún cuando las partes se cruzan melódicamente. Y es el cambio en el timbre -de
clarinete a oboe- el que realizará la separación perceptual entre los clangs 1 y 4 , a
pesar de la semejanza de altura entre el final de la linea de clarinete en Mib y el
principio de la parte del oboe. Así, un parámetro puede correr contra otro con
respecto a la operación del factor de semejanza. Pero es la existencia de un
relativamente mas alto grado de semejanza en algún parámetro lo que constituye la
fuerza unificadora en tales clangs.
Debe notarse también que la fuerza cohesiva del factor de semejanza implica -como
corolario obligatorio- el efecto segregante de la diferencia, exactamente como, con el
factor de proximidad, una separación mayor en el tiempo (es decir una relativa “no-
proximidad”) tenderá a causar segregación. El proceso mismo de formación de
unidades implica necesariamente una separación relativa de otras unidades -o de otras
partes del campo perceptual- y este hecho se tornará cada vez más significativo
cuando empecemos a analizar las posibilidades de formación de estructuras en varios
niveles perceptuales o escalas temporales.
El factor de semejanza no se aplica solo a la estructura y el timbre, sino también a los
22
23
otros parámetros -nivel dinámico, envolvente temporal, densidad temporal y
vertical,etc.- y de hecho puede decirse que funciona con respecto a cualquier atributo
del sonido por virtud del cual podemos, en un momento dado, o dentro de un lapso
dado, distinguir entre un sonido o configuración sonora y otra. Así, por ejemplo, la
semejanza morfológica o semejanza de forma entre los clangs componentes de una
secuencia, constituye un poderoso factor de unificación de esa secuencia.
Finalmente, debería notarse que las fuerzas cohesiva y segregativa de las semejanzas
y diferencias relativas no se aplican sólo a agrupamientos sucesivos -donde, por
ejemplo, un clang es segregado del siguiente clang en una secuencia- sino también a
configuraciones concurrentes, en que un clang se distingue de otro que suena al
mismo tiempo (tal como en el ejemplo 11). Los efectos del factor de semejanza
pueden correr, así, en contra de los del factor de proximidad, y en verdad, la
verdadera polifonía sería imposible si las únicas condiciones que llevaran a la
formación y segregación de clangs fueran solo contigüidad y simultaneidad.
Nosotros podríamos ahora formular el factor de semejanza, con especifica referencia
a la percepción musical, de la siguiente manera: en un conjunto de elementos sonoros
(o clangs), aquellos que son semejantes (respecto a sus valores en algún parámetro)
tenderán a formar clangs (o secuencias), mientras relativas diferencias producirán
segregación -siendo otros factores iguales.
Hasta aquí en el análisis de estos factores de cohesión y segregación ha sido
necesario aislar cada uno de ellos y considerar sus efectos separadamente. Esto es una
abstracción, por supuesto, y no debiera olvidarse que en cada configuración musical
real ambos factores ( y otros a ser definidos en un momento), están operando
simultáneamente, aunque ellos no ejercen habitualmente una fuerza igual en ninguna
configuración dada. En adición , ellos pueden ser más o menos cooperativos entre sí,
variando sus resultados en la organización perceptual dentro de un amplio margen,
desde una completa congruencia o refuerzo mutuo, o a través de efectos superpuestos
ambiguos, hasta configuraciones multi-estructurales completamente ambivalentes,
producidas por relaciones antitéticas entre los dos factores. En este ultimo caso, ( que
de ningún modo es excepcional, incluso en música anterior al Siglo XX) un conjunto
de elementos dado puede ser percibido en dos o más diferentes y distintas
configuraciones, proporcionando, de esta manera, dos o más clangs simultáneamente,
cada uno de los cuales puede ser igualmente importante en el contexto musical mas
amplio.
Aunque los factores de proximidad y semejanza no son los únicos involucrados en la
organización de unidades perceptuales, son los más básicos -es decir , los más
efectivos- y los más frecuentemente decisivos en la determinación de la unidad de un
clang o secuencia. Por esta razón, me referiré a ellos como los factores primarios de
cohesión y segregación. En adición a estos, hay cuatro factores secundarios que se
consideraran aquí. Estos son: (1) El factor de intensidad, (2) el factor de repetición,
(3) la predisposición objetiva, y (4) la predisposición subjetiva. Antes de describir
estos, sin embargo, quiero introducir una muy simple representación gráfica, que
puede ayudar a ilustrar los factores de proximidad y semejanza, y también, tal vez, a
clarificar algunos puntos en los argumentos que siguen.
Como se muestra en la Figura 3, el eje horizontal representa el tiempo, mientras que
el eje vertical representa una escala ordinal [10] de valores en uno de los varios
parámetros, es decir, en cualquiera de los parámetros – no importa aquí que
parámetro esta involucrado. Si uno representa, en un gráfico como este , las
variaciones de algún parámetro en el tiempo, el resultado será lo que llamaré el perfil
paramétrico del elemento, clang o secuencia involucrados., que dará una imagen
general de la configuración con respecto a ese parámetro.
23
24
Por ejemplo, si la coordenada vertical representa las alturas, el diagrama mostrará el

contorno melódico ( pero nótese que con la definición presente de la escala vertical,
el gráfico no puede decirnos nada de las alturas exactas o los intervalos presentes en
la configuración). Si el eje vertical representa la intensidad, uno podría diagramar la
envolvente temporal o ataque y caída de un simple elemento, o la forma dinámica de
un clang o secuencia. Así, una representación gráfica semejante podría ser
considerada una clase de “modelo” perceptual bidimensional -aunque muy primitivo-
que puede ser usado para graficar un aspecto de la percepción de una configuración
dada -aquel aspecto que corresponde a las variaciones de un parámetro en el tiempo.
Será evidente que las distancias entre elementos individuales en tal gráfico -cuando
se miden a lo largo del eje horizontal (o, con más precisión, distancias entre sus
proyecciones sobre el eje horizontal)- mostraran su relativa proximidad en el tiempo.
similarmente, distancias medidas en la dirección vertical indicarán, de una manera
24
25
general, al menos, la relativa semejanza o diferencia entre esos elementos, con
respecto al parámetro designado en el gráfico.
De esta manera, la proximidad en en el tiempo está representada por la proximidad en

el espacio -medida horizontalmente- mientras que la semejanza paramétrica esta
representada por la proximidad (en una especie de unidimensional “atributo
espacial”, medido verticalmente. En las Figuras 4 y 5 están representadas dos
configuraciones hipotéticas, el eje vertical sin indicación de cual es el parámetro
representado, sólo mostrando (como en la Figura 3) cualquier atributo distintivo del
sonido, en términos del cual una escala ordinal tal pudiera ser construida. La
configuración de la Figura 4 correspondería a una situación en la cual el factor de
proximidad es el principal responsable de la formación de grupos, mientras que en la
Figura 5 muestra formación de unidades determinadas primariamente por el factor de
semejanza.
La bidimensionalidad inherente a estos gráficos impone ciertas limitaciones en el
“modelo perceptual”, desde que la forma percibida de cada configuración musical
real involucrará una interacción de todos los parámetros -no sólo uno- y estos
parámetros podrían no siempre ser percibidos independientemente, como este método
25
26
de análisis de perfiles paramétricos simple parecería implicar. Pero aislando los
diferentes parámetros de esta manera, y considerando cada perfil separadamente, se
torna posible formular ciertos principios generales que serán todavía validos en
situaciones mas complejas que resulten de las simultáneas influencias de varios
parámetros en un clang o secuencia.
El primero de los factores secundarios de cohesión y segregación -el factor de
intensidad- se relaciona con la singular direccionalidad de las escalas paramétricas
empleadas en los gráficos. Es decir, nosotros generalmente asumimos unos valores
absolutos “arriba” y “abajo” en estos gráficos- un valor paramétrico más alto y uno
más bajo- que está de alguna manera relacionado con lo que podría llamarse
intensidad musical o subjetiva. Y digo “de alguna manera relacionado” porque
aunque esta “direccionalidad” es comprendida y utilizada por el músico en la
practica- y esta implícita en la mayoría de los procedimientos empleados por el
compositor y el ejecutante en la creación de climas, edificación de tensiones
musicales, intensificando o activando un pasaje de música, etc.- no conozco ningún
intento de definir estas condiciones explícitamente, y mucho menos de explicarlos en
términos no musicales. Es un hecho común de la experiencia musical que una
intensidad subjetiva más grande esta usualmente asociada con la elevación de la
altura, un aumento en el nivel dinámico o en el tempo, etc. De manera similar, el
cambio de un timbre “suave” o “delicado” a uno “áspero” o “penetrante”, o de un
intervalo más consonante a uno más disonante, es sentido como un incremento en la
intensidad subjetiva.
Una explicación de estas condiciones podría eventualmente ser derivada de ciertos

conceptos de la teoría de la información, comenzando por medidas de la información
transmitida en forma de descargas neurales en el “canal de comunicación” entre el
oído y el cerebro. Estas medidas se han hecho, al menos en cuanto a frecuencia y
amplitud, e indican que un más alto grado de transmisión de la información neural
está en efecto asociada tanto con las alturas agudas como con las grandes
intensidades, y algunas inferencias a partir de estos datos podrían ser realizadas con
relación al timbre, densidad vertical, y tal vez también otros parámetros.
Pero esto no puede ser más que el principio de una explicación, porque muchos otros
factores estrictamente psicológicos podrían estar involucrados, y si tenemos que
esperar por evidencia conclusiva en forma de datos fisiológicos, podríamos no
alcanzar nunca una posición como para describir este factor de la intensidad subjetiva
de una manera satisfactoria. Por lo tanto simplemente definiré un desplazamiento
ascendente en una escala paramétrica como un cambio de valor en tal parámetro que
produce, o es asociado, con un incremento en la intensidad subjetiva de la sensación.
En adición, llamaré a la medida de la relativa altura en esta escala intensidad
paramétrica. Y esta por lo tanto será una medida aproximada -en una “dimensión”-
de la mas integral intensidad musical subjetiva de un sonido percibido.
Consideren entonces lo que ocurre cuando escuchamos un clang moderadamente
complejo.
Podría observarse que nuestra atención no esta usualmente distribuida de manera
uniforme entre los elementos componentes, sino que esta enfocada mas agudamente
en algunos elementos que en otros. Por ejemplo , en un clang con varios elementos
simultáneos -delineados, digamos, por partes instrumentales separadas- es muy
probable que la atención se dirija al elemento de mayor intensidad, o (si todos poseen
un volumen similar) al de timbre mas intenso, o (suponiendo que todos los elementos
sean iguales en intensidad y timbre) al que posea la altura más aguda, etc. En cada
caso la atención tendera a ser dirigida hacia -y enfocada más agudamente sobre- el
elemento que exhibe los más altos valores en alguna escala paramétrica. Si la
diferencia en la intensidad paramétrica entre este elemento y los otros no es
demasiado grande, el resultado será una variación en la “resolución” focal, con el
elemento mas intenso siendo escuchado con más claridad, pareciendo más
inmediatamente “presente” a la percepción, mientras que los elementos menos
intensos serán más o menos “borrosos” -más o menos remotos como objetos
26
27
perceptuales. En esta situación, estoy asumiendo que todos los elementos están
siendo escuchados como parte de un solo clang, a pesar de las diferencias entre ellos,
pero por supuesto, si hay una diferencia demasiado grande en la intensidad
paramétrica entre un elemento y los otros, puede ocurrir una subdivisión -como
resultado de nuestro segundo factor de segregación y cohesión, el de semejanza- de
manera que escucharemos dos clangs separados en lugar de uno.
Hasta aquí, no hemos encontrado nada nuevo en las maneras de tendencias al
agrupamiento, pero si el análisis del factor de intensidad es transferido ahora de la
dimensión vertical a la horizontal se encontrará que este factor por si mismo puede
producir la formación de unidades en el tiempo –independientemente del factor de
proximidad, y en una manera que no se explica por el factor de semejanza-- como
éste ha sido formulado-- aunque la intensidad paramétrica esta obviamente
relacionada con la cuestión de la semejanza o desigualdad de los valores
paramétricos. Me estoy refiriendo aquí a lo que llamamos acento, y más
específicamente, a la tendencia a la iniciación de grupo asociada con el acento. Yo
sugiero que condiciones similares son válidas para los efectos de las diferenciaciones
de intensidad en el tiempo, como fueran observadas en el caso de las diferenciaciones
verticales, y que los mismos terminos pueden ser usados para describir los resultados
perceptuales, si no para explicarlos. esto es, en una sucesión de elementos sonoros
mostrando marcadas variaciones en la intensidad (en algún parámetro), la atención
será captada mas fuertemente por los mas intensos, acentuados elementos, mientras
que los elementos menos intensos serán relativamente borrosos, y –por medio de la
memoria, o tal vez a través de algún tipo de respuesta kinético-- la atención en
algunos momentos podría ser dirigida hacia atrás en el tiempo, hasta el elemento más
recientemente acentuado, hasta que una fresca acentuación re-dirige la atención al
mas inmediato momento presente.
Un proceso de este tipo podría ser ilustrado gráficamente como en la Figura 6, donde
cada flecha representa una clase de “vector de atención”, asociado con cada elemento
sucesivo en el gráfico. el largo del vector indicaría la relativa claridad, resolución
focal, etc., mientras que la dirección del vector representaría la dirección o
desplazamiento en el tiempo de la atención perceptual al momento de ocurrir cada
nuevo elemento. He colocado el origen de cada vector en un punto del eje temporal
correspondiente con el principio de cada nuevo elemento. Si uno deja caer
proyecciones verticales desde las terminales superiores de cada vector, marcando los
puntos de intersección de esas proyecciones con un tercer eje horizontal, los
agrupamientos resultantes sólo por acción del factor de intensidad son otra vez
mostrados por la proximidad relativa de los puntos en el espacio (medidos
horizontalmente)-- exactamente como sería la proximidad real en el tiempo. Tanto si
esto corresponde o no a alguna clase de distorsión o “arracimamiento” (clustering) de
momentos sucesivos en un tiempo experimentado subjetivamente, no tengo manera
de saberlo –y esta interpretación no es necesaria para el argumento, aunque
representa una intrigante posibilidad.
Si bien la descripción previa de la tendencia a la formación de grupos del factor de

intensidad tiene algunas ventajas, no es completamente satisfactoria a causa del
carácter especulativo del proceso subjetivo representado por los “vectores”. En
consecuencia, ofreceré dos hipótesis alternativas –igualmente especulativas-- que
podrían explicar el efecto de iniciación de grupo del acento, ya sea simple o en
combinación. La primera relacionará el factor de intensidad con el factor de
proximidad –interpretándolo, de hecho, como un caso especial de simultaneidad--
mientras que la segunda representaría un caso especial del factor de semejanza.
La primera hipótesis está basada en la suposición de que los sonidos suscitan
respuestas kinestésicas en el oyente, cuyas duraciones relativas son de alguna manera
proporcionales a la intensidad paramétrica de esos sonidos –con una respuesta a un
sonido intenso siendo más larga que la provocada por un sonido débil. esto puede ser
representado gráficamente mediante un diagrama de la intensidad subjetiva (o la
magnitud de la respuesta kinestésica) en función del tiempo –dispuesto, como antes
27
28
(en la Figura 6), “en paralelo” con el diseño de la intensidad paramétrica en función
del tiempo. Esto se muestra en la Figura 7, (usando el mismo perfil paramétrico que
la Figura 6), y se vera que la apropiada formación de unidades esta indicada en el
diseño inferior por la manera en que las curvas de respuesta de los elementos más
intensos tienden a superponerse y “absorber” aquellas de los elementos menos
intensos. El resultado perceptual de una situación tal seria un grado de subjetiva
“simultaneidad”que tendería a favorecer la formación de grupos iniciados por los
elementos acentuados. La segunda hipótesis alternativa es esta: parecería,
intuitivamente, que un cambio de valor paramétrico en la dirección ascendente
(incremental) podría producir un cambio más grande en la intensidad subjetiva que el
que correspondería a una disminución equivalente en el sentido descendente
(decremento). así , una simple alternancia entre intervalos paramétricos iguales
crecientes y decrecientes tal como el que se muestra en la Figura 8, podría ser
interpretada como si fuera el diseño que se ve en la figura 9, con una separación mas
grande asociada al intervalo ascendente. En este caso, el factor de semejanza podría
jugar un rol decisivo en la organización perceptual de la serie en tres sets de dos
elementos –mientras que en el primer diseño, ninguna influencia del factor de
semejanza habría sido evidente.Una comparación de las tres hipótesis sugeridas
arriba revelará el hecho de que en cada una de ellas se presenta al factor de intensidad
como un caso especial o bien del factor de proximidad o de el de semejanza. Esto
puede ser llevado a significar que estos últimos son realmente los más básicos –
siendo el factor de intensidad reducible a uno de ellos-- o alternativamente, que el
análisis (y por lo tanto el analista) esta tan inclinado en favor de los factores de
proximidad y semejanza que un muy importante aspecto del factor de intensidad
permanece en la obscuridad. Dudas acerca de esto podrán tal vez ser resueltas en el
curso posterior de este libro, durante el cual proximidad y semejanza (y
especialmente esta última) serán encontradas como de significancia única en la
unificación de formas musicales en todos los niveles perceptuales. La fuerza
agrupadora del acento es limitada en su efectividad a lapsos relativamente breves –
sirviendo básicamente para articular clangs sucesivos o elementos más breves del
clang-- mientras que el factor de semejanza produce tendencias al agrupamiento a
través de periodos de tiempo más largos, afectando no solo la formación de clangs ,
sino también de la secuencia, secciones mas largas o aún de piezas enteras. es por
esta razón que ha parecido apropiado distinguir entre factores de cohesión y
segregación “primarios” y “secundarios”, como se los definió previamente. Lo que ya
ha sido dicho de la desigual distribución de la atención en la dimensión vertical,
producida por diferencias entre la intensidad de elementos simultáneos, trae a
colación otro punto que debe ser mencionado aquí, aunque no esta directamente
relacionado con la formación de unidades per se. Cuando la atención esta enfocada
sobre un elemento o grupo de elementos más directamente que sobre otros en un
clang, la importancia musical relativa de los varios elementos debe obviamente ser
diferente, con los menos intensos elementos jugando un rol secundario en la
configuración total. Este será todavía el caso cuando las diferencias de intensidad
sean lo suficientemente grandes como para producir la división en dos o más clangs
simultáneos (en la medida en que estemos considerando un parámetro a la vez) –el
resultado siendo tipificado (en términos musicales convencionales) por las
diferenciaciones entre voces principales y secundarias, parte melódica principal
versus figuras de acompañamiento, etc. Debería resultar evidente que estas
diferenciaciones son generalmente producidas por diferencias en la intensidad
paramétrica, ya sea por el compositor o el ejecutante, o ambos.La situación aquí es
análoga en muchos aspectos a las distinciones entre figura y fondo en la percepción
visual –caracterizándose la figura por lo que Koffka llama una mayor “densidad
energética” y un más alto grado de “articulación interna” que el fondo. [11]
La analogía entre estas características y lo que he llamado intensidad paramétrica es

obvia, particularmente en vista de la generalidad de la definición de la coordenada
28
29
vertical de los gráficos mostrados previamente (“cualquier atributo distintivo del
sonido, en términos del cual una escala ordinal pueda ser construida”). La densidad
vertical y temporal han ya sido mencionadas como dos atributos así, y la noción más
general de grado de articulación –el ritmo de cambio de los valores paramétricos
discutido en la Sección I – puede también ser considerado un parámetro a ser
ordenado en una escala de intensidad de valores al igual que los otros.En este punto
quisiera resumir lo que se ha dicho hasta el momento acerca del factor de intensidad,
con respecto a ambas dimensiones, horizontal y vertical, del modelo perceptual. (1)
En un grupo de elementos sonoros, la distribución vertical de la atención en cualquier
momento será tal que, si las diferencias de intensidad de los varios elementos no es
demasiado grande, los más intensos elementos tenderán a estar en un foco más nítido
que aquellos de menor intensidad. Por otra parte, si las diferencias en intensidad
paramétrica son considerables, las subdivisiones (en clangs separados) surgirán,
como resultado del efecto cohesivo/segregativo del factor de semejanza. (2) En un
grupo de elementos sonoros, la distribución temporal de la atención perceptual –de
momento a momento-- será tal que, si las diferencias en la intensidad paramétrica son
considerables, sucesivos clangs tenderán a formarse, iniciándose a partir de los más
intensos, acentuados elementos.
Estas dos declaraciones podrían ser combinadas en una formulación general para el
factor de intensidad de la siguiente manera: en un grupo de elementos sonoros, entre
los cuales hay considerables diferencias en la intensidad paramétrica, tenderán a
formarse clangs en los cuales los más intensos elementos serán (1) los puntos focales
y (2) los puntos de iniciación de estos clangs.--siendo otros factores iguales.
Un cuarto factor que puede influenciar en la formación de clangs es el factor de

repetición. Si una repetición de perfil paramétrico es percibida dentro de una serie de
elementos sonoros, esto solo bastaría para dividir la serie en unidades
correspondientes a la silueta repetida –con la separación perceptual entre unidades
ocurriendo en el preciso punto anterior al primer elemento repetido. Que éste es un
factor relativamente independiente está indicado por el hecho de que él puede
determinar la organización perceptual aún cuando la mayoría de los otros factores
tendieran a producir diferentes agrupamientos,como puede verse en el Ejemplo12.
No estoy preparado para ofrecer ninguna explicación acerca de la manera en que este
factor puede funcionar, ni siquiera algunas hipótesis como las que fueran sugeridas
para el factor de intensidad. Es evidente, sin embargo, que el factor de repetición
29
30
involucra a la memoria, y más específicamente, un proceso de comparación entre lo
que esta siendo oído y lo que ha sido oído ya. Porque esto debe resultar en la
formación de unidades en el caso de la repetición, no es tan evidente. La condición
descripta sugiere, sin embargo,que puede existir en el oyente un positiva tendencia a
agrupar sonidos sucesivos en unidades más o menos circunscriptas –una tendencia,
esto es, que es independiente de, o previa , a las condiciones objetivas dadas por la
música. Los factores de cohesión y segregación que han sido analizados aquí pasarían
de esta manera a representar no tanto “fuerzas” activas como condiciones propicias –
es decir condiciones objetivas que facilitan la organización perceptual de los
elementos sonoros en clangs al oyente. En todo caso, ya sea que uno desee considerar
estos factores como fuerzas causales o simplemente como “condiciones propicias”
hace poca diferencia desde un punto de vista musical –es decir, tanto como nuestro
interés primario sean sus efectos sobre la percepción musical.
Vamos ahora a considerar aquellos factores de cohesión y segregación que mas
temprano denominé predisposición objetiva y predisposición subjetiva. La palabra
predisposición esta usada para significar, en general, una actitud psicológica previa –
envolviendo expectativas y anticipaciones-- que pudieran efectivamente determinar o
alterar la percepción de eventos presentes y futuros en el campo perceptivo. El
término predisposición objetiva es tomado prestado directamente de Wertheimer
(obra citada) que lo usó para describir un factor que influenciaba los agrupamientos
visuales y que tiene una contraparte análoga en la percepción musical. El término
predisposición subjetiva es adoptado aquí como una extensión de las implicancias del
primer término, y se refiere a un completo grupo de factores tales como experiencia
pasada, aprendizaje, hábito, asociación, etc., que Wertheimer menciona, pero de una
manera negativa –en razón de la sobrevaluación que estos factores subjetivos habían
recibido en las teorías psicológicas a cuyas premisas básicas se estaban oponiendo los
psicólogos Gestálticos. La situación teórica general en aquel momento (1923)
involucraba un activo conflicto entre la más antigua teoría de la percepción,
“elementalista” y “asociacionista”, y los más modernos conceptos de la Psicología de
la Gestalt, resultando en lo que puede parecernos ahora una desatención indebida ante
los factores subjetivos por parte de los psicólogos de la Gestalt. Es evidente ahora que
cualquier evaluación realmente completa de las varias fuerzas involucradas en la
percepción musical tendrán que tener en cuenta factores tales como entrenamiento
musical previo, orientación cultural, familiaridad con el estilo de la época o
compositor de la obra que se está escuchando, etc. Y todavía uno encontrara un
tratamiento similarmente desproporcionado de los factores objetivos versus los
subjetivos en éste libro, aunque por razones algo diferentes. Algunas limitaciones han
de ser impuestas desde el principio, y yo he intentado restringir el campo de mi
investigación al lado más objetivo de la experiencia musical – es decir a aquellos
aspectos que pueden remitirse directamente a los sonidos y configuraciones de sonido
que constituyen los materiales de la música.
Es bastante imposible hacer cualquier distinción absoluta entre los aspectos objetivos
y subjetivos de la experiencia musical –y similarmente, a menudo es dificultoso
decidir donde dibujar la linea divisoria entre la predisposición objetiva y la subjetiva,
desde que ambas son condiciones “subjetivas” en algún sentido, y cualquier
distinción que pudiéramos hacer podría probablemente parecerle arbitraria a un
psicólogo. Sin embargo, adoptaré las siguientes heurísticas definiciones de los dos
factores, en orden a facilitar el análisis, e incidentalmente para definir más
explícitamente lo que tiene que ser considerado afuera de los limites auto-impuestos
de la presente investigación.
Predisposición objetiva se referirá a las expectativas o anticipaciones que ocurran
durante una experiencia musical producidas o generadas por eventos previos
ocurridos dentro de la misma pieza, mientras que predisposición subjetiva se referirá
a expectativas o anticipaciones que son el resultado de experiencia previas a aquellas
ocasionadas por la particular pieza de música que estamos escuchando. Por
definición, entonces, la predisposición objetiva debe ser menos variable, de un oyente
al otro, que la predisposición subjetiva, porque la primera tendrá siempre analogías o
30
31
correlatos específicos en las configuraciones musicales mismas, mientras que la
segunda no.
Se verá con facilidad que, aún después de restringir el campo a un factor de
predisposición objetiva definido de esta manera, un enorme número de relaciones
musicales estará todavía involucrado. En los términos más generales, se relacionara
con cada manera en que la percepción de un evento musical previo (en la misma
pieza) tenga una influencia efectiva sobre la percepción de un evento posterior. pero
aún dentro de una composición corta,estas influencias son tan numerosas como para
parecer virtualmente infinitas a un oyente perceptivo, y yo no puedo esperar definir o
describir todas las formas diferentes en que este factor se manifiesta a si mismo.[12]
Solo mencionare aquí tres típicos ejemplos , con la comprensión de que puede haber
otros tan importantes como estos para la experiencia musical. Uno de los mas
comunes ejemplos de predisposición objetiva toma la forma de lo que pudiera
llamarse inercia rítmica, y es la fuente de la percepción de la sincopa, donde un
acento o impulso métrico es percibido de una manera que no corresponde a la
acentuación real en un momento dado. Lo que parece estar involucrado aquí es una
tendencia psicológica o kinestésica a la repetición rítmica –el mantenimiento de una
estructura rítmica establecida previamente-- que puede determinar la organización
perceptual de una estructura neutral o ambigua, (dándole la forma de lo que ha sido
ya escuchado), o introducir nuevas ambigüedades en una estructura de otra manera
no-ambigua, causando así algunas veces que la interpretación rítmica de un clang sea
muy diferente de lo que seria si fuera escuchado por si mismo, es decir, fuera de ese
particular contexto.
Un dispositivo musical tradicional que toma ventaja de esta forma de predisposición
objetiva es la hemiola barroca y clásica, en la cual puede ser observado que el
impulso rítmico subjetivo que es percibido en un momento es una herencia del
impulso establecido en los compases previos, y que la nueva estructura rítmica es con
frecuencia percibida como tal uno o dos compases más tarde que el momento en que
realmente ocurre. La fortaleza de tales dispositivos depende, como lo hace la mayor
parte de las formas del factor de predisposición objetiva, en el establecimiento de una
condición mas o menos constante o recurrente, y por esta razón son mucho menos
importantes en la música del Siglo XX de lo que lo eran en la música anterior a éste.
Pero aun en la música del Siglo XX, algún grado de inercia rítmica está siempre
involucrada, aunque su efectividad pueda estar empequeñecida ante otros factores.
Similar a lo anterior, pero no idéntico, es la condición más general por la cual el
establecimiento de normas referenciales específicas –tanto tonal, métricas u otras--
provee un estándar de comparación para eventos posteriores, con implicaciones más o
menos especificas para la interpretación de estos eventos. Otra vez aquí, los ejemplos
más obvios vendrían de la música tonal temprana –siendo una de las principales
características del sistema tonal tradicional el establecimiento de un nivel de alturas
referencial, respecto del cual todas las otras alturas reciben una interpretación
especifica. Similarmente, cuando un metro en especial es establecido y mantenido a
lo largo de una pieza, o una sección de una pieza, los eventos subsiguientes adquieren
implicancias rítmicas especificas en virtud de su posición respecto de la estructura
previamente establecida (por ejemplo: “a tiempo” versus “a contratiempo”) siendo las
síncopas mencionadas previamente un caso especial de esta implicaciones. Debe
notarse aquí que aunque es la predisposición objetiva la que hace especificables estas
implicaciones en primer lugar, la cuestión acerca de que particular interpretación les
será otorgada depende mayormente en la predisposición subjetiva. Así, por ejemplo,
la existencia de un claro centro tonal en Do hace potencialmente especifico el
significado de cualquier otra altura, pero si un Sol va a servir como “dominante” en
ese contexto depende de otros factores que incluyen convenciones musicales que han
sido aprendidas.
Debe decirse otra vez que la importancia de la predisposición objetiva ha disminuido
en la música del Siglo XX, pero debe todavía estar presente aunque en menor escala.
Esto es, la misma percepción de los intervalos de altura representa una forma
primitiva de este mismo factor. en el nivel más bajo de la escala perceptual temporal,
31
32
cada sonido representa una “norma referencial” para el sonido que le sigue, de
manera que las condiciones de la predisposición objetiva no pueden estar jamás
realmente ausentes de la experiencia musical.
El tercer ejemplo de este factor –singularmente importante en la mayoría de la
música, aunque tal vez algo menos en el presente que en el pasado-- envuelve la
referencia temática, recurrencia o evocación. Esta condición depende , más que las
dos primeras, de la facultad de más largo rango de la memoria –y es , de ésta manera,
menos inmediata que las anteriores-- pero es capaz también de alterar o determinar la
organización perceptual de configuraciones posteriores que son similares, o de otra
manera relacionadas con configuraciones que ya han sido escuchadas. Esto es, una
configuración dada puede tener un significado muy distinto cuando es percibida como
'”una variación de” otra configuración más temprana, que cuando es escuchada como
una configuración completamente nueva. Y, como con los dos primeros ejemplos de
predisposición objetiva, las mejores fuentes de ejemplos de este tipo de relación
estará en la música anterior al Siglo XX.
Será evidente, desde lo que ha sido ya dicho, que cuando más radicalmente la nueva
música se aparta de las convenciones del sistema tonal y los métodos tradicionales de
desarrollo temático, menos activas se tornaran las manifestaciones de la
predisposición objetiva. Podría se!alarse, sin embargo, que la técnica de los 12 tonos
y muchos de los procedimientos seriales recientes parecen al menos parcialmente
estar motivados por un deseo de re-instaurar las fuerzas cohesivas de este factor de
una manera nueva y diferente.
Esto es especialmente claro en las proposiciones originales del método de los 12
tonos, donde la serie de notas es tratada ya sea como una entidad temática y como una
omnipresente norma referencial de relaciones de altura –representando así un intento
de combinar en una forma lo que han sido previamente dos fuentes separadas de
fuerza cohesiva. Si el método de los 12 tonos consigue hacer esto de manera
satisfactoria o no, es otra cuestión; el punto aquí es que la intención detrás de ello
puede ser interpretada de esta forma, y es posible que todavía otros medios puedan
ser encontrados para restaurar estas fuerzas.
Por otra parte, puede ser que el uso de estas varias formas del factor de predisposición
objetiva corresponda a una actitud musical más especializada, característica de un
entorno histórico y cultural especifico, tornándose cada vez menos preponderante en
nuestro tiempo. Como he tratado de mostrar aquí, el factor de predisposición objetiva
no es de ninguna manera la única poderosa fuerza activa en la organización
perceptual o unificación de las configuraciones musicales.
32
33
Del factor de predisposición subjetiva poco se dirá aquí, excepto para señalar que hay
una clase de fenómeno musical cuyos efectos están relacionados muy de cerca con
aquellos de la referencia temática mencionados más arriba bajo la categoría del factor
de predisposición objetiva, pero que resultan de experiencias previas a la pieza de
música sobre la cual ejercen su efecto. Me refiero al uso de sonidos o configuraciones
de sonido en un nuevo contexto –tanto si están en la forma de citas más o menos
textuales o de rasgos estilísticos más generales. Ejemplos típicos de lo primero
pueden ser encontrados en las obras de Charles Ives, y de lo último en la música de
Berg y Bartok, y es importante remarcar que este tipo de dispositivos puede tener una
función estructural muy poderosa en la articulación de la forma más grande en una
pieza de música. En una obra muy larga, referencias temáticas entre puntos separados
más remotamente en el tiempo deben participar de algunas características de tales
referencias a ideas musicales ya familiares para el oyente, y la distinción entre
predisposición objetiva y subjetiva debe ser entendida como para incluir esa región de
ambigüedad en tales casos.
En mis señalamientos acerca del factor de repetición en pag. 41 ya mencioné que un
proceso de comparación estaba involucrado –una comparación entre lo que estaba
actualmente siendo escuchado y lo que ha sido escuchado con anterioridad. En
alguna medida, los factores de proximidad, semejanza, e intensidad podría involucrar
también estas clases de comparaciones, aunque en ninguna de estas instancias el
proceso es necesariamente consciente. Ahora los factores de predisposición objetiva
y subjetiva puede decirse que envuelve esta clase de comparación también, pero en
éste caso es de una clase distinta. Estos factores dependen de la comparación
perceptual de lo que un oyente escucha en un momento dado y lo que él esperaba
escuchar en este momento – más que simplemente lo que él ya ha escuchado. Otra
vez la definición teórica más apropiada de estos factores probablemente involucraría
los conceptos de la teoría de la información, y más específicamente, la teoría de “la
información semántica” basada en “las probabilidades inductivas”, propuestas por
Bar-Hillel y Carnap. [13]
Desafortunadamente, está más allá del alcance del presente libro elaborar estas
relaciones con la teoría de la información, pero las menciono como prometedoras
posibilidades para investigación posterir.
A fin de repasar algunos de los principios desarrollados en esta sección del libro, he
seleccionado para el análisis un ejemplo musical mas extenso (ejemplo 13) en el cual
mayormente todos los factores gestálticos de cohesión y segregación pueden verse en
operación. Este pasaje-- tomado del primer movimiento (“Emerson”) de la Sonata
para piano “Concord” de Charles Ives-- merece un cuidadoso estudio, porque
representa una aplicación altamente refinada de numerosos dispositivos por medio de
los cuales clangs y secuencias pueden ser organizados composicionálmente para
conseguir una verdadera textura musical polifónica. Al menos dos y con más
frecuencia cuatro distintas lineas separadas son desarrolladas aquí simultáneamente,
con un alto grado de independencia rítmica (desde el punto de vista de la estructura
de frase-- correspondiendo a las duraciones de los sucesivos clangs-- delineados
dentro de cada una de las secuencias individuales). Esto resulta en un compleja
polirítmia que no podría ser jamás percibida como tal si las varias (secuenciales)
lineas no fueran oídas como hilos argumentales separados dentro de la trama musical
total. Y esto significa, por supuesto que cada una de estas secuencias desarrolladas
simultáneamente debe ser, de alguna manera, al mismo tiempo unificada
internamente, por alguna fuerza cohesiva que conecta los sucesivos clangs en una
configuración mayor y por otra parte, que cada secuencia debe estar diferenciada de
las otras secuencias por una fuerza de segregación que mantiene algunos límites entre
ellas. Será instructivo analizar el pasaje en orden a determinar específicamente como
ésta diferenciación polifónica es lograda aquí-- que factores están involucrados, y de
que manera se manifiestan en cada momento dado.
En el ejemplo 13 he re-arreglado la notación de la música de manera tal que las partes
individuales pueden ser vistas mas claramente como lineas separadas, o lo que
llamaremos secuencias monofónicas. Estas serán designadas como secuencias a a la
33
34
e, de acuerdo con su registro de altura predominante-- desde lo agudo a lo grave. Los
sucesivos clangs en cada secuencia monofónica son mostrados entre corchetes, con
números arábigos correspondientes a su orden de aparición en cada secuencia.
Cuando clangs individuales son mencionados en el texto, serán designados con este
numero con un subíndice para indicar la secuencia en la que aparecen-- por ejemplo
3a, 5c, etc. El pasaje se constituye de dos sucesivas secuencias polifónicas, a las que
nos referiremos como “Secciones” I y II, respectivamente-- con sus limites dados en
el ejemplo por las tres barras de compás (no hay barras de compás en la notación
original). Las porciones de música que preceden a la primera y siguen a la tercera
barra de compás se muestran para ayudar a ilustrar ciertas observaciones que serán
hechas acerca de aspectos de nuestra percepción del cuerpo principal del ejemplo que
están influenciadas por las condiciones afuera de él-- es decir en conexión con la
predisposición objetiva y subjetiva.
Debe notarse primero que el factor de proximidad puede tener muy poca influencia
en la diferenciación polifónica de las varias secuencias monofónicas en un ejemplo
de esta clase. La polifonía envuelve el desarrollo independiente de partes
simultáneas, mientras que el efecto del factor de proximidad es neutralizar la
independencia de las partes simultáneas-- “fundirlas” en una estructura simple. Así,
la polifonía es solamente posible cuando otros factores están funcionando en
oposición con el factor de proximidad. Dentro de cada secuencia individual
monofónica, sin embargo, el factor de proximidad puede estar involucrado en la
articulación de los limites de sucesivos clangs, como es en este ejemplo, entre los
clangs 1c y 2c, o de los clangs 2 a 3, 5 a 6 y 6 a 7 en la secuencia d.
El factor más efectivo en la creación de diferenciación polifónica en un pasaje como
éste, es por supuesto el factor de semejanza. La coherencia interna de la secuencia a,
b y c, al principio de la Sección I, es el resultado, en cada caso, de una característica
intensidad (piano, forte y mezzo-forte, respectivamente), la densidad vertical (nota
simple, racimo de notas, nota simple), y –en una proporción menor tal vez, densidad
temporal. Inversamente, las tres secuencias son “mantenidas en relativo aislamiento”
una de otra por su diferencias respecto de algunos parámetros. Es notorio que el
parámetro en el cual el factor de semejanza se manifiesta a si mismo aquí no es la
altura. En efecto, si la secuencia a hubiera estado marcada forte, o si hubiera
contenido racimos de notas, las diferencias de altura entre las secuencias a y b no
hubieren sido suficientes para distinguir las dos lineas, --sus elementos hubieran sido
percibidos como parte de un clang, en cualquier momento dado, más que como dos
clangs distintos. El Do# en 1b, por ejemplo, seria entonces oído como la
continuación del movimiento melódico al principio de 1a (es decir, uno escucharía
Lab-Sol-Mi-Do#.... en lugar de Lab-Sol-Mi-Re(grave)... etc.) --más que como una
parte de un clang comenzando con Si (la nota más alta del primer elemento en 1b),
como es percibido ahora.
Pero después de la entrada de las secuencias d y e, la semejanza en el registro de
alturas deviene mucho más importante como factor de cohesión y segregación en la
música. Desde ese punto, cada secuencia permanece dentro de un relativamente
circunscripto rango y registro de alturas lo que determina efectivamente su
coherencia interna y separación mutua.
Pero la intensidad y densidad temporal aún siguen siendo importantes factores. La
diferenciación en este ultimo parámetro es la fuente primaria de separación entre las
secuencias d y e, y si la distinción entre el mezzo-forte de la secuencia c y el piano de
la secuencia a no es mantenido en la ejecución de la segunda mitad de la Sección 1,
estas dos lineas se fundirán seguramente en una (como se muestra en las notas
pequeñas en la notación de a en este punto).
Las mismas relaciones generales pueden ser aplicadas para el resto del ejemplo,
donde las semejanzas paramétricas siempre constituyen la fuerza cohesiva primaria
dentro de las secuencias monofónicas, mientras que las diferencias paramétricas son
la fuerza segregativa primaria ejercida entre ellas. El factor de semejanza es así por
lejos el más importante factor en la articulación vertical del pasaje en partes lineales
separadas, y todavía es mayormente de ninguna importancia en la organización
34
35
horizontal – es decir la articulación temporal de sucesivos clangs dentro de cualquier
secuencia. Ha sido ya mencionado que el factor de proximidad juega un rol en esta
articulación temporal, pero son mucho más importantes en este respecto los otros
factores-- intensidad, repetición, y predisposición objetiva.
Los factores de intensidad y repetición usualmente funcionan cooperativamente en
este ejemplo. Esto es los limites temporales definidos por estos dos factores son casi
siempre congruentes o sincrónicos – como en los principios de los clangs 2a y 4a,
clang 2c (por repetición del patrón rítmico corchea con puntillo – semicorchea –
blanca), y 5c, y finalmente en los clangs 2 y 5 de la secuencia d. En los clangs 6d y
7d, por otra parte, los factores de intensidad y repetición pueden ser vistos
funcionando independientemente-- no congruentemente-- con el agrupamiento
predominante siendo determinado por el factor de repetición (en comparación con el
factor de proximidad, ya mencionado como influyente en estos puntos).
La predisposición objetiva está involucrada en la organización perceptual de este
pasaje de dos maneras. Esto es, influencia el agrupamiento de ambas estructuras
melódicas y rítmicas. La previa aparición del patrón melódico descendente, segunda
menor -tercera menor – segunda mayor-- como se muestra en el compás introductorio
(la parte que precede la primera linea de compás)-- facilita la integración perceptual
del Re grave en el clang 1a con las tres notas precedentes en el alto registro (y así, en
comparación con el factor de semejanza como se manifiesta en los dos parámetros,
intensidad y densidad vertical, pero en oposición con las diferencias de altura que
tenderían a separar estos elementos).
En la forma de inercia rítmica, el factor de predisposición objetiva esta claramente
envuelto en mucha de las ambigüedades métricas de este pasaje. Una progresión
temporal en negras ha sido firmemente establecida en pasajes más tempranos, y este
pulso es mantenido consistentemente en la secuencia b, así que los agrupamientos de
cinco y siete corcheas de duración, que ocurren frecuentemente en las otras
frecuencias, crean una compleja relación polirítmica entre las varias líneas.
Así, cinco de los seis factores gestálticos de cohesión y segregación están más o
menos activamente envueltos en la organización perceptual de este pasaje-- con cada
uno de los factores de semejanza, intensidad, repetición, y hasta predisposición
objetiva, manifestándose en dos o más parámetros. Los únicos parámetros que no
están involucrados en este ejemplo son la envolvente temporal (desde que una técnica
de legato es la única manera apropiada de ejecutar este pasaje-- no hay indicaciones
de staccato), y –por razones obvias-- timbre. Es posible que alguna de las
diferenciaciones intentadas aquí podrían haber sido conseguidas más fácilmente en
un ámbito orquestal u otro medio en el cual la diversificación de timbres sea posible.
Pero aun así Ives ha logrado aquí un asombroso alto grado de diferenciación
polifónica sin el uso de este recurso-- aún a pesar del medio.
El factor de predisposición subjetiva no ha sido mencionado en el análisis en curso,
desde que no juega un rol aparente en la organización perceptual de estas secuencias.
Pero yo he incluido-- en el mismo final del ejemplo-- la porción inicial de la
secuencia que sigue al pasaje que hemos estado considerando, porque ella muestra
una de las versiones del motivo inicial de la Quinta Sinfonía de Beethoven que es
usada de una forma u otra a través de toda la sonata “Concord”. Y mientras no puede
decirse que la predisposición subjetiva modifica la interpretación de los clangs en
este punto de la música, hay muchos otros lugares en la pieza donde la familiaridad
del oyente con el motivo hace que su organización perceptual del clang o la secuencia
sea de alguna manera diferente de lo que hubiera sido de otra manera (esto es, si los
únicos factores envueltos hubieran sido los más objetivos). Menciono esto solo como
un recordatorio de que las configuraciones musicales pueden no siempre ser tan
receptivas al análisis en términos de tales factores objetivos como los que han sido
mostrados como responsables por la organización perceptual de este ejemplo en
particular.
En respuesta a la cuestiones aparecidas al final de la Sección I, seis factores
gestálticos han sido encontrados operando en la unificación y segregación de clangs,
y en la organización perceptual de las configuraciones musicales en general. Estos
35
36
son los dos factores primarios de proximidad y semejanza, y los cuatro factores
secundarios de intensidad, repetición, predisposición objetiva y predisposición
subjetiva. Uno o más de estos factores será decisivo en la delineación de los limites
de cualquier clang o secuencia, y el compositor – tanto si lo hace conscientemente
como si no-- debe inevitablemente poner en juego estos factores en la organización
de sus materiales sonoros. Con seguridad no será desventajoso para él el poder
ejercer aquel “control consciente sobre los nuevos medios y formas” que, según
Schoenberg, es el deseo de todo artista. Y yo creo que una comprensión mas explícita
de los factores gestálticos de cohesión y segregación esquematizados en esta sección
del libro podrían hacernos avanzar un largo trecho hacia la formulación de una base
técnica significativa y realista de tales controles compositivos. Una comprensión de
esos factores cohesivos es solo el principio, sin embargo, y en la próxima sección yo
trataré de llevar el concepto de clang algunos pasos más adelante, hacia el campo de
la forma musical.
Sección III
“ Entonces –dijo Stephen-- tu pasas de punto a punto, conducido por sus lineas formales; tú
lo aprehendes como una parte balanceada contra otra dentro de sus limites; tú sientes el
ritmo de su estructura. En otras palabras, la síntesis de la percepción inmediata es seguida
por el análisis de la aprehensión...Tú lo aprehendes como un complejo, múltiple,
divisible,separable, construido por sus partes, el resultado de sus partes y su suma,
armonioso.”
James Joice, Retrato del artista adolescente, pag. 212
“Ahora, el estado, incluyendo la silueta o forma, de una porción de materia, es el resultado

de un numero de fuerzas, que representan o simbolizan las manifestaciones de varias clases
de energía; y es obvio, de acuerdo con esto, que una gran parte de la ciencia física debe ser
comprendida o asumida como el necesario preludio para el debate al que nos abocamos.
Pero podemos al menos tratar de indicar, muy brevemente, la naturaleza de las principales
fuerzas, y las principales propiedades de la materia con la cual nuestro sujeto nos obliga a
trabajar.”
D'Arcy Wentworth Thompson, De Crecimiento y Forma, pag. 16-17
“Es cierto que este aspecto del teatro puro, esta física del gesto absoluto que es la idea en si
misma y que transforma las concepciones de la mente en eventos perceptibles a través de los
laberintos y los entrelazamientos fibrosos de la materia, da una nueva idea de lo que
pertenece por naturaleza al dominio de las formas y la materia manifiesta.”
Antonin Artaud, “Sobre el teatro Balines”,

en El teatro y su doble, pag. 62.
36
37
Factores Formales en el Clang y la Secuencia.
La base propuesta para un nuevo marco conceptual de trabajo para la descripción y el

análisis musical, se apoya en la premisa de que la percepción musical está organizada
en términos de estructuras auditivas de gran variedad y complejidad potencial, y de
que la cuestión de la coherencia musical y la “continuidad” formal deben
inevitablemente girar alrededor de las más básicas cuestiones como cuales son los
factores esenciales responsables de la organización perceptual de cualquier
configuración musical—cualquier clang o secuencia. Un primer paso fue dado en la
sección precedente aislando estos factores y definiendo las condiciones especificas
que conducen a la unificación o segregación de estructuras musicales en general –
pero fue solo el primer paso. La descripción de una pieza de música debe hacer más
que simplemente dibujar la “lineas limítrofes” alrededor de sucesivos clangs o
secuencias. Nosotros vamos a querer estar capacitados para describir los rasgos
característicos de los clangs y secuencias así delimitados, y –más específicamente--
aquellos rasgos que son de una manera u otra esenciales para el desarrollo de la
música, y para la experiencia musical en si misma. Esto significa que nuestro interés
en última instancia debe ser la forma musical, en todos sus múltiples aspectos así
como en todos los niveles perceptuales y escalas temporales relevantes. Pero en orden
a describir la forma de una configuración dada, será necesario tomar en cuenta ciertos
otros atributos de los materiales componentes de la configuración –atributos que no
son estrictamente “formales” pero que pertenecen más a alguna condicion general o
estado de estos materiales componentes. Me referiré a estos aspectos no-formales del
sonido o de las configuraciones de sonido como rasgos estadísticos, y a sus
características formales como rasgos morfológicos –posponiendo por ahora cualquier
definición más especifica o justificación de estos términos.
Consideremos primero que significa cuando hablamos de la forma de cualquier
sonido o configuración sonora. En discusiones musicales la palabra es usada a veces
para denominar algo que podríamos llamar, con más propiedad, “unidad formal” o
coherencia, y se dice que depende de dispositivos como repetición, recapitulación,
“retorno”, etc. Pero éste, creo yo, es un altamente especializado y engañoso uso de la
palabra. Los dispositivos mencionados más arriba son medios tendientes a la
unificación de una pieza musical, o una sección o parte de ésta, pero ellos en si
mismos no dan a la pieza su forma. Ellos son, en realidad, manifestaciones en larga
escala del factor de semejanza-- o una manera atenuada del factor de predisposición
objetiva—ambos definidos en la Sección II como factores de cohesión y segregación.
Pero aunque la misma existencia de unidad formal o estructura es obviamente
dependiente de la existencia de unidad – y por lo tanto presupone la existencia de un
factor de cohesión –esta unidad no es sinónima con la forma real de la estructura
producida de esta manera.
Un segundo uso de la palabra que es hallado muy a menudo en discusiones
musicales, es ilustrado por el uso de términos como ”Forma Sonata”, “Forma ABA”,
“Forma Rondeau” etc., que se refieren a tipos de forma específicos, generalmente
asociados con estilos particulares o periodos históricos. Y aunque cada uno de estos
tipos formales puede ser caracterizado por ciertos rasgos formales intrínsecos,
comunes a todos los ejemplos del tipo, y constituyendo la base original para su
clasificación, ellos tienden a representar, en cada caso, no tanto una forma, sino una
formula, y no son, por lo tanto, relevantes en el estudio de los problemas que estamos
tratando aquí.
No usaré, entonces, la palabra forma en este libro, en ninguna de las dos acepciones
mencionadas anteriormente. Es decir: no será usada como substituto por unidad o
coherencia (que serán designados como tales en todos los casos) ni en el sentido de
“una forma” o tipo formal, refiriéndonos a clasificaciones tradicionales o no. La
palabra tiene otra connotación, mucho más general, que es consistente con el uso que
se le da en otros campos (extra-musicales), a saber, silueta o estructura-- y es en éste
sentido en el que será usada en la discusión sobre la forma musical a continuación,
37
38
sin jamás olvidar, que la aplicación de un término tomado prestado de otros campos
de la experiencia pueden no ser más que útiles analogías, con todos los peligros que
conlleva cualquier proceso de extrapolación de un campo a otro.
Yo llevaré la analogía un paso mas allá, sin embargo, para señalar que, de acuerdo
con las definiciones más comunes de los términos silueta y estructura, el primero
implica generalmente un aspecto más superficial (es decir, perteneciente a la
“superficie”) o externo de la forma (relacionado con el perfil o contorno), mientras
que el segundo (estructura) se refiere usualmente a un aspecto más interno --
”conexiones” o interrelaciones entre partes componentes que no son necesariamente
evidentes (las interrelaciones)“en la superficie” de la forma, es decir en su silueta.
Yo me acojo a estas definiciones estándar meramente para que sirvan como un punto
de partida en la tarea de clarificación de términos que debe preceder cualquier
análisis adecuado del problema de la forma musical. Pero estos son, como mucho, de
uso limitado para nosotros,porque se relacionan más con los “campos de percepción”
visual e intelectual que con el campo auditivo. Lo que debe ser hecho ahora es
descubrir que significan realmente estos términos en la percepción musical. Esto es,
como se manifiestan silueta y estructura en el clang o secuencia, y en nuestra
percepción de estas configuraciones. Y para empezar debemos preguntarnos que pasa
cuando transportamos estos conceptos de campos cuyas dimensiones son
primariamente espaciales a un campo que es esencialmente temporal. Las siguientes
observaciones sobre estructura temporal serán fácilmente aplicables a la silueta
temporal y así a la forma temporal en general.
He definido estructura como involucrando las “interrelaciones entre partes

componentes”, de manera que la existencia de la estructura es dependiente en primer
lugar de la existencia de partes subordinadas dentro de una Gestalt dada. Pero aún en
el nivel perceptivo más inmediato, una cosa solo puede ser descompuesta en partes si
existen entre estas regiones o puntos algunas diferencias en el campo perceptivo.[14]
Para una estructura que se percibe en el tiempo, esto significara diferencias entre un
momento y otro –cambios en algún atributo del sonido de un momento a otro. Debe
ser evidente que, a menos que estos cambios ocurran dentro de un clang, no se
percibirán partes subordinadas (es decir: elementos articulados sucesivamente), y si
no hay partes a percibir, no puede haber “interrelación entre las partes” y por lo tanto,
no estructura –en el sentido anteriormente definido. La misma existencia de una
estructura en una forma temporal dependerá por lo tanto, de cambios que ocurren
dentro de sus límites, y la percepción de diferencias entre una parte y otra resultará de
esos cambios. Pero aunque no puede haber partes perceptibles donde no hay cambio,
puede haber cambios perceptibles sin que resulte ninguna subdivisión en partes –es
decir, cuando todos los cambios que ocurren son continuos. Y en esta clase de
situaciones, aunque no podamos tal vez hablar de estructura
como tal, nosotros percibiremos, todavía, una forma, que puede solo ser definida en
términos de los cambios paramétricos que ocurren entre un momento y otro del
tiempo. Lo que nosotros percibimos en este caso es aquel otro aspecto de la forma –la
silueta – cuya manifestación temporal está otra vez apoyada en el cambio, la
percepción de diferencias, etc., justo como en el caso de la estructura, y que nosotros
podemos, hasta cierto punto, representar gráficamente como un “contorno” o “perfil”
de las variaciones de algún parámetro en el tiempo.
Por lo tanto, son las diferencias entre los sucesivos elementos de un clang, (y entre
los sucesivos clangs de una secuencia), las que determinan la forma del clang (o
secuencia)--no las semejanzas, aunque estas usualmente constituyen el factor
primario de cohesión en el clang o la secuencia, como fue demostrado en la Sección
II. En el caso de un clang relativamente simple, los rasgos morfológicos podrían ser
definidos en términos de intervalos paramétricos y/o gradientes [15] entre sus
sucesivos elementos, aunque en el caso de más complejos clangs, y con secuencias,
el mensuramiento de “perceptibles diferencias” no es tan simple y podría envolver los
rasgos estadísticos y morfológicos mencionados al principio de esta sección. Pero se
38
39
vera que, aún aquí, el mismo principio básico es todavía aplicable –a saber, que la
forma de una configuración musical es determinada primariamente por las
diferencias efectivas entre sus partes sucesivas.
Un recuento del número de distintas maneras en que dos elementos de un clang
pueden ser percibidos como diferentes prácticamente nos remite a una lista de los
varios parámetros del sonido –por la misma definición de la palabra parámetro que
fuera dada en la pagina 32 de la Sección I-- “cualquier atributo del sonido a raíz del
cual estamos capacitados para... distinguir un sonido o configuración sonora de otra.”
El método gráfico de representación de perfiles paramétricos usado en la ultima

sección deberá por consiguiente sernos muy útil analizando la forma de un clang, y
tal vez podamos aprender algo acerca de la forma musical en general aplicando este
método a un ejemplo específico. Consideremos un muy simple clang –aquel que se
escucha al principio de la pieza para flauta sola de Varese “Densidad 21.5” mostrado
en notación musical tradicional en el ejemplo 14.
Métodos convencionales de análisis notarían primero que todo los aspectos melódico-
armónico de este clang, que son tan sencillos que en este caso una representación de
la silueta de la altura difícilmente parece necesario. De todas maneras mostramos el
diseño en la Figura 10, especialmente para ilustrar algunas de las observaciones que
se harán luego. Como es obvio aún sin la ayuda del gráfico, hay muy poca variación
de altura en este clang, siendo el rango solo una segunda mayor, y los cambios que
ocurren están agrupados todos cerca del comienzo, el resto del clang parece muy
estático,--en término de alturas.
Una más completa descripción del clang podría referirse a sus características rítmicas
–dos notas cortas seguidas por una larga. Mientras que en el campo de las alturas
había tres niveles (Mi, Fa, Fa#) aquí hay solo dos –siendo las dos notas cortas
semicorcheas-- pero el rango de variación entre el más bajo y el más alto valor
paramétrico es mucho mayor que en el perfil de alturas. Todavía el clang aparece
muy estático, con la mayor porción de éste no mostrando otros rasgos—al menos en
términos de relaciones de altura o duraciones.
39
40
Pero cuando uno escucha cuidadosamente una buena ejecución de esta pieza, el
primer clang se escucha muy diferente –tiene un perfil que impregna el clang
completo, extendiéndose desde el mismo principio hasta el final, y dándole una forma
muy palpable que nunca es estática. Obviamente, no hemos todavía tenido en cuenta
la forma del clang como es realmente percibido. Y es probable que sea perfectamente
evidente para el lector que el factor que es responsable de dar forma a la ultima
porción del clang –y que había sido dejado de lado aquí hasta ahora-- es la variación
en intensidad que está indicada para la duración del largo Fa#. El perfil de intensidad
en este clang puede ser graficado como en la Figura 11 (donde la ligera acentuación
de la primera nota –indicada como un guión debajo de la cabeza de ésta en la
partitura-- está también representada.
Se podría objetar aquí que las fluctuaciones entre mezzo forte y forte en este ejemplo
son apenas perceptibles al oído, o que el alcance de la variación dinámica está
perfectamente dentro del rango de los “matices expresivos” normalmente realizados
por el ejecutante aún en ausencia de indicaciones explícitas en la partitura. Pero éste
es precisamente el punto importante, que a pesar de la pequeña magnitud de estas
variaciones de intensidad, la forma del clang, como un todo, puede ser
profundamente afectado por estas, adquiriendo un carácter verdaderamente dinámico,
un sentido de dirección, ímpetu hacia adelante, etc., donde ningún otro parámetro esta
involucrado. Si nosotros vamos a asumir que la forma percibida de un clang es un
singular, integrado aspecto de nuestra aprehensión del clang en si mismo –como
pienso que deberíamos-- vamos a tener que admitir que una adecuada descripción de
las características morfológicas de un clang puede involucrar varios diferentes
perfiles paramétricos –que, en los hechos, involucrara cada parámetro en el cual
algún cambio perceptible ocurra durante el transcurso del clang. Y. aunque esto
significa que nuestra descripción de la forma de un clang carecerá de la singularidad
–como una descripción-- que es una característica de nuestra percepción de esa
forma, todavía cualquier descripción será irremediablemente incompletas si al menos
no comienza con una consideración simultánea de todos estos perfiles separados, no
sólo uno de ellos. Esto no significa, por supuesto, que todos los parámetros serán de
igual importancia como formantes de un clang. Por el contrario, una de las primeras
cosas que podremos descubrir acerca de la forma de un clang en particular con esta
clase de análisis es cual es el parámetro que es más decisivo en su formación, en un
momento dado o para el clang en su totalidad. En el ejemplo previo, el más efectivo
parámetro formante en el comienzo es la altura, pero eso es claramente diferente en el
resto del clang, donde la intensidad deviene el parámetro formante.
Cuando el determinante formal se traslada de esta manera de un parámetro a otro
dentro de un clang, se torna imperativo que más de una silueta paramétrica sea
incluida en la descripción de éste. Y esto es cierto no solamente cuando nos
enfocamos en la “forma total” del clang como puede ser percibida, sino también
cuando nuestro interés se centra en un aspecto de la forma, como por ejemplo, el
ritmo del clang. aquí una distinción debe ser hecha entre lo que llamare el ritmo
explícito del clang –asociado con las duraciones relativas de los distintos elementos
(cuyos limites son delineados por cambios diferenciados en los valores paramétricos-
- y un ritmo implícito, que es determinado por las duraciones de un “pico” a otro en
los varios contornos paramétricos del clang. Cuando el parámetro formante en una
parte de un clang no es el mismo que en otra parte --como en el ejemplo de Varese
(donde primero es la altura, luego la intensidad)-- tanto el ritmo explícito como el
implícito , o ambos, pueden tornarse evidentes sólo por medio de la comparación
simultánea de las varias siluetas paramétricas involucradas. Esto se hace en la Figura
12, donde las lineas de altura e intensidad se han dispuesto una sobre
la otra con sus ejes de tiempo paralelos, para una comparación conveniente.
adicionalmente a la acentuación del principio, el ritmo implícito de este clang incluye
un pico de intensidad (es decir un punto de más alta intensidad en este parámetro),
que ocurre aproximadamente en la mitad del largo cuerpo del Fa#. Si se lo ejecuta
adecuadamente uno debe escuchar un cierto grado de impulso rítmico en este punto,
aún cuando no hay un corte en la continuidad del elemento.
40
41
Otro ejemplo de ritmo implícito, aunque envuelve sólo un parámetro, es el tercer

clang de la misma pieza (ver Ejemplo 15). Otra vez aquí hay un impulso interno para
ser oído, un característico ritmo implícito, aún cuando el clang consiste de una sola
nota, siendo sólo el crescendo-diminuendo el responsable de la articulación de su
silueta y forma.
Hemos ya tratado con un ejemplo en el cual la determinación del perfil formal se

desplaza de un parámetro a otro dentro del mismo clang. En muchos clangs esta
función de determinación formal es dada por un solo parámetro, y es posible entonces
hablar de un determinante formal primario –o parámetro formativo-- para el clang
como un todo. Este será generalmente el parámetro que muestre la mayor cantidad de
variación dentro del clang –el más rápido ritmo de cambio-- aunque otros factores
contextuales pueden ejercer una influencia que modifique la efectividad relativa de
las varias siluetas paramétricas desde un punto de vista de la impresión musical real
de la forma del clang. Lo que queremos señalar aquí especialmente, sin embargo, es
que cualquier parámetro puede funcionar como el determinante formal primario de
un clang, dadas ciertas condiciones que pueden ser ilustradas por el Ejemplo 15 –la
primera secuencia completa de la pieza de Varese de donde fue tomado el previo
ejemplo. Sin recurrir a la representación gráfica empleada anteriormente, es evidente
que los tres clangs representan tres diferentes situaciones respecto a la cuestión de la
determinación paramétrica del perfil de la forma. El parámetro formante en el
41
42
segundo clang es claramente la altura, desde que no hay un cambio efectivo en el
nivel dinámico, y muy pequeña variación en la duración de los elementos
(proporcionando una silueta rítmica plana (explícita), en adición al perfil de
intensidad neutral. En el clang 3, el determinante de la silueta es obviamente la
intensidad, desde que no hay variación en ninguno de los otros parámetros, y la
objeción que podría haberse levantado contra mi interpretación del primer clang
difícilmente pudiera sostenerse en este caso. La importancia aquí del perfil de
intensidad no puede ser ignorado, no sólo porque los otros factores permanecen
constantes (o casi), sino porque la variación en el nivel dinámico cubre una gran
porción del rango total de posibilidades en ese parámetro –desde piano a forte-- y no
es ya comparable con los “matices expresivos” de un interprete.
Las observaciones que se han hecho hasta ahora en referencia a los factores
formativos que actúan en el ejemplo de Varese se refieren específicamente a silueta o
perfil –y por lo tanto sólo a uno de los dos aspectos de la forma mencionados en
nuestra definición inicial. O sea, nada ha sido dicho acerca de la estructura. Pero
puede fácilmente demostrarse que los principios que se han deducido para la silueta
pueden aplicarse a la estructura –es decir, todos los parámetros pueden estar
involucrados en la determinación de la estructura en una configuración musical. Así,
al describir la estructura de la secuencia de Varese, tendríamos que notar las obvias
relaciones de semejanza entre el tercer clang y la segunda parte del primer clang, con
respecto a la silueta dinámica (crescendo-diminuendo), duración (por ser ambos
largos ,sostenidos), y región de las alturas (constituyendo una relación de semitono,
que se escucha claramente como un movimiento melódico en si mismo, puenteando
el espacio creado por el Do# en el segundo clang.
Las conclusiones que se derivan de lo anterior son ineludibles. No solo es necesario
incluir todos los parámetros en cualquier descripción adecuada de la forma del clang:
en adición,debemos asumir que cualquier parámetro puede funcionar como el
determinante primario de la forma en un clang –aunque solo sea porque es posible
reducir a cero el grado de articulación de todos los otros parámetros en el clang.
En la Sección II, traté de demostrar la gran importancia funcional de la semejanza
como factor de cohesión dentro de un clang o secuencia. En la mayoría de las
configuraciones musicales, uno o más parámetros cambian relativamente poco,
dentro de los limites de cualquier configuración, y son estos parámetros que no
cambian los que dan a este clang o secuencia su unidad y singularidad –siendo la
duración de esta relativa constancia de estos parámetros cohesivos la que establece
las fronteras de cada gestalt. Si nosotros comparamos esto con las observaciones que
se han hecho sobre la determinación de la forma en un clang o secuencia, algunas
relaciones muy interesantes se tornan evidentes. He dicho que el parámetro formativo
en una configuración es usualmente el que cambia más –exhibe el más rápido ritmo
de cambio-- entonces él difícilmente pueda ser, al mismo tiempo, el parámetro que
unifica la configuración por su relativa constancia de valores. Esto es, el parámetro
formativo en una configuración dada es generalmente distinto del parámetro
cohesivo en ésta.
Es más, desde que el contorno morfológico de una secuencia es determinado por las
diferencias paramétricas entre los clangs que la componen, una aún más sorpresiva
relación emerge entre las funciones paramétricas en una secuencia y las de sus clangs
componentes. Esto es, el determinante del contorno morfológico en el clang será
generalmente un diferente parámetro que aquel que determina el contorno
morfológico de la secuencia de la que el clang es parte. Esto deriva del principio
formulado en el parágrafo previo, si este es combinado con ciertos otros principios
desarrollados en la Sección II. Allí, se mostraba que la unidad y singularidad de un
clang dado necesariamente implicaba la segregación de ese clang de otros adyacentes
a él en el tiempo, y que esas dos funciones (unificación y segregación) son cumplidas
por el mismo parámetro –semejanzas en ese parámetro proveyendo la fuerza de la
coherencia interna dentro del clang, y diferencias (en el mismo parámetro)creando
los puntos de división entre los sucesivos clangs. De esta manera, las diferencias
entre clangs, que determinan el contorno morfológico de la secuencia, se manifestara
42
43
generalmente en el mismo parámetro que sirve como determinante de cohesión
dentro de cada clang individual.. Y, desde que el determinante de cohesión, o
parámetro cohesivo, dentro de cada clang debe ser (de acuerdo con el primero de los
dos principios establecidos en la pagina anterior) un parámetro diferente del que sirve
como determinante de la forma en el mismo clang, difícilmente el determinante
formal para la secuencia como un todo sea el mismo parámetro que determina la
forma de cada uno de sus clangs componentes.
Por supuesto, todos estos señalamientos se aplican solo a clangs y secuencias en las
cuales el factor primario de cohesión y segregación es el factor de semejanza. O sea,
no serán aplicables en casos en los cuales los clangs estén organizados
principalmente por los factores de proximidad, intensidad, repetición, predisposición
objetiva y predisposición subjetiva.
Finalmente una excepción obvia a estos principios debe ser mencionada. Este es el
caso en el cual el determinante formal en cada clang de una secuencia es la altura,
pero el rango de variación dentro de cada clang es suficientemente limitado para
permitir cambios efectivos de registro de clang a clang, siendo el perfil de la
secuencia determinado por estos cambios de registro en las alturas. Pero esto es sólo
posible porque el rango potencial total de perceptibilidad en este parámetro es muy
grande –aún más grande tal vez que en cualquier otro parámetro- y, en todo caso,
puede solo ocurrir cuando el rango de variación dentro de cada clang está
relativamente circunscripto. Cuanto más extenso sea el rango cubierto dentro de cada
clang en la secuencia, los cambios de registro de clang a clang devendrán menos
perceptibles, hasta que la altura ya no sea un factor efectivo en el proceso de
determinación formal de la secuencia.
He acentuado repetidamente que la forma de una configuración a un nivel perceptual
es el resultado de cambios o diferenciaciones de alguna clase entre un elemento (o
pequeño componente) y el siguiente elemento dentro de la configuración, porque es
de importancia generalizada en la definición de la forma a cualquier nivel – no solo al
nivel del clang-- y se manifiesta de maneras que pueden no ser obvias en en la
discusión más limitada sobre la forma del clang. Porque, en primer lugar, solo
definiendo la forma de una configuración en términos de intervalos paramétricos y
gradientes, más que de valores paramétricos en si mismos, podemos explicar el
fenómeno de la transposicionabilidad, que es una característica única de las formas
perceptuales en general y de las formas del sonido en particular.
Con respecto al parámetro altura, al menos, es evidente que un clang puede mantener
su identidad morfológica después de ser transpuesto –aún si el original y la versión
transpuesta no tienen ni un elemento en común [16]. Similarmente, dentro de un
cierto rango al menos,los perfiles rítmicos están sujetos a “transposiciones” --es decir,
aumentaciones y disminuciones-- en las cuales únicamente las proporciones entre los
valores paramétricos se mantienen, no los valores en si mismos (es decir, las
duraciones de los elementos). Y yo pienso que esta invariabilidad o reconocibilidad
después de la transposición puede ser encontrada en otros parámetros también si nos
es dada una gran precisión de control sobre esos parámetros como hemos tenido en el
pasado sobre la altura y la duración (una precisión que solo recientemente se hizo
posible sobre estos parámetros por el desarrollo en los medios electrónicos para
generar y grabar sonidos), y una cantidad de tiempo razonable para que nuestras
facultades se acostumbren a esta clase de relaciones.
No estoy sugiriendo aquí que será siempre posible percibir precisas diferencias o
exactas “proporciones” entre diferentes niveles de intensidad o timbre. Estos mismos
conceptos podrían carecer completamente de sentido, desde un punto de vista
auditivo , ya que la percepción de relaciones proporcionales en altura y ritmo es solo
posible porque son fenómenos periódicos. Pero tanta precisión es innecesaria para
apoyar aquí mi afirmación sobre la transposicionabilidad de todos los perfiles
paramétricos –si solo uno esta preparado para incluir rasgos morfológicos menos
detallados dentro de la clase de los invariantes transposicionales. Por ejemplo, el
crescendo-diminuendo , como el que ocurre dos veces en la secuencia de Varese
(Ejemplo 15) es una silueta reconocible, ya sea que se mueva de ppp a p y vuelva a
43
44
ppp o desde mf a ff a mf; (en el ejemplo de la pieza para flauta, una expansión
interválica está también involucrada, sumada a la transposición, pero las
conclusiones serán las mismas en ambos casos)
Esta es con seguridad una manifestación de invariabilidad morfológica –tanto como
lo es el reconocimiento de una estructura melódica especifica en diferentes registros.
La única diferencia realmente esencial entre las dos situaciones es en el rango relativo
de variación en los dos parámetros involucrados – el numero de diferentes niveles
parametricos que pueden ser percibidos , recordados y correlacionados de una manera
especifica. Pero esta diferencia de manera alguna contradice el principio general
sugerido anteriormente – un principio que podría ser abreviado así: la forma
percibida es una función de las diferencias percibidas. La definición de forma en
términos de diferencias entre componentes tiene una segunda aplicación que no fue
explícitamente evidente en las consideraciones tempranas sobre la forma del clang.
La percepción de diferencias envuelve un proceso perceptual de un nivel más elevado
que la mera sensación –a saber comparación-- así que la pregunta acerca de que
factores pueden estar involucrados en la forma musical puede ser traducida: cuales
son las maneras esenciales en que nos es posible comparar dos sonidos o
configuraciones de sonido, ya sea en un inmediato nivel perceptual, o en una escala
temporal más grande, donde la memoria, imaginación, reflexión, etc., podrían
trabajar? Cuando se hace un intento de definir las características morfológicas
esenciales de las secuencias en estos términos, se encuentran dos factores básicos,
mientras que en el problema de la forma del clang un factor parece alcanzar. Uno de
los factores corresponde muy de cerca a lo que esta involucrado en la formación del
clang. Esto es, un aspecto de la forma de la secuencia ( el contorno morfológico, al
que ya nos referimos) puede ser definido en términos de los cambios del estado
paramétrico (quiere decir niveles paramétricos) y otros rasgos estadísticos de clang a
clang, en una manera bastante análoga a la definición de la forma del clang en
términos de los cambios en los valores paramétricos de elemento a elemento. pero en
la secuencia otro factor emerge –resultando de el hecho de que nos es posible
comparar clangs no ya desde sus rasgos estadísticos, sino con respecto a sus rasgos
morfológicos, y las semejanzas o diferencias percibidas de esta manera son un
aspecto esencial de nuestra total impresión de la forma a nivel de secuencia. Deberé
volver a esto en un momento, pero primero alguna clarificación parece deseable
respecto de mi uso del termino estadística.
Cuando hablamos de la altura de una nota en una pieza de música –digamos por
ejemplo, el Fa# del primer clang de la pieza para flauta de Varese-- que es,
objetivamente, a lo que nos estamos refiriendo? Un físico podría responder que este
Fa# es una vibración con una frecuencia fundamental de 370 ciclos por segundo. El
instrumentista que toca la pieza podría afirmar que es el sonido producido por cierta
posición de los dedos en la flauta más una cierta tensión en los labios, diafragma, etc.
Obviamente el instrumentista no esta describiendo el sonido, sino la manera de
producirlo. Pero tampoco es la respuesta del físico una real descripción del sonido. Si
nosotros le decimos que “370 ciclos por segundo” es una abstracción, y lo
presionamos un poco, el podría admitir que su respuesta estaba referida a una medida
que el puede tomar con un conveniente aparato contador de revoluciones, que registra
el numero promedio de vibraciones por segundo en la señal resultante de esa nota.
Fluctuaciones menores en la altura, como el vibrato, o los pequeños portamentos que
con frecuencia ocurren al principio y final de una nota, y (como puede ocurrir en una
nota tocada por un instrumento o coro vocal) vibraciones cuya frecuencia es muy
cercana, pero no idéntica a la frecuencia promedio –ninguno de esos “detalles” son
tomados en cuenta en la designación “370 ciclos por segundo”, ni están indicados por
la notación Fa# en la partitura.
Ahora, si uno mira a los muy interesantes “registros de ejecución” en la Psicología de
la Música de Seashore [17](paginas 35-41, 48-49, 200-203, y 256-272) queda muy
44
45
claro que la “altura de una nota” no es algo simple en la mayoría de la música, y
puede solo ser definida como una clase de promedio estadístico o valor medio de una
cantidad continuamente variable.
En estos gráficos puede verse que esto mismo puede decirse acerca del nivel
dinámico de una nota. Y aún así generalmente nos contentamos con representar esas
cantidades variables con una cantidad fija –una constante-- que no es más que una
medida estadística del sonido en algún parámetro, y empleamos esta representación
tanto en nuestro sistema de notación como en nuestras descripciones verbales de los
eventos musicales.
Podría decirse que nosotros no podemos escuchar esas pequeñas fluctuaciones en la
altura o la intensidad, pero esto es manifiestamente falso. Si nuestra comprensión
auditiva es tal que nosotros no las escuchamos, no es porque no podamos hacerlo,
sino porque nuestra atención esta enfocada en un diferente nivel perceptual – una
diferente escala temporal-- en la cual esas pequeñas variaciones no son relevantes en
la determinación del perfil paramétrico. Estas fluctuaciones en altura e intensidad
influencian el timbre o la calidad de sonido, pero no afectan los contornos de altura e
intensidad como tales. Estos últimos son determinados por los cambios en larga
escala que ocurren, y que serán definidos en términos de los valores sucesivos medios
o promedios en cada parámetro. En general, entonces, podría decirse que los rasgos
morfológicos de un clang serán percibidos como una función de las diferencias entre
los rasgos estadísticos de sus elementos componentes.
Sugiero ahora que esta relación entre lo morfológico en un nivel y lo estadístico en el
nivel inmediato inferior, es también aplicable a la secuencia. Esto es , que el perfil
morfológico de una secuencia esta determinado primariamente por ciertas medidas
estadísticas de los clangs componentes. Estas medidas incluirían los cambios en el
estado paramétrico, o valores paramétricos medios (registro de alturas, tiempo
promedio o densidad temporal, nivel dinámico promedio y densidad vertical , etc.)
desde un clang hasta el próximo, así como también la duración total de cada clang, la
extensión del rango cubierto en cada parámetro, etc. El hecho de que no tengamos
una manera practica de medir estos factores con precisión es desafortunado, pero de
manera alguna invalida su potencial importancia para el análisis musical, ni su
significancia en la percepción musical –y este es el punto más importante, por
supuesto. El oído musical puede “medir” los clangs de esta manera –y obviamente lo
hace-- aún cuando la mente de un analista no puede.[18]
El siguiente ejemplo (Ejemplo 16) debe ayudar a clarificar estos últimos

señalamientos. Es la primera secuencia del cuarto movimiento (Thoreau) de la sonata
Concord de C. Ives, la misma obra de la cual fue derivado el Ejemplo 13 (para el
análisis en el final de la Sección II de este libro). El determinante primario del perfil
morfológico en cada uno de estos tres clangs (indicados otra vez por corchetes) es la
altura, pero como debemos hacer para describir el perfil de la secuencia como un
todo? O más aún, hay una silueta de esta secuencia que es distinta de las siluetas de
los clangs componentes – más que la simple “suma” de las siluetas más pequeñas?
Los cambios en el registro de alturas entre el primer y segundo clang constituyen un
factor determinante que es inmediatamente perceptible cuando escuchamos la
secuencia, un cambio desde un registro más alto en el primer clang a un registro
medio en el segundo y tercer clang.
45
46
Otro importante factor en la delineacion de esta secuencia es la diferencia en el

ámbito o rango de las alturas entre primero y segundo , y segundo y tercer clang –
primero una contracción, después una expansión del rango-- de manera que los
limites inferior y superior de altura en los tres clangs describen un movimiento en el
espacio de las alturas aún cuando (como entre los clangs 2 y 3) un nivel de altura
“promedio” o central puede no mostrar tal movimiento. Un determinante formal
secundario en esta secuencia es la densidad temporal, en cuyo parámetro la silueta de
la secuencia está representada por el cambio de rápido a lento a rápido (es decir de
alta a baja a alta densidad) en los tres clangs.
Cada una de estas características del clang (nominalmente, registro y rango de altura,
densidad temporal) – en termino de los cuales estamos posibilitados de comparar un
clang con otro, y así describir los cambios que ocurren dentro de la secuencia, dando
su contorno morfológico, es claramente un rango estadístico de los clangs, y cada uno
es un muy real aspecto de nuestra inmediata y espontánea percepción de la música.
Mas aún, no seria dificultoso encontrar ejemplos de secuencias en los cuales
marcados cambios tímbricos de clang a clang, o en intensidad, densidad vertical, o
algún otro parámetro, sería el factor responsable por el perfil característico de la
secuencia como un todo. Pero más que perseguir este aspecto del problema, sin
embargo, deberemos notar que hay otro factor envuelto en nuestra percepción de la
46
47
forma en la secuencia de la pieza de Ives –un factor que es bien distinto e
independiente de cualquiera de los rasgos estadísticos de estos clangs. Cada uno de
estos tres clangs muestra una subdivisión en dos o tres partes, y puede verse que la
segunda parte de los clangs 1 y 2 , respectivamente, son idénticos en forma, aunque
difieren considerablemente en el registro de alturas. De manera similar, las ultimas
partes de los clangs 2 y 3 son de silueta casi idéntica, y las primeras partes de los
clangs 1 y 3 son muy similares en su movimiento general hacia arriba, sino en las
particulares relaciones interválicas que contienen.
Estas relaciones morfológicas ( en este caso de identidad o semejanza) entre clangs
componentes (o partes de clangs) en una secuencia constituyen otro factor muy
importante en su caracterización formal, y debe ser consideradas en cualquier análisis
satisfactorio de la forma de la secuencia. Encontramos , por consiguiente, que la
forma de la secuencia puede estar condicionada por dos factores distintos e
independientes, que se corresponden con las dos maneras básicas en que podemos
percibir diferencias entre clangs –esto es, a las maneras en que podemos
compararlos.
Dos clangs pueden ser comparados de acuerdo con sus rasgos ya sea morfológicos o
estadísticos, y una adecuada descripción de la forma de una secuencia puede tener
que incluir ambas clases de diferenciación, aunque una o la otra puedan ser un más
importante factor formal en una secuencia determinada. En cuanto a las variaciones
estadísticas entre clangs sucesivos, poco más debemos decir, desde que las mismas
observaciones hechas sobre la forma del clang se aplicaran también al perfil
morfológico de la secuencia. Yo solo repetiré aquí el más básico principio establecido
con anterioridad en conexión con el clang – que todos los parámetros deben ser
considerados, y que cualquiera de los parámetros puede servir como el determinante
primario de la forma en una configuración musical.
Las relaciones morfológicas entre clangs, mencionadas en la pagina anterior, son la

fuente de una clase de caracterización formal que es única para la secuencia, desde
que no es encontrada a nivel de clang en cantidad significativa. Se pueden distinguir
tres tipos básicos de relación morfológica entre clangs: (1) pueden ser idénticos ( o
casi, es decir, suficientemente idénticos) en forma –con respecto a uno o más
parámetros; (2) pueden ser enteramente diferentes y de forma no relacionada
(también, en uno o más parámetros); y (3) pueden ser parcialmente semejantes, o de
forma relacionada –revelando o implicando alguna clase de transformación
morfológica, por medio de la cual un clang fue (o podría haber sido) derivado del
otro. Llamaré a la primera de estas relación isomórfica, a la segunda relación
heteromórfica, y a la tercera relación metamórfica, todos estos términos siendo
entendidos en referencia a especificas siluetas paramétricas, excepto tal vez en los
casos excepcionales en que todos de los varios perfiles paramétricos de los dos clangs
exhiben la misma relación, o en el cual es claro que un solo parámetro esta siendo
considerado. Estas designaciones pueden ser aplicadas no solo a clangs sucesivos,
sino a cualquier par de clangs, más allá de donde ellos ocurran en una pieza de
música. En adición, pueden con frecuencia ser utilizadas para caracterizar la
secuencia completa, definiendo lo que pudiera llamarse su tipo morfológico –
siempre que la secuencia involucre relaciones internas de una clase consistentemente.
Muchas secuencias, por supuesto, incluirán más de una clase de relaciones
morfológicas entre sus clangs componentes, y estas podrían llamarse tipos
compuestos –aunque una descripción plena de sentido de este aspecto de la forma de
la secuencia en estos casos podría todavía requerir una especificación de las
relaciones particulares incluidas en esa secuencia.
En términos de las definiciones anteriores, la secuencia Barroca seria una secuencia

isomórfica –con respecto a la altura,al menos. por contraste la mayoría de las
secuencias en la temprana música “atemática” de Schoenberg y Webern, son, por
47
48
supuesto, e intencionalmente, heteromórficas en la mayoría de los parámetros,
aunque no siempre. En la pieza para piano Opus 11 número 3 de Schoenberg, por
ejemplo, los contornos de altura y las siluetas dinámicas son casi todas
heteromórficas, a través de toda la pieza, no solo en una secuencia, y aún así las
relaciones rítmicas ( es decir las relaciones morfológicas entre los varios perfiles del
parámetro duración) son casi todas isomórficas o metamórficas, desde que todas
pueden ser relacionadas (por medio de varios tipos de transformación) con dos o a lo
sumo tres “siluetas básicas” escuchadas en los primeros compases de la pieza. (Véase
el Ej. 17 para las transformaciones de una de estas siluetas).
Finalmente, es evidente que las relaciones isomórficas con respecto a este aspecto del
parámetro altura que es independiente de la transposición de octava (es decir altura
relativa [pitch chroma] como opuesto al más indefinido altura absoluta [pitch eight]
(ver NT al pie de la pag.) están destinados a ocurrir muy a menudo en la sistemática
música dodecafonica de Schoenberg, Webern, Berg y otros, aunque la situación se
complica considerablemente aquí por el hecho de que los limites actuales del clang en
esta música no coinciden necesariamente con idénticas porciones (o formas) de las
series ( de manera tal que seria posible, escribiendo en los 12 tonos, evitar relaciones
isomórficas por completo). Por la misma razón, los dispositivos isorítmicos de la
música temprana del Renacimiento podrían resultar en secuencias isomórficas con
respecto al parámetro duración, aunque no lo necesiten. Con mucha frecuencia no lo
hacen, y esto es simplemente porque los patrones rítmicos no siempre coinciden con
los agrupamientos gestálticos (clangs) que son percibidos, sino que más bien se
superponen a estos de varias maneras.
Relaciones isomórficas y heteromórficas representan dos polos opuestos – dos limites
externos, de completa semejanza y completa diferencia entre clangs, y debe esperarse
que el mayor numero de secuencias y las relaciones morfológicas más frecuentes
entre clangs, caerán en alguna parte entre estos dos extremos, dentro de la clase de las
relaciones metamórficas. Diferentes tipos de relaciones metamórficas podrían
definirse por referencia a las varias clases de transformaciones morfológicas que
pueden ser aplicadas al clang, produciendo un nuevo y diferente clang el cual aún
conserva una similitud aloriginal como para ser percibido como una variación de éste.
Esta clase de transformaciones incluirán, por ejemplo, (1) Expansiones o

contracciones de intervalos entre los elementos de un clang (sin alterar sus esenciales
rasgos “topológicos” es decir, la distribución de los valores paramétricos relativos
máximos, mínimos e intermedios en el perfil). (2) Formas reflejadas (inversión,
retrogresión, inversión retrograda) de una o más siluetas paramétricas de un clang.
(3) Extensión o Compresión del clang, por medio de (a) Interpolación o elisión de
elementos ( es decir, extensión o compresión internas), o (b) la adición o
superposición de elementos, o su substracción (es decir, extensión o compresión
externas; y (4) permutación del orden vertical o distribución de elementos
concurrentes, y aún tal vez permutaciones del orden temporal de los elementos o
partes más grandes dentro de un clang –aunque esto ultimo no es estrictamente una
transformación morfológica, a menos que las partes así permutadas representen,
sustancial y morfológicamente concluyentes porciones del clang original,
constituyendo de esa forma, en si mismos, clangs.
NT : Pitch chroma: de chroma= color. Organización circular de las alturas por octavas
Pitch Eight: el continuum de las alturas desde lo más grave a lo más agudo
48
49
Ejemplos de estas transformaciones morfológicas son tan numerosas en la literatura

del análisis musical que no seria necesario ilustrarlas aquí. Las he listado meramente
para dar una indicación de la gran variedad de transformaciones que pueden ser
incluidas en la simple categoría de relaciones metamórficas – y mi lista
probablemente no es completa. Mi intención primaria, sin embargo, no es clasificar,
sino clarificar, y el primer paso en dirección a la claridad es la diferenciación de un
gran campo de posibilidades en sus partes reales e importantes –lo que significa aquí
la definición o delineacion de todos los factores esenciales e independientes que
puedan estar involucrados en el campo aún más
grande de la forma musical
Hay otro lado de la relación entre la forma de la secuencia y las formas de sus clangs
constitutivos, que no ha sido tenida en cuenta por las definiciones anteriores de
relaciones y transformaciones morfológicas. El proceso perceptual presupuesto allí
era – como en el caso de la forma del clang-- un proceso de comparación, pero es
claramente una facultad más abstracta e intelectual la que está involucrada , una que
depende de la memoria y la imaginación. Para que un clang dado pueda ser
escuchado como relacionado morfológicamente a otro clang en estos términos
significa que ambos deben estar “presentes” en la mente en su forma más o menos
completa – es decir, ellos deben haber ocurrido y pasado (devenidos pasado), y deben
ser, al momento de la comparación, imágenes almacenadas, independientes del orden
49
50
temporal en que ocurrieron originalmente. Este no es, sin embargo,la única manera en
que la forma de un clang es percibida, ni es la única forma en la cual los rasgos
morfológicos de una serie de clangs pueden afectar la forma de la secuencia que los
contiene. Esto puede tal vez ser clarificado por las siguientes consideraciones.
La forma percibida de un clang debe incluir ambos aspectos, el “dinámico” y el
“estático”, de acuerdo a si estamos viéndola desde un punto de vista de la inmediata,
progresiva experiencia temporal que tenemos de esta forma, o en términos de la
anteriormente mencionada – comparación de memoria que es necesariamente
independiente de la experiencia temporal original. La primera esta relacionada a
nuestra respuesta kinestésica directa, siempre más o menos nítidamente enfocada en
el presente inmediato.
Cada momento se define a si mismo, pero todavía cada uno esta dejando paso al
próximo momento en el tiempo. Por otra parte, aunque cada evento momentáneo
pasa, para ser reemplazado por un nuevo evento, aquellos en el pasado no están
perdidos irremediablemente para nosotros. Estos pueden ser retenidos y guardados en
la memoria por tiempo indefinido, durante el cual ellos se mantienen más o menos
disponibles para comparación con eventos posteriores – un proceso que trasciende los
aspectos puramente temporales de la experiencia original. Esto viene a ser una clase
de “destemporalización” de las imagenes musicales, y, aunque uno debiera dudar
antes de llamar a esto por lo tanto una “espacialización” de estas imágenes –tiene
ciertos rasgos en común con la percepción espacial. Solo en la memoria podemos
percibir cualquier moderadamente complejo o extenso clang “de una vez”, como un
todo –y todavía nosotros estamos posibilitados a hacer esto en una manera similar a
lo que es nuestra percepción de las estructuras visuales. Por esta razón no parece
enteramente inapropiado emplear términos que están derivados de lo visual u otros
ámbitos de la experiencia, como silueta, estructura , perfil, etc. --tanto como
reconozcamos que estos representan, como mucho, meramente un aspecto de nuestra
percepción de las estructuras temporales.
Para aquel otro aspecto de la forma percibida del clang que es específicamente
relacionada con la inmediata progresión temporal, nosotros necesitamos otros
términos que –aunque puedan ser tomados de otros campos extra-musicales-- se
relacionarán por lo menos con el aspecto dinámico de la experiencia musical de la
misma forma en que silueta y estructura se relacionan con el aspecto estático. Para
estas características dinámicas de la forma del clang, las palabras gesto y movimiento
parecen apropiadas.
El concepto de forma del clang incluirá entonces a ambos, silueta y gesto, estructura
y movimiento, lo estático y lo dinámico – como polos positivo y negativo de un
espacio descriptivo, ninguno de los cuales puede representar el campo total, ya que
ambos son necesarios para cualquier descripción completa.
La pertinencia de todo esto respecto al problema de la forma de la secuencia puede
ser ilustrada considerando una manifestación del aspecto dinámico de la forma del
clang, a saber, la direccionalidad implícita en un gesto. Una conjunción de dos clangs
en los cuales sus características gestuales (simbolizada por la flecha bajo el clang)
están relacionadas como en la trama idealizada en la Figura 13 tendrán un muy
distinto efecto sobre la forma de la secuencia percibida de la que tendría la que se
muestra en la Figura 14. En el primer caso, la dirección del movimiento en el clang 1
mitigara considerablemente la discontinuidad que marca el corte entre los dos clangs,
mientras que el efecto en el segundo caso será el de enfatizar el contraste entre ambos
–aún cuando los intervalos diferenciadores entre los clangs sean iguales en ambas
instancias ( como se puede medir desde el fin del primer clang hasta el principio del
segundo; si valores paramétricos medios se usan como medida, las magnitudes
interválicas estarían en una relación inversa con las discontinuidades percibidas). la
diferencia esencial entre las dos situaciones reside en las relaciones entre la dirección
del gradiente en el primer perfil paramétrico (en cada ejemplo)y la dirección del
intervalo entre los perfiles de los clangs 1 y 2. Y en general, puede decirse que el
grado de contraste efectivo entre dos clangs (con respecto a un parámetro dado)
50
51
depende tanto de la dirección del gradiente inicial como de la magnitud del intervalo
que separa los dos clangs. Y este “grado de contraste efectivo” entre dos sucesivos
clangs en una secuencia es la medida apropiada del perfil secuencial en ese punto –
suplementando o reemplazando la más simple medición del cambio en el estado
paramétrico.
He relacionado este factor de direccionalidad con la materia de la morfología del
clang, aunque parece también tomar parte de las características de la estadística del
clang – y aquí tal vez tengamos un fenómeno fronterizo en el cual mis tempranas
diferenciaciones entre lo morfológico y lo estadístico empiecen a quebrarse. sin
embargo, estas diferenciaciones han demostrado ser útiles hasta este punto, ayudando
a descubrir diferentes factores que contribuyen a las características formales de la
secuencia, y no veo razón para abandonarlas porque aparezca un factor que pertenece
a ambas categorías. Estos dinámicos aspectos de la morfología del clang -y la
secuencia-- pueden, en efecto, ser interpretados como factores transicionales, que
llenan un vacío que parece haber entre los temporales, más puramente sensoriales
aspectos de la percepción musical, y el “atemporal”, mnemotécnico, más intelectual
aspecto de la experiencia musical. El hiato entre estos dos ámbitos, que parece
levantarse tan inevitablemente en la mayoría de las psicologías y filosofías, es tal vez
algo que esta en la naturaleza misma de la actitud básica hacia la experiencia
involucrada en estas disciplinas, más que en la naturaleza de la experiencia en si
misma.
Debemos hacer ahora dos diferenciaciones adicionales respecto de los tipos básicos
de secuencia. La primera de estas envuelve la percepción de aquellas en su dimensión
temporal, la segunda relacionándose más con las características verticales de su
estructura. En la Sección I, la secuencia fue definida como “ una sucesión de
clangs....constituyendo una estructura (gestalt) musical en un nivel perceptual más
grande de la escala temporal“. Implícitas en esta definición están (1) algún grado de
unidad –aunque la secuencia estará, frente a la percepción, menos unificada que el
clang, y (2) una articulación temporal entre distintas partes –los sucesivos clangs--
cuya unidad y relativa segregación dentro de la secuencia están determinados por los
factores gestálticos descriptos en la Sección II. Mayormente, los factores
responsables de la delineación de los clangs son “objetivos”, en el sentido de que
pueden ser referidos a características perfectamente objetivas de la música misma.
Esto es, no son arbitrarios, y uno puede predecir con razonable certeza exactamente
donde la mayoría de las personas percibirán los límites de los clangs. Hay algunas
significativas excepciones a esto, no obstante, que llamaré secuencias monomórficas,
y estas excepciones constituyen una clase de configuraciones musicales a este nivel
que deben ser distinguidas de las secuencias polimórficas conque hemos estado
trabajando hasta ahora.
Una de las cosas que debemos asumir, en cualquier tentativa de describir la
organización y percepción musical en términos de la concepción gestáltica, es que
existen algunos limites aproximados de duración más allá de los cuales un sonido o
configuración de sonido no será escuchado como una Gestalt auditiva instantánea –
esto es, no será percibida como un clang.
Si la duración de un sonido es demasiado corta –digamos, menos de medio segundo--
el sonido difícilmente se escuchara como un clang individual, sino que devendrá un
elemento dentro de un clang más grande.[19]. Similarmente, una configuración de
sonido que dure más de algunos segundos será separado en algunos clangs más cortos
por el oyente, y entonces oída como una secuencia. Estos limites de duración
obviamente varían, dependiendo de factores tales como la relativa complejidad o
simplicidad de las configuraciones en si mismas, y de todos los factores gestálticos
discutidos en la Sección II, de manera que no hay motivo para tratar de designar
algún valor concreto a los limites inferior y superior de este rango. Pero es evidente
que, aunque sean variables, hay regiones limitantes de este rango, y estas deben ser
reconocidas en nuestras definiciones.
Considere entonces los siguientes ejemplos, que representan dos clases de secuencias
monomórficas. En el primero, Ejemplo18, el sonido designado como c (en el tercer
51
52
pentagrama) es sostenido durante tanto tiempo que no puede ser llamado simplemente
un clang –aunque el termino clang resonante podría parecer una descripción
adecuada de su carácter musical. Su función, así como su duración, proporcional a la
de una secuencia, con una silueta conformada solo por cambios en timbre e
intensidad (cambios en el primero de estos parámetros solo ocurren algunas paginas
más tarde en la partitura). Es, por supuesto, una parte subordinada de la trama musical
total, pero esto no nos concierne aquí, desde que las definiciones originales de clang y
secuencia no aluden a la relativa importancia de las partes sino simplemente a la
delineación de estas dentro de la textura de una pieza musical.
El Ejemplo 19 muestra otra clase de secuencia monomórfica, en la cual los cambios

en sonoridad son tan continuos que los “limites” de formación de unidades en el
orden de los clangs pueden ocurrir casi en cualquier parte –es decir, la organización
perceptual no parece ser determinada por ninguna de las características objetivas de la
pieza en si. Aún así la configuración es tan larga que la subdivisión debe ocurrir en
alguna parte, y los agrupamientos que resulten probablemente coincidirán con la
ascensión y descenso de la agudeza atencional del oyente. La estructura musical de
secuencias como esta, es como si estuviera compuesta de una extensa sucesión de
elementos, más que de una sucesión de clangs, aunque esto no es más que una muy
imprecisa manera de describir el proceso, y no aplica para el tipo de secuencia
monomórfica que resulta de la resonancia del clang, como en el Ejemplo 18.
En cualquier caso, tanto el ejemplo de Ives como el de Schoenberg tienen al menos
esto en común: son configuraciones de sonido extensas, del orden de duración de las
secuencias, en las cuales cualquier agrupamiento perceptual o subdivisión en
unidades tipo-clangs es casi enteramente arbitraria o subjetiva, no dependiendo de
ninguna claramente definida característica objetiva de las configuraciones en si
mismas. Esta ultima declaración puede ser tomada como la definición de la secuencia
monomórfica – un tipo de configuración a ser considerado como un excepcional o
especial caso de la más general clase de las secuencias. El caso típico,por otra parte,
será la secuencia polimórfica, y la definición de secuencia dada en la Sección I debe
ser comprendida para aplicar sólo a estas ultimas.
52
53
Obviamente , la forma de una secuencia monomórfica no involucrará las relaciones
morfológicas entre clangs constituyentes que se describiera previamente –pero tendrá
todavía un total contorno morfológico o perfil, determinado por los cambios en los
valores paramétricos de un momento (o elemento) al próximo en la secuencia.
La segunda distinción con respecto a tipo y función al nivel de secuencia ha sido ya
hecho o implicado en una parte previa de este libro –durante el análisis del pasaje de
Ives (Ejemplo 13) en el final de la Sección II. Hay allí una distinción entre secuencias
monofónicas y polifónicas que fue empleada en la discusión, aunque no di ninguna
definición explícita de los términos, asumiendo que los significados esperados
pueden fácilmente ser deducidos del ejemplo musical en si. aquí trataré de definir
estos dos términos de una manera que sea consistente con el uso de ellos hecho
anteriormente, y se verá que yo los interpreto de alguna manera más amplia de lo que
lo son en la teoría musical tradicional.
Por secuencia monofónica entiendo aquella en que los clangs se perciben de a uno
por vez –aún cuando clangs sucesivos no están simplemente conectados final-a-final,
sino ensamblados o superpuestos hasta cierto punto. En una secuencia monofónica,
estas conexiones superpuestas sirven primariamente para proveer una mayor
continuidad a la configuración –para mitigar los efectos algo mecánicos de la simple
yuxtaposición. La secuencia es todavía monofónica tanto así como la atención esté
dirigida esencialmente a un clang en cada momento dado. Pero si el grado de
superposición de los clangs componentes aumenta al punto de que la secuencia ya no
es escuchada de esta singular manera –la atención dividiéndose o distribuyéndose
ahora entre dos o mas clangs simultáneamente en ciertos momentos-- entonces la
secuencia deviene polifónica, como en la secuencia de Ives estudiada al final de la
Sección II, o el ultimo pasaje de Schoenberg exhibido (Ej. 18), donde tres distintos
estratos están sonando simultáneamente a veces. No es simplemente una cuestión de
complejidad incrementada de los materiales sonoros lo que esta involucrado aquí,
sino más allá el uso de ciertas técnicas de diferenciación polifónica de estos
materiales – por vía de los mismos factores gestálticos de cohesión y segregación
descriptos en la Sección II.
Una verdadera situación polifónica no es necesariamente creada por la adición de
53
54
nuevas partes a una textura, porque estas pueden simplemente ser absorbidas por las
otras en una sucesión de clangs que deviene más y más compleja, pero no menos
singular. Tiene que haber fuertes diferenciaciones entre las partes de una textura
polifónica para que esta sea percibida como tal, y desde que el factor de proximidad
no puede jugar un rol aquí (polifonía implica una independencia de partes sonando
simultáneamente, como se noto más temprano)-- el factor de semejanza es
virtualmente el único que puede efectuar estas diferenciaciones polifónicas. Esto es,
tiene que haber claramente perceptibles diferencias paramétricas entre las secuencia
monofónicas individuales, y un relativamente alto grado de semejanza paramétrica
dentro de cada una, antes de que la secuencia como un todo pueda ser escuchada
polifónicamente.
La musica del Siglo XX provee muchos ejemplos de esta clase de compleja polifonía
–en la cual cada una de las lineas individuales (es decir secuencias monofónicas) es
compleja en si misma, en comparación con música más temprana. Y aún así las
secuencias polifónicas no se encuentran con tanta facilidad como uno pudiera
imaginar,considerando la preponderancia de más complejas texturas en la música de
nuestro tiempo.
Música aparentemente polifónica es con frecuencia bastante monofónica de hecho, a
pesar de su complejidad o, como parece a veces, a causa de ella, porque lo que uno
realmente percibe escuchando la música es esencialmente una sucesión de clangs
individuales, algunos más complejos (en su estructura vertical) que otros, pero uno en
cada momento, a pesar de todo, como en el Ejemplo 20. aquí, las nuevas partes
54
55
introducidas en imitación contrapuntística (compases 3 y 4) ciertamente no serán
aprehendidas como distintos clangs.
Más bien, lo que será percibido, en cada una de estas entradas, es simplemente una
intensificación –por medio de un incremento en la densidad vertical de la sonoridad
del clang individual.
Yo no quiero insinuar aquí que esta monofonía es indeseable, ni siquiera que la
polifonía como la hemos definido es deseable o necesaria en la música, sino
simplemente que uno debería estar preparado para distinguir una de la otra en una
manera que sea consistente con nuestra experiencia musical actual. creo, sobretodo,
que el desarrollo de una polifonía de más alto grado como la que hemos estado
describiendo constituye una de las más importantes características de la música de
principios del Siglo XX, y que las casi ilimitadas posibilidades de desarrollo en esta
dirección representan uno de los más excitantes aspectos de la música de nuestro
tiempo –mediados del Siglo XX.
Lamentablemente, una minuciosa examinación de estas posibilidades me llevaría
mucho más allá de los limites de este libro –igual que lo haría un más detallado
estudio de muchos otros problemas de la forma musical. Un comienzo es todo lo que
se ha intentado aquí, y un bosquejo provisorio de soluciones posibles a los más
inmediatos problemas que se presentan en el estudio de la forma musical. Es posible
que muchas de las más importantes preguntas no se hayan formulado aún, y mucho
menos contestado. Y no hay duda en mi mente acerca de que algunas de las ideas
presentadas aquí no resistirán la más severas pruebas en su aplicación practica sin, al
menos, algunas modificaciones y revisiones. Parece estar en la misma naturaleza de
la experiencia musical el resistir nuestros instintos de racionalización, y contradecir
nuestras teorías.
Pero la prueba final para cualquier concepto – y la única fuente valida de alguna
lógica-- debe ser la experiencia en si misma, y una teoría musical que no mantiene
una conexión vital y directa con la experiencia musical no se puede esperar que
sobreviva por mucho tiempo. Yo solo espero que las observaciones hechas en este
libro puedan ser útiles en clarificar algunos de los problemas que conciernen al
músico del presente, y que provean un marco de trabajo conceptual suficientemente
amplio y profundo, para construir la base de más refinadas técnicas de análisis y
descripción musical –y, eventualmente tal vez, de la composición musical en si
misma.
55
56
Notas Finales
1. Schoenberg, Estilo e Idea, Faber & Faber, London, 1975, pag. 216-217
2. Nótese que los parámetros listados aquí son específicamente parámetros

musicales
--atributos del sonido percibido que son las “subjetivas” contrapartes de los
parámetros acústicos o físicos (frecuencia, amplitud, forma de onda, etc.). La palabra
parámetro, cuando se use de esta manera, se referirá siempre al parámetro musical,
más que a su correspondiente parámetro acústico.
3. Esto no pretende significar que hay siempre un más rápido ritmo de cambio en la
música, sino simplemente que estos pueden ocurrir y lo hacen con frecuencia.
4. Obra citada, pag. 240
5. Routledge & Kegan Paul Ltd., London, 1962.
6. En “Physical Gestalten”, pag. 17, impreso ahora en: A Source Book of Gestalt
Psychology, editada por Willis Ellis, Humanities Press, New York, 1967
7. Especialmente su libro, A la Recherche d'une Musique Concrète, Editions du

Seuil, Paris, 1952
8. Disponible en traducción al inglés en A Source Book of Gestalt Psychology,

editada por Willis Ellis, Humanities Press, New York, 1967, el que también incluye
algunos escritos tempranos de Köhler que son interesantes desde un punto de vista
teórico.
9. Vea los listados de estos autores en la bibliografía de pag. 96.
10. Una escala ordinal representa un “ordenamiento clasificatorio” de magnitudes

relativas de un atributo, un ordenamiento que implica las distinciones “más grande
que” y “menos que” (indicados en la escala por desplazamientos hacia arriba o hacia
abajo respectivamente) pero no se propone mostrar cuanto más grande, o menor,
puede ser un punto en la escala con respecto a otro.
11. Koffka, obra citada, pag. 186-209.
12. Las relaciones que pueden ser descriptas muestran características que indican
que alguna clase de “teoría de campo” podría proveer una base para la definición de
los rasgos esenciales de este factor –más específicamente alguno de los conceptos del
“campo topológico” introducidos en la Psicología por Köhler, Koffka y Lewin. Los
conceptos de la teoría de la información podrían también proveer esta base, tal vez
aún en combinación con el concepto de campo, y esto podría estar relacionado con
los otros factores cohesivos en maneras sugeridas en la pag. 36, Sección II. Todo esto
es pura especulación de mi parte, por supuesto, pero a veces tiene sentido señalar
posibilidades en la dirección de las relaciones más grandes, aún cuando estas no
hayan sido todavía claramente formuladas.
13. Para un repaso de esta teoría, y los conceptos de la teoría de la información en

general, remitirse a On human comunication de Colin Cherry, The M.I.T. Press,
Cambridge,1978.
14. Compare las implicaciones de “segregación” en la Sección II, con los siguientes
señalamientos de Wertheimer (obra citada, pag. 88): “ Cuando un objeto aparece
sobre un campo homogéneo debe haber una diferenciación en el estímulo para que el
56
57
objeto pueda ser percibido. Un campo perfectamente homogéneo aparece como un
“campo total” [Ganzfeld], oponiéndose a la subdivisión, desintegración,etc.”
15.El termino intervalo paramétrico será usado aquí para referirse a una medida
aproximada de la relación entre dos valores (en cualquier parámetro, no sólo la
altura) – especialmente cuando el cambio de un valor a otro es discontinuo. Un
intervalo paramétrico será por lo tanto definido por una magnitud relativa y un
“sentido” de dirección –por ejemplo hacia arriba o hacia abajo en esa escala
paramétrica. La palabra gradiente se referirá a cambios continuos (paulatinos),
También definidos por una magnitud (el indice de cambio o “pendiente”) y una
dirección (positiva o negativa) exhibida por un segmento dado del perfil paramétrico.
16. Esta posibilidad de la figura melódica de ser transportada era en efecto uno de
los principales atributos de esta particular “Gestaltqualität” (a saber: silueta o forma)
señalada en 1890 por von Ehrenfels, un precursor de Wertheimer y Köhler en el
desarrollo temprano de la Psicología de la Gestalt. Para una descripción de la
contribución de von Ehrenfels a la teoría de la Gestalt, véase la Introducción a la
Psicología de la Forma de Köhler, pag. 102 a 104.
17. Dover Publications, Inc., New York, 1967.
18. El concepto de Heinrich Schenker “campo medio” (y tal vez también “fondo”)
puede ser considerado un tipo especial de contorno morfológico “a nivel de
secuencia” --implicando el parámetro altura, y representando una de las muchas
medidas posibles de “diferencias estadísticas” entre configuraciones musicales
sucesivas, que determinan la silueta de la próxima configuración mayor.
19. Si este sonido fuera separado –por silencios-- de los sonidos inmediatamente
anterior y posterior, podría muy bien percibirse cono un clang completo, pero en
este caso los silencios deben ser interpretados como elementos reales del clang,
de manera que su duración ya no estará fuera del rango normal de duraciones
dentro del cual gestalts auditivas pueden ser percibidas como tales.
57
58
Glosario
Una revisión de los más importantes términos y definiciones
CLANG. Un sonido o configuración sonora que es percibida como una unidad

musical primaria o Gestalt (estructura) auditiva. El concepto de clang constituye el
núcleo y centro –de hecho el esencial “alma y corazón” del total del “encuadre
conceptual” propuesto en este libro.
CLANG—RESONANCIA. El sostenimiento o repetición de un clang más allá de los

límites normales de duración de un clang (durando, esto es, más que algunos
segundos), resultando en un tipo de secuencia monomórfica.
CLANG RESONANTE. Una suerte de fenómeno fronterizo –entre el clang y la

secuencia-- similar al clang en muchos aspectos, pero que dura tanto que funciona
como secuencia (monomórfica), más que como un clang real.
COHESION Y SEGREGACION, FACTORES GESTALTICOS DE. Fuerzas (o

condiciones facilitantes) que determinan la organización perceptual – es decir, la
unificación interna y mutua separación-- de clangs y secuencias. Los factores
primarios son proximidad y semejanza, los factores secundarios son intensidad,
repetición, predisposición objetiva, predisposición subjetiva.
CONTORNO MORFOLOGICO O PERFIL. Estos términos han sido usados aquí

para referirse a aquel aspecto de la forma que deriva de los cambios en los valores
paramétricos de un elemento a otro en el clang, o los cambios en el estado
paramétrico de un clang al otro en una secuencia. Se lo asume como una clase de
síntesis de todos los varios (individuales) perfiles paramétricos de un clang o
secuencia, y –para la secuencia-- está destinado a ser diferenciado del tipo
morfológico, que se refiere a las relaciones formales especificas entre los clangs
componentes.
DENSIDAD TEMPORAL. Uno de los siete parámetros musicales más

frecuentemente mencionados en este libro; una medida de la velocidad relativa de
alteración paramétrica en un clang (o secuencia), o el numero de elementos sucesivos
que pueden distinguirse en la unidad de tiempo.
DENSIDAD VERTICAL. El numero de elementos simultáneos perceptibles en un

momento dado en un clang.
DETERMINANTE DE COHESION. El parámetro (o parámetros) en el cual el factor

de semejanza se manifiesta, en un clang o secuencia dados; usualmente el parámetro
que cambia menos –manteniendo valores paramétricos relativamente constantes--
dentro de los límites de la configuración.
DETERMINANTE DE FORMA. Generalmente el parámetro (o parámetros) que

sobrelleva el más rápido ritmo de cambio –el más alto grado de articulación-- en un
clang o secuencia dados, siendo de esta forma el sujeto del más directo y agudo
enfoque paramétrico del oyente. Este parámetro determinante de la forma es
usualmente distinto del que determina la cohesión del mismo clang o secuencia,
desde que este ultimo es necesariamente constante, o casi.
DINAMICA. Esta palabra la he utilizado en dos diferentes maneras. A veces usé el

termino “nivel dinámico” -- en lugar de “nivel de intensidad”-- para referirme a algún
58
59
valor en ese parámetro, de acuerdo con el uso musical tradicional. En la Sección III,
sin embargo, es usada en el sentido más general, comparativamente “estático”, para
describir aquel aspecto de la percepción musical que está inmediatamente ligado al
orden temporal de la experiencia musical, envolviendo de este modo gesto y
movimiento (como opuestos a silueta y estructura)
DIRECCIONALIDAD. Dícese de aquel aspecto de un clang o secuencia en el cual

un continuo incremento o reducción en los valores de un parámetro produce la
impresión de un movimiento hacia arriba o abajo en la altura, intensidad, tiempo etc.
--es decir, en alguna escala paramétrica.
El termino “direccionalidad singular” fue usado también en la Sección I para referirse
al hecho de que se asume que cada escala paramétrica tiene una implícita y
“absoluta” dirección hacia arriba y hacia abajo asociada consigo misma, relacionada
con incrementos o reducciones en la intensidad paramétrica.
ELEMENTO. Una parte componente de un clang, que puede tanto ser una de algunas
partes sucesivas –correspondiendo a la articulación interna del clang en el tiempo – o
una de un numero de lineales partes simultáneas –con la misma duración que el clang
como un todo. De esta manera, un elemento podría contener elementos más
pequeños. En adición, un elemento se asume como una unidad auditiva –como es el
clang-- siendo la única diferencia básica entre ambos el grado en el cual un elemento
es “absorbido” en la configuración más grande de la cual es parte.
ENVOLVENTE, o ENVOLVENTE TEMPORAL. La silueta de las formas del

ataque y declive de un sonido, con respecto a los cambios en la amplitud. Como un
parámetro musical, sin embargo, la percepción de la envolvente temporal de un
sonido elemental se relaciona más con la impresión de la cualidad tonal o timbre, que
con el parámetro intensidad.
EQUIVALENCIA y el “PRINCIPIO DE EQUIVALENCIA”. Estos términos son

usados en la Sección I, en referencia a “el potencial igual de cualquier sonido usado
como un elemento básico (o irreductible) de una idea musical (es decir de un clang).
Esto no significa una equivalencia de efecto musical o carácter, sino una
“equivalencia material” en el sentido de que cualquier sonido puede ocurrir dentro de
un clang, como un elemento.
ESCALA PARAMETRICA. Una escala ordinal –por ejemplo, una que da un

ordenamiento de rango de magnitudes relativas de algún atributo, envolviendo
diferenciaciones tales como “más grande que” o “menos que” ( indicado en la escala
por desplazamientos o ubicaciones más arriba o más abajo, respectivamente) pero
que no indica cuanto más grande o menor un punto de la escala será en relación con
otro.
ESCALA TEMPORAL .Termino usado como sinónimo de NIVEL PERCEPTUAL

para referirse a diferencias entre la organización gestáltica y percepción de
configuraciones del orden de los pocos segundos o menos de duración (como el
clang), y de aquellas que abarcan periodos más largos y por lo tanto deben ser
aprehendidas como gestalt de manera menos inmediata ( a saber, la secuencia, así
como también secciones más largas y aún piezas enteras) –aunque ellas pueden ser
aprehendidas de este modo a pesar de todo, aunque sólo fuera por medio de
facultades intelectuales de un orden más elevado, como la memoria.
ESTADO PARAMETRICO. Una medida aproximada del promedio, o valor

intermedio, de todos aquellos en el perfil paramétrico de un clang. Es por lo tanto uno
de los principales rasgos estadísticos de un clang. --constituyendo los cambios en el
estado paramétrico entre un clang y el próximo la base del contorno morfológico de
la secuencia.
59
60
FACTOR DE INTENSIDAD. Uno de los factores gestálticos secundarios de

cohesión y segregación descriptos en la Sección II, referida a la tendencia de un
sonido acentuado a ser oído como el principio de un grupo. Las intensidades relativas
de varios elementos simultáneos en un clang (o de varias secuencias monofónicas en
una secuencia polifónica) es también determinante del foco textural (ver pag. 41
Sección II para una completa exposición de los efectos de este factor.
FACTOR DE PROXIMIDAD. Uno de los factores primarios de cohesión y

segregación de la Gestalt, descripto en la Sección II, y formulado allí como sigue: “
en cualquier grupo de sonidos (elementos o clangs) aquellos que son simultáneos o
contiguos (en el tiempo) tenderán a formar grupos perceptuales (clangs o secuencias),
mientras que una relativamente mayor separación en el tiempo producirá
segregación.--siendo otros factores iguales.
FACTOR DE REPETICION. Uno de los factores secundarios de cohesión y

segregación: “Si una repetición del perfil paramétrico es percibida dentro de una serie
de elementos sonoros, esto por si solo puede producir una subdivisión de la serie en
unidades correspondientes a la silueta repetida –con la separación perceptual entre las
unidades ocurriendo en el punto exacto anterior al primer elemento repetido.
FACTOR DE SEMEJANZA. Uno de los factores gestálticos primarios de cohesión y

segregación descriptos en la Sección II, y formulado allí de la siguiente manera: “ En
cualquier grupo de elementos sonoros (o clangs), aquellos que son semejantes (con
respecto a los valores de algún parámetro) tenderán a formar clangs (o secuencias),
mientras que una relativa desigualdad producirá segregación –siendo otros factores
iguales”. El factor de semejanza es tal vez el más importante de todos los factores
gestálticos descriptos, porque (1) Se aplica a todos los parámetros (siendo llamado
aquel en el cual este factor se manifiesta parámetro cohesivo) – y aún a atributos de
un orden más alto como silueta y forma; (2) es eficaz en muchos niveles perceptuales
o escalas temporales, desde elementos y clangs hasta movimientos completos y
piezas; y (3) puede funcionar en lo horizontal (es decir en lo temporal) y en lo
vertical, y es el factor más efectivo en las diferenciaciones necesarias en toda textura
polifónica.
FACTORES GESTALTICOS. Ver COHESION Y SEGREGACION.
FOCO PARAMETRICO. La dirección de la atención hacia un parámetro en

particular –generalmente el parámetro con el más alto ritmo (o porcentaje) de cambio
o grado de articulación dentro de un clang o secuencia dados.
FOCO TEXTURAL. La dirección de la atención hacia un especifico (lineal)

elemento o parte dentro de un clang. (o a una secuencia monofónica en especial
dentro de una secuencia polifónica) –usualmente aquel elemento que es más intenso,
en uno o más parámetros.
FORMA. Aquel aspecto de nuestra percepción de la Gestalt musical (sean estas

clangs, secuencias o configuraciones mayores) que involucra silueta y estructura, y
gesto y movimiento – como sus “estáticos” y “dinámicos” atributos, respectivamente.
En la Sección II, declaramos que “la forma de una configuración musical es
primariamente determinada por las efectivas diferencias entre sus partes sucesivas”.
A nivel perceptual del clang, esto significa cambios en los valores paramétricos entre
un elemento y el próximo. Para la secuencia, están involucrados dos factores, porque
“diferencias efectivas” entre clangs sucesivos pueden ser percibidas de dos maneras
distintas. Estas son (1) como cambios en los rasgos estadísticos de los clangs, entre
uno de ellos y el próximo, y (2) relaciones morfológicas ( semejanza, semejanza
parcial, diferencia de forma) entre los clangs, produciendo en algunos casos
60
61
diferentes tipos de secuencia.
GRADIENTE. Una medida aproximada del índice de cambio de valores en algún

parámetro, cuando los cambios son continuos, en vez de diferenciados. Un gradiente
paramétrico será especificado por una magnitud (“alta” o “baja”) y una dirección
(positiva o negativa en la escala paramétrica).
INTENSIDAD PARAMETRICA. En cada escala paramétrica (como se describió y

empleó en la Seccion II), el más alto de dos valores se asume como el que produce o
corresponde a una intensidad musical o subjetiva mayor. La medida de la altura
relativa en esta escala es entonces una indicación de la intensidad paramétrica.
INERCIA RITMICA. Una forma especial del factor de predisposición objetiva. Se

dijo, en la Sección II, que involucra “una tendencia psicológica o kinestésica hacia la
repetición rítmica –el mantenimiento de una estructura rítmica previamente
establecida...” etc.
INTERVALO. La medida de la diferencia entre dos distintos valores en algún

parámetro – un significativo concepto aún cuando esta diferencia no pueda ser
medida en ninguna manera precisa, cuantitativa, sino meramente en términos
aproximados como “grande” o “pequeño”, “ancho” o “estrecho” etc. En adición a la
magnitud, un intervalo, al igual que el gradiente, tiene una dirección (arriba o abajo)
en la escala paramétrica.
NIVEL PERCEPTUAL. Véase ESCALA TEMPORAL.
PARAMETRO. Cualquier atributo característico del sonido, en virtud del cual un

sonido (elemental) o configuración sonora puede distinguirse de otro, Nos hemos
referido con alguna frecuencia a siete parámetros: altura, intensidad, timbre,
duración, densidad temporal, densidad vertical y envolvente temporal. Aunque estos
son los parámetros más frecuentemente involucrados en el análisis musical (como así
también en la composición), la definición dada más arriba deja lugar a otros
parámetros que pueden ser relevantes en algunos casos, como el rango de alturas,
grado de articulación paramétrica, etc. Estos son todos los que he llamado
“parámetros musicales” para diferenciarlos de los “parámetros acústicos” --
frecuencia, amplitud, forma de onda etc. --los cuales son su contrapartida física y
fuente. Cuando los términos en si no implican ninguna distinción entre los correlatos
“objetivo” y “subjetivo” de un parámetro (como es el caso de “duración”, “densidad”,
y “envolvente temporal”) es todavía el parámetro musical específico el involucrado –
por ejemplo, un atributo que es percibido como parte de la experiencia musical, no
simplemente sujeto a ser medido o a determinaciones abstractas de algún tipo.
PARAMETRO COHESIVO. Ver DETERMINANTE DE COHESION.
PARAMETRO FORMATIVO. Ver DETERMINANTE DE FORMA.
PERFIL PARAMETRICO o SILUETA. Aquel aspecto de la forma percibida de un

clang o secuencia que es el resultado de cambios en un particular parámetro de un
momento al próximo. También, la representación gráfica de estos cambios, como se
empleo en las Secciones II y III.
PREDISPOSICION. Una condición psicológica que puede alterar o modificar la

percepción de algo, como resultado de la experiencia previa.
PREDISPOSICION OBJETIVA. Uno de los factores gestálticos secundarios de

cohesión y segregación, definido en la sección II como “expectativas o anticipaciones
que aparecen durante una experiencia musical y que están originadas por eventos
61
62
previos ocurridos en la misma pieza”. Una de las manifestaciones más efectivas de
este factor es la inercia rítmica.
PREDISPOSICION SUBJETIVA. Otro de los factores gestálticos secundarios --

”expectativas o anticipaciones (originadas durante una experiencia musical) que son
el resultado de experiencias previas a aquellas ocasionadas por la pieza de música
que se considera en ese momento.”
PRINCIPIO DE EQUIVALENCIA. Ver EQUIVALENCIA.
RASGOS ESTADISTICOS. Características generales o promedio de un clang, como

el estado paramétrico, rango (en cada parámetro), y duración del clang como un todo
–a ser distinguidas de las más específicos, formales o morfológicos rasgos del clang.
RASGOS MORFOLOGICOS. Aquellos aspectos de un clang (o secuencia) que se

relacionan específicamente con su forma, a diferencia de su estado paramétrico u
otros rasgos estadísticos.
RELACION HETEROMORFICA. (& SECUENCIA). La relación morfológica de

completa diferencia de forma entre dos clangs. Una secuencia en que todos los clangs
son diferentes entre si será por lo tanto una SECUENCIA HETEROMORFICA.
RELACION ISOMORFICA. (Y SECUENCIA). La relación de completa semejanza

o identidad de forma entre dos clangs (con respecto a un parametro dado). Una
secuencia en la cual todos los clangs tuvieran una forma idéntica se llamaría
SECUENCIA ISOMORFICA.
RELACION METAMORFICA. (& SECUENCIA). La relación de semejanza parcial

entre dos clangs, “revelando o implicando alguna clase de transformación
morfológica, por medio de la cual alguno de los clangs fue (o podría haber sido)
derivado del otro”. Una secuencia en la cual todos los clangs se relacionan de esta
forma seria una SECUENCIA METAMORFICA. --probablemente el tipo de
secuencia más hallado en la música.
RELACION MORFOLOGICA (entre clangs), y TIPOS DE SECUENCIA. Términos

generales que envuelven las relaciones isomórficas, heteromórficas y metamórficas
entre clangs y el tipo de estructura de secuencia que deriva del uso consistente de una
u otra de estas relaciones en una secuencia dada.
RITMO EXPLICITO. Las relaciones de duración dentro de un clang que derivan de

cambios diferenciados en los valores paramétricos de un elemento al otro –siendo
medidos , por lo tanto, desde un ataque hasta el próximo.
RITMO IMPLICITO. Las relaciones de duración dentro de un clang que derivan de

los impulsos creados por “picos” de intensidad en los varios perfiles paramétricos de
ese clang. Desde que esos picos pueden ocurrir durante continuos cambios en los
valores paramétricos – y por lo tanto en las partes “internas” de un elemento, así
como también en su comienzo (en el ataque) – el ritmo implícito de un clang será un
atributo más inclusivo que el ritmo explícito, que se medía desde un ataque hasta el
próximo.
SECUENCIA. Generalmente, “una sucesión de clangs que se separa de otras

sucesiones en alguna manera, por lo que tiene algún grado de unidad y singularidad,
constituyendo una gestalt musical en una escala temporal o nivel perceptual mayor –
aunque no será una gestalt tan “fuerte” como es el clang”. Esta definición se refiere a
la secuencia polimórfica, (siendo la secuencia monomórfica considerada como un
caso excepcional, no justifica una definición más generalizada de secuencia que sería
62
63
necesaria para incluirla). Todas las secuencias podrían ser asumidas como
comparables, sin embargo, con respecto a su duración –aunque solo sea en que
tienden a ser más largas que el clang, o más largas que el rango normal de duraciones
dentro del cual es posible percibir una gestalt auditiva en un “pellizco” de la atención.
El carácter gestáltico de la secuencia debe por lo tanto depender de la memoria para
su aprehensión.
SECUENCIA MONOFONICA. Una secuencia en la cual los clangs se perciben de a

uno por vez.
SECUENCIA MONOMORFICA. Un caso especial de secuencia-estructura que no se

percibe como una “sucesión de clangs” porque “cualquier agrupación perceptual en
unidades tipo clang es casi enteramente arbitraria y subjetiva”. Este tipo de
configuración es frecuentemente producido por la resonancia del clang, aunque no
siempre, y usualmente juega un papel secundario en la textura musical, como
acompañamiento o “fondo”.
SECUENCIA POLIFONICA. Una secuencia compuesta de dos o mas secuencias

monofónicas. Más precisamente, una secuencia es llamada polifónica cuando “ la
atención está dividida o distribuida entre dos o más clangs simultáneos en algunos
momentos.” Así, la mera existencia de dos o más partes instrumentales en un pasaje
contrapuntístico, por ejemplo, no necesariamente significa que el pasaje es
polifónico. --por esta definición “...debe haber diferencias paramétricas claramente
perceptibles entre las secuencias monofónicas individuales –y un alto grado de
semejanza paramétrica dentro de cada una-- antes de que la secuencia como un todo
pueda ser escuchada polifónicamente.”
SECUENCIA POLIMORFICA. La clase de secuencia-estructura que se asume como

“típica”, en comparación con la secuencia monomórfica (ver definición de secuencia)
SILUETA. Un aspecto de la forma de un clang o secuencia que es producido por los

cambios en los valores paramétricos entre un momento y el siguiente dentro de una
configuración. A veces ha sido usada como sinónimo de palabras como “perfil”,
“curva”, “contorno”, etc., aún cuando
hay diferencias obvias entre los significados de estos términos en el campo de la
percepción visual, del cual han sido tomados prestados. Y ninguno de ellos puede
significar totalmente lo mismo allí, como si es posible hacerlo en la música. --o como
se ha deseado que signifiquen en este libro. Pero se esperó que todos ellos connotaran
aproximadamente lo mismo para el músico –ese “aspecto de la forma” al que nos
referimos en la definición previa.
63
64
Bibliografia
Artaud, Antonin. El Teatro y su Doble. New York: Grove Press,1958.
Cherry, Colin. Sobre la Comunicación Humana. Cambridge: The MIT Press, 1978
Ellis, Willis,D.,ed. Libro de Consulta sobre la Psicología de la Gestalt. New York:

Humanities Press, 1967. (Contiene escritos de Wertheimer y Köhler).
Joice, James. Retrato de un Artista Adolescente. New York: The Viking Press, 1968.
Koffka, Kurt. Principios de la Psicología de la Gestalt. London: Routledge & Kegan

Paul Ltd., 1962.
Köhler, Wolfgang. Introducción a la Psicología de la Gestalt. New York: New

American Library, Mentor Books, 1959.
Schaeffer, Pierre. A la Búsqueda de una Música Concreta. Paris: Editions du Seuil,

1952.
Schoenberg, Arnold. Estilo e Idea. Leonard Stein, ed. London: Faber & Faber, 1975.
Seashore, Carl. Psicología de la Música. New York: Dover Publications, Inc.,1967.
Thompson, D'Arcy W. Sobre Crecimiento y Forma. Cambridge: University Press,

1968
Lista de Obras Musicales Citadas, y sus Editoriales
Bartók, Béla.
Sonata (piano). Vienna: Universal-Edition, 1976.
Cuarteto de Cuerdas #4. Vienna: Universal-Edition, 1939.
Ives, Charles.
Sonata para piano #2 (“Concord, Mass.,1840-60”).
New York: Associated Music Publishers, 1947.
Scherzo (“Sobre las veredas”), (orquesta de cámara).

New York: Peer International Corporation, 1954
Tres lugares en Nueva Inglaterra, un arreglo orquestal.

Bryn Mawr: Mercury Music Corporation, 1976.
Ruggles, Carl.
Evocaciones (“Cuatro Cantos para Piano”)
New York: American Music Edition, 1957.
Schoenberg, Arnold.
Tres Piezas para Piano, op.11.
Vienna: Universal-Edition, 1910.
64
65
Cinco Piezas para Orquesta, op.16.

New York: Peters Corp., 1952.
Varèse, Edgard.
Densidad 21.5 (para flauta sola)
New York: Colfranc Music Publ., 1966.
Octaedro (para ensamble de camara).

New York: Colfranc Music Publ., 1980
Webern, Anton.
Seis Fragmentos (para orquesta), op. 6.
Cinco Fragmentos para Orquesta, op. 10.

Cinco Frases para Cuarteto de Cuerdas, op.5.

65
66
66
67
Prefacio
META Meta+Hodos representa un intento de organizar ciertas ideas presentadas

originalmente en Meta+Hodos en 1961, incorporando revelaciones y revisiones que
han emergido desde entonces. El escrito fue motivado originalmente por el deseo de
proveer un resumen de mis ideas y terminología para el uso de estudiantes de la
clase de Percepción Formal y Análisis en el Instituto de las Artes de California. El
intento era por lo tanto hacerlo lo más conciso posible, aún a expensas de su
comprensibilidad, y tengo claro que el resultado probablemente no es fácilmente
penetrable para quienes no estén ya familiarizados con Meta+Hodos.
De todas maneras, me agrada la forma que ha tomado, y espero que otros puedan
encontrarlo de interés a pesar de sus dificultades.
James Tenney
Noviembre de 1975.
67
68
A.Sobre la organización Perceptual
PROPOSICION I: En el proceso de la percepción musical se forman unidades

gestálticas temporales (UGT), en varios diferentes niveles jerárquicos.
COMENTARIO I.1: El numero de niveles jerárquicos en una pieza dada, y

las duraciones relativas de las UGTs a niveles jerárquicos adyacentes
varían, dependiendo de cosas como estilo, textura, tempo, duración de la
pieza, etc.
COMENTARIO I.2: UGTs en un nivel jerárquico dado no son siempre o

necesariamente disyuntivas – es decir, hay frecuentes intersecciones y
ambigüedades en su formación perceptual.
DEFINICION 1: La UGT del más bajo (o primer) nivel jerárquico será

llamada elemento.
COMENTARIO 1.1: Un elemento es una UGT que es percibida como

(temporalmente) singular –es decir, no divisible en una categoría más baja
(corta) de UGT (Ver Comentario IV.1.3, más adelante, para una
descripción más detallada de las características del elemento).
DEFINICION 2: Una UGT del nivel jerárquico próximo superior (segundo) será llamada
clang
COMENTARIO 2.1: Un clang es una UGT del más bajo nivel jerárquico dentro de la cual
pueden aún percibirse UGTs de menor nivel.
DEFINICION 3: Una UGT del nivel jerárquico inmediato superior

(tercero) al clang será llamada Secuencia.
COMENTARIO 3.1: Un clang por lo tanto consiste de una sucesión

temporal de dos o más elementos, y una secuencia consiste de una sucesión
temporal de dos o más clangs. Nótese que una combinación de dos o más
elementos ocurriendo simultáneamente no necesariamente constituye un
clang. (para el caso de UGTs simultáneas ver Definiciones 5 a 8, más
adelante)
DEFINICION 4: La UGT al más alto nivel jerárquico es la pieza como-un-

todo (pero ver ProposicionV y Comentario V.1, más adelante).
COMENTARIO 4. 1: El numero de niveles jerárquicos intermedios (entre

la secuencia y la pieza) es variable (comparar con Comentario I.1)
DEFINICION 5: Una UGT cuyos componentes, UGTs en el nivel

jerárquico inmediato inferior, son percibidas de-a-una en el tiempo, se
llamará monofónica
DEFINICION 6: Una UGT cuyos componentes, UGTs en el nivel

jerárquico inmediato inferior son percibidas de a dos-o-más-
simultáneamente será llamada polifónica
DEFINICION 7: una UGT cuyos componentes, UGTs en todos los niveles

jerárquicos inferiores son monofónicas será llamada simple.
DEFINICION 8: Una UGT cuyos componentes, UGTs en cualquier nivel

jerárquico inferior son polifónicas, será llamada compuesta.
68
69
COMENTARIO 8.1: Estos términos serán frecuentemente combinados para

describir cuatro tipos de construcción “vertical” o textura:
(1) Una UGT simple-monofónica (a un nivel jerárquico dado) es una cuyas
UGTs componentes son monofónicas (en todos los niveles inferiores) y son
percibidas de-a -una en el tiempo (en el nivel dado);
(2) Una UGT simple-polifónica (a un nivel jerárquico dado) es una cuyas
UGTs componentes son monofónicas (en todos los niveles inferiores) pero
percibidas dos o más al mismo tiempo (en el nivel dado);
(3)Una UGT compuesta-monofónica (a un nivel jerárquico dado) es una
cuyas UGTs componentes son polifónicas (a cualquier nivel inferior) pero
son percibidas una-a-la-vez (al nivel dado);
(4) Una UGT compuesta-polifónica (a un nivel jerárquico dado) es una
cuyas UGTs componentes son polifónicas (a cualquier nivel inferior) y son
percibidas dos o más al mismo tiempo (al nivel dado).
COMENTARIO 8.2: Las relaciones entre estos cuatro tipos de texturas en

tres niveles jerárquicos adyacentes se muestran esquemáticamente en la
Figura 1.
PROPOSICION II: La formación perceptual de UGTs a cualquier nivel

jerárquico está determinado por un numero de factores de cohesión y
segregación, entre los cuales los más importantes son proximidad y
semejanza, cuyos efectos pueden describirse como siguen:
PROPOSICION II. 1: La relativa proximidad de algunas UGTs en un nivel

jerárquico dado tenderá a agruparlas, perceptualmente, en una UGT en el
nivel jerárquico superior.
PROPOSICION II. 2: Semejanzas relativas de algunas UGTs a un nivel

jerárquico dado tenderán a agruparlas, perceptualmente, en una UGT en el
nivel jerárquico inmediatamente superior.
PROPOSICION II. 3: Por el contrario, una relativa separación temporal y/o

diferencias entre algunas UGTs en un nivel jerárquico dado tendera a
segregarlas en UGTs separadas en el nivel jerárquico inmediato superior.
COMENTARIO II. 3.1: La formación perceptual de UGTs en el bajo-nivel

esta también afectada por factores secundarios de cohesión y segregación,
incluyendo acento, repetición, “predisposición objetiva”, y
“predisposición subjetiva” (ver Meta+Hodos), pero no hablaremos de ellos
aquí.
B. Sobre los parámetros musicales.
DEFINICION 9: Un parámetro será definido aquí como cualquier atributo

distintivo del sonido en razón del cual un sonido puede ser percibido como
diferente de otro, o un sonido puede ser percibido como cambiando en el
tiempo.
COMENTARIO 9.1: Esta definición se refiere a parámetros musicales o

“subjetivos” (por ej. altura, intensidad, etc.) distinguiéndolos de parámetros
acústicos u objetivos (frecuencia, amplitud, etc.)
69
70
Figura 1. Relaciones entre UGTs simples, compuestas, monofónicas y polifónicas

en tres niveles jerárquicos (M=monofónica , P=polifónica, S= simple, C=
compuesta, (m) percibida una-a-la -vez, y (p) percibida dos o más al mismo tiempo.
70
71
COMENTARIO 9.2: No hay en general una correspondencia de uno-a-uno

entre parámetros musicales y acústicos. Donde hay esa correspondencia , la
relación está más cerca de lo logarítmico que de lo lineal.
PROPOSICION III: Altura, Timbre y Tiempo (musical) no son simples

parámetros unidimensionales, porque cada uno de ellos incluye al menos
dos subparámetros relativamente independientes.
COMENTARIO III.1: Semejanzas y diferencias entre dos intervalos de

altura cualesquiera son percibidos de dos maneras distintas, dependiendo
ello de sus magnitudes relativas y sus cualidades interválicas. Estas, a su
turno, resultan de diferencias en lo que se llamará (1)Altura absoluta, y (2)
Altura relativa.
DEFINICION 10 : Altura absoluta se refiere a aquel aspecto de la

percepción de la altura que depende de la existencia de un rango continuo
de alturas desde lo bajo a lo alto.
DEFINICION 11 : Altura relativa se refiere a aquel aspecto de la

percepción de la altura que depende del fenómeno de la “equivalencia de
octava” y el hecho de que el rango continuo de alturas es también cíclico,
retornando virtualmente al punto de partida en cada transición de una
octava a otra.
COMENTARIO 11. 1: Estos dos subparámetros pueden estar relacionados

al hecho de que hay dos mecanismos de percepción de la altura
involucrados en el escuchar, un mecanismo “de lugar” (determinando la
altura absoluta) y un mecanismo “de tiempo” (determinando la altura
relativa). El mecanismo de lugar es más efectivo en las altas frecuencias, el
mecanismo de tiempo para las bajas, pero los dos se superponen en un
rango bastante amplio en el registro medio, y es aquí donde nuestra
percepción de la altura es más penetrante (y más bi-dimensional)
COMENTARIO 11.2: La multidimensionalidad del timbre se debe al hecho

de que está determinado de una manera compleja por nuestra percepción de
un gran numero de rasgos acústicos, que pueden ser englobados dentro de
tres categorías:
(1) El espectro estacionario.

(2) Varias clases de modulaciones estables.
(3) Modulaciones pasajeras o envolventes.
COMENTARIO 11.3: Los subparámetros del tiempo (musical) serán

llamados (1) Instante (2) Duración (3) Densidad temporal.
DEFINICION 12: Instante se refiere al momento en que ocurre, en el

continuo flujo del tiempo experimentado, cualquier “evento” musical,
comparado a algún momento de referencia, como el principio de la pieza.
DEFINICION 13: La densidad temporal de una UGT es el numero de sus

componentes UGTs del nivel jerárquico próximo inferior por unidad de
tiempo; (“duración” será utilizado en su sentido ordinario).
COMENTARIO 13.1: La densidad temporal promedio de una UGT a un
71
72
nivel jerárquico dado será por lo tanto igual a la reciproca duración
promedio de sus UGTs componentes en el nivel inmediato inferior.
COMENTARIO 13.2: “Tempo” es un caso especial de densidad temporal,

refiriéndose a un explícito o implícito pulso o “latido”, más que a
duracionesexpresas, y es solo relevante para UGTs del nivel más bajo.
DEFINICION 14: Altura absoluta e Instante (que se corresponden más

cercanamente con los parámetros acústicos, frecuencia y tiempo”real” serán
llamados parámetros distributivos, porque una diferencia en al menos uno de
ellos es necesaria para que dos sonidos sean percibidos como separados.
DEFINICION 15: Todos los otros parámetros (incluyendo intensidad, altura

relativa, duración, densidad temporal, y los varios subparámetros del timbre)
serán llamados parámetros atributivos. Nótese que una diferencia en
cualquiera de éstos es insuficiente, por si misma, para que dos sonidos sean
percibidos como separados tiene que haber, también, una diferencia en uno
de los parámetros distributivos.
A. Sobre la Percepción y Descripción de la Forma
PROPOSICION IV: La percepción de la forma a cualquier nivel jerárquico,

envuelve la aprehensión de tres distintos aspectos de la forma, a ese nivel y a todos
los niveles inferiores. Esos tres aspectos de la forma serán llamados estado, silueta
y estructura.
DEFINICION 16: Estado se refiere a las propiedades estadísticas y

“globales” de cada UGT, incluyendo los valores y rangos medios en cada
parámetro, y sus duraciones.
DEFINICION 17: Silueta se refiere al “perfil” de una UGT en algún

parámetro, determinado por cambios en ese parámetro ya sea con respecto a
cualquiera de los parámetros distributivos, instante o altura absoluta (o sus
correlatos acústicos, tiempo “real” y frecuencia logarítmica).
DEFINICION 18: Estructura se refiere a relaciones entre partes

subordinadas de una UGT, por ejemplo, relaciones entre sus UGTs
componentes al próximo (o varios) nivel(es) inferior(es). (Ver también
Definición 19 y sus comentarios, más adelante)
PROPOSICION IV.1: Una completa descripción de una UGT monofónica a

cualquier nivel jerárquico requiere las descripciones de Estado, Silueta y Estructura,
para cada parámetro con
respecto al tiempo.
COMENTARIO IV.1.1: En este contexto (es decir, el de las UGT

monofónicas), la Silueta es dependiente del tiempo, mientras que Estado y
Estructura son características fuera del tiempo” (pero ver comentario
IV.2.1, más adelante)
COMENTARIO IV.1.2: El Estado de una UGT monofónica dependerá

simplemente de los Estados de los niveles más bajos; silueta es determinada
por cambios en el Estado al nivel próximo inferior; la Estructura depende
72
73
de relaciones entre Estados, Siluetas y Estructuras en el próximo (o varios)
nivel(es) inferior(es). (Ver Figura 2).
Figura2.
Relaciones entre los tres aspectos de la Forma a diferentes Niveles Jerárquicos (NJs)
73
74
COMENTARIO IV.1.3: Desde que, por la Definición 1 Comentario 1.1, un
elemento no se percibe como “divisible en UGTs de un nivel inferior”, la
estructura de un elemento no es percibida directamente –por ejemplo,
elemento-”Estructura” esta localizada en el área “infraformal” de la Fig. 2,
debajo del”umbral de percepción de la forma”.Elemento-”Silueta” esta a
veces debajo y a veces arriba de este umbral.
COMENTARIO IV.1.4: Las varias descripciones de estado de un elemento

son equivalentes al grupo de valores paramétricos necesarios para describir
el elemento (excepto cuando aspectos de la silueta del elemento están
también reducidas a parámetros –por ejemplo, amplitud-silueta de la
envolvente.
COMENTARIO IV.1.5: Las “semejanzas” y “diferencias”de las

Proposiciones II.2 y II.3 podrían ser de las tres clases –es decir: de estado,
silueta o estructura.
DEFINICION 19: Hay tres tipos básicos de estructura. (Correspondiendo a

las tres lineas conectivas a “Estructura” en Fig.2). Se llamaran:
(1)Estructura estadística (es decir, relaciones entre estados en el nivel
inferior).
(2)Estructura morfológica (relaciones entre siluetas en el nivel
inferior).
(3)Estructuras en cascada (relaciones entre estructuras en el nivel
inferior).
COMENTARIO 19.1: Cada uno de estos tres tipos de estructura podría ser
especificado mostrando las relaciones entre cada UGT en el nivel próximo
inferior y una UGT de por medio en este nivel. Para un grupo dado de
relaciones (limitado de una manera en que hay solo una relación entre cada
par de UGTs), esto podría hacerse arreglándolas en una formación cuadrada
o matriz. En el caso de una estructura estadística, una matriz tal podría
mostrar, por ejemplo, el conjunto de intervalos entre los valores
paramétricos medios de cada par de UGTs.
COMENTARIO 19.2: Para una estructura morfológica, las relaciones

incluidas en esta matriz podrían ser solo tres (es decir, =, " , y T,
significando: “idéntico a”, “no relacionado a” y “relacionado a través de
una transformación” respectivamente), o la T puede expandirse a una lista
como la siguiente:
E/C (expansión/contracción de intervalos)

X/L (extensión/elision en los finales de una UGT)
I/D (interpolación/supresión en o desde adentro de una UGT)
I (inversión)
R (retrogresión)
W (combar o distorsionar la silueta, pero preservando aún sus
rasgos tipológicos esenciales)
P (permutación de el orden de las UGTs componentes)
COMENTARIO 19.3: para una estructura en cascada, las únicas relaciones

necesarias para aquella matriz podrían ser = o " .
DEFINICION 20: En adición a los tres tipos básicos de estructura listados

en la Definición 19, hay todavía un tipo más que es importante para la
74
75
percepción musical, una que involucra relaciones entre relaciones, más que
relaciones entre (varios aspectos de) las UGTs en si mismas. Estas serán
llamadas estructuras relacionales y pueden ser de tres clases (1) Estructura
relacional de estado (2) Estructura relacional de silueta (3) Estructura
relacional de estructura.
PROPOSICION IV.2: Una completa descripción de una UGT polifónica (o

compuesta monofónica) a cualquier nivel jerárquico requiere descripciones
(añadidas a aquellas listadas en la Proposición IV.1) de estado, silueta y estructura
para cada uno de los parámetros atributivos con respecto a la frecuencia
logarítmica.
COMENTARIO IV.2.1: En este contexto, aunque la silueta no es

dependiente del tiempo, todavía involucra el orden secuencial de estados en
el ámbito de las frecuencias; mientras que el estado y la estructura no lo
hacen.
COMENTARIO IV.2.2: Para UGTs polifónicas, las relaciones entre

estado,silueta y estructura (con respecto a la frecuencia) –como aquellos
descriptos en el comentario
IV.1.2, no son todavía conocidos.
PROPOSICION V: Las propiedades formales a un nivel jerárquico dado

determinan el (no-semántico) “contenido de las UGTs al nivel próximo superior;
también determinan el “contexto” (o “función” o “entorno”) de las UGTs en el
nivel próximo inferior.
COMENTARIO V.1: Lo que nosotros finalmente llamamos (no semántico)

“contenido” es el resultado de formas a un nivel por debajo del primer nivel
al que nosotros estamos posibilitados de percibir “formalmente”; lo que
llamamos “contexto” (o “función” o “entorno”) esta determinado por
condiciones formales a un nivel por arriba del más alto que nosotros
elegimos para manejarnos con “formalmente” . *
PROPOSICION VI: Cuando nos movemos del área infraformal hacia arriba, dentro
y a través de los primeros niveles jerárquicos formales, nuevos parámetros
emergen.
COMENTARIO VI.1:Aún dentro del área infraformal ocurre algo similar,

por ejemplo la transición desde la naturaleza básicamente física de la señal
como (simplemente) amplitud versus tiempo, al parámetro (acústico)
frecuencia. Ejemplos por encima del umbral incluyen los efectos tímbricos
de aumento de tiempo y vibrato (en el NJ(1) en Fig.2, y densidad temporal
en NJ(2)).
PROPOSICION VII:Hay una cercana correlación entre lo que puede ser llamado
foco parametrico y el relacionado rango de variación de los estados en el nivel
próximo inferior dentro de una UGT, es decir, cuanto más grande sea el rango en un
parámetro dado, más nuestra atención se enfocara en los cambios en ese parámetro,
y más prominente será la silueta determinada por esos cambios.
DEFINICION 21: un parámetro cuya variación (sobre un relativamente

amplio rango en el nivel jerárquico próximo inferior, que de esta manera
enfoca la atención en la silueta de una UGT en este parámetro, será llamado
parámetro formativo.
75
76
DEFINICION 22: Un parámetro cuya relativa constancia (o variación sobre
un rango estrecho) en el nivel próximo inferior es de esta manera
significativamente responsable por su unidad como Gestalt (por el factor de
semejanza de la Proposición II.2) y será llamado parámetro cohesivo.
PROPOSICION VIII: Los parámetros formativos de una UGT son generalmente

diferentes de los parámetros cohesivos de esa UGT.
COMENTARIO VIII.1: esto continua simplemente “por definición”

pero sus implicaciones son suficientemente importantes para justificarla
como una Proposición separada.
PROPOSICION IX: Los parámetros formativos de una UGT a un nivel jerárquico

dado son generalmente diferentes de los parámetros formativos de la UGT en el
nivel próximo superior de la cual es parte.
COMENTARIO IX.1: Una excepción obvia a las Proposiciones VIII y IX

puede ocurrir cuando el parámetro formativo de una UGT es la altura, pero
esto es sólo posible porque el numero de valores discernibles en este
parámetro es muy grande y puede ocurrir sólo cuando el rango de variación
de altura dentro de la UGT del nivel próximo inferior es relativamente
limitado. Cuanto más extenso sea el rango cubierto dentro de cada UGT del
nivel inferior, menos perceptibles serán los cambios del estado de las
alturas de una UGT a la próxima, y de esta manera menos efectiva será la
altura como un parámetro formativo en el nivel próximo superior. Esta
relación de “intercambio” entre niveles adyacentes se hace más explícita y
precisa en la siguiente Proposición.
PROPOSICION X: Para cualquier parámetro con respecto al tiempo, cuanto más

grande el rango de variación a un nivel jerárquico dado, más pequeño el rango de
variación posible en el nivel próximo superior , y viceversa.
COMENTARIO X.1: Para un parámetro dado, y bajo la especial condición

de que los rangos sean iguales para todas las UGTs en un nivel jerárquico
dado, las siguientes relaciones se mantendrán:
Para el primer nivel jerárquico, considerado en si mismo, el máximo rango
disponible es:
N(1)max=Nt
donde Nt es el numero total de valores distinguibles en ese parámetro.

Cuando consideramos dos niveles jerárquicos, el máximo rango en el
segundo nivel es:
N(2)max = Nt -(N(1)-1).
Para un tercer nivel el rango máximo será
N(3)max = Nt – (N(1)-1) – (N(2)-1).
Más generalmente, el máximo rango disponible a un nivel (L) dado es
N(L)max = Nt ( N(1)-1) – (N(2)-1) -....

N (L-1) -1), o N(L)max = Nt – NL + L -1.
Finalmente el rango total disponible (Nt) puede ser distribuido igualmente
entre un numero de niveles (L), de manera que
76
77
N(1) = N(2) =...N(L), y N(L+1)max = 0, disponiendo cada N como

N = Nt/L+1.
DEFINICION 23: una UGT cuyas UGTs componentes en el nivel próximo

inferior tienen todas el mismo estado en un parámetro dado,serán llamadas
ergódicas con respecto a este.
COMENTARIO 23.1: La silueta de una UGT ergódica es por lo tanto

“plana” en aquel parámetro.
COMENTARIO 23.2: Una UGT ergódica tiene el mismo estado

paramétrico que cada una de las UGTs que la componen en el nivel
próximo inferior.
DEFINICION 24: Una UGT cuyas UGTs componentes en el nivel próximo

inferior tienen diferentes estados en un parámetro dado serán llamadas no-
ergódicas con respecto a este parámetro.
COMENTARIO 24.1: La silueta de una UGT puede por lo tanto ser

ergódica como no-ergódica, respecto a un parámetro dado.

inferior tienen todas la misma silueta en un parámetro dado serán llamadas
isomórficas con respecto a ese parámetro.

inferior tienen todas diferentes ( o más precisamente, no relacionadas)
siluetas en un parámetro dado serán llamadas heteromórficas con respecto a
ese parámetro.

inferior tienen siluetas relacionadas entre si a través de algún proceso de
transformación serán llamadas metamórficas con respecto a aquel
parámetro.
COMENTARIO 27.1: La estructura morfológica de una UGT puede por lo

tanto ser isomórfica, heteromórfica o metamórfica, con respecto a un
parámetro dado.
B.Sobre la Entropía como una Medida de Variación.
DEFINICION 28: Uno de los más importantes aspectos de la experiencia

musical es la percepción de la variación, y una útil medida de la variación
es la entropía. En la teoría de información, la entropía de un “mensaje”
consistente de una serie de n discretos “símbolos” tomados de un “alfabeto”
de N igualmente probables símbolos es
H = n log2 N (bits por mensaje).
La entropía de cada símbolo es
H = log2 N (bits por símbolo).
77
78
COMENTARIO 28.1 : La variable más importante aquí es N, el numero de

símbolos disponible. En el caso especial donde N=1 , H=0
COMENTARIO 28.2: Cuando los símbolos disponibles no son igualmente

probables, es decir, cuando no ocurren con la misma frecuencia relativa (pi)
–entonces:
H = --! pi log2 pi (bits por mensaje).
DEFINICION 29: Podemos definir tantos tipos diferentes de entropía como

hay tantos tipos de estructura. Así, podemos distinguir entre estadísticas,
morfológicas y estructurales entropías, de acuerdo con cuando los
“símbolos” considerados sean estados, siluetas o estructuras del nivel
inferior. En adición habrá tres entropias relacionales, aquellas que
involucran relaciones de estado, relaciones de silueta y relaciones de
estructura.
DEFINICION 30: Las entropías de una UGT a un nivel jerárquico dado

pueden ser medidas ya sea en términos de las UGTs componentes al nivel
más bajo (o sea elementos) o en términos de las UGTs componentes en el
nivel próximo inferior. La primera clase de medición (que ha sido el
procedimiento usual en la mayoría de las aplicaciones de la teoría de la
información) será llamada una medición aditiva, la segunda ( que se
empleará con más frecuencia aquí) será llamada una medición de entropía
de nivel adyacente.
DEFINICION 31: Desde que una UGT a cada nivel jerárquico excepto el
más bajo y el más alto (es decir, cualquiera menos un elemento o la pieza
completa) puede ser considerada tanto sea un mensaje (conteniendo
símbolos del nivel inferior) y un símbolo (contenido en un mensaje del
nivel más alto), las varias entropías pueden ser definidas para una UGT ya
sea como entropías de mensaje o entropías de símbolo.
COMENTARIO 31.1: Las siguientes Proposiciones se refieren a entropías

de mensaje del nivel adyacente de una UGT:
PROPOSICION XI: La entropía estadística de una UGT ergódica es cero.
PROPOSICION XII: La entropia relacional de estado de una UGT ergódica

es cero.
PROPOSICION XIII: La entropía estadística de una UGT no-ergódica a un

nivel jerárquico dado depende de:
(1) El numero de sus componentes (UGTs del nivel inmediato inferior)

(2) El numero de sus estados distinguibles, y
(3)La frecuencia relativa de estos estados
PROPOSICION XIV : La entropía relacional estadística de una UGT no-

ergódica a un nivel jerárquico dado depende de:
(1) El numero de sus componentes, UGTs del nivel inmediato inferior.

(2) el numero de diferencias distinguibles entre sus estados,y
(3) las frecuencia relativa de esas diferencias.
78
79
PROPOSICION XV: La máxima entropía estadística alcanzable en una
UGT a un nivel jerárquico dado está inversamente relacionada a la
entropía estadística de las UGTs componentes del nivel jerárquico próximo
inferior. (Esto es una consecuencia de la Proposición X)
PROPOSICION XVI: La entropía morfológica de una UGT isomórfica es

cero.
PROPOSICION XVII: La entropía de silueta relacional de una UGT

isomórfica es cero.
PROPOSICION XVIII: La entropía morfológica de una UGT

heteromórfica es máxima (para un numero dado de UGTs del nivel próximo
inferior).
PROPOSICION XIX : La entropía de silueta relacional de una UGT

heteromórfica es cero.
COMENTARIO XIX.1: Debe haber una manera plena de sentido de definir

la entropía morfológica de una UGT metamórfica, pero todavía no ha sido
encontrada.
COMENTARIO XIX.2: Nada se sabe aún acerca de las entropias

estructurales.
*NT : “Formalmente” en el sentido “como forma”
79

Metahodos PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Metahodos PDF

Cargado por

Copyright:

Formatos disponibles

1

INTRODUCCION DEL EDITOR

Traducción: Wim Forstman

“Una buena descripción de un fenómeno puede por si misma

Kurt Koffka, Principios de la Psicología de la Gestalt, p.73.

“Uno debe estar convencido de la infalibilidad de la propia fantasía,

Arnold Schoenberg, Estilo e Idea, p.218.

“El primer paso en la dirección de la belleza es entender

James Joyce, Retrato del Artista Adolescente, p.208.

La aumentada complejidad auditiva de buena parte del siglo XX es una característica

He dicho que los materiales de la música han cambiado, y esto ha de verse en

Arnold Schoenberg – op 11 ( ·2)

“Lo que distingue a las disonancias de las consonancias no es un

Mientras las variaciones en amplitud mencionadas previamente estaban en la línea

“Es verdad que el sonido en mi música cambia con cada giro

“Las leyes de organización que hemos encontrado

En lugar de “sonido”, “configuración sonora”, o “idea musical” (ya que estos

Comenzando entonces con las definiciones elemento, clang y secuencia, y

Arnold Schoenberg, Estilo e Idea, pp. 220-223

James Joyce, Retrato del artista adolescente, p 212

D'Arcy Wenthworth Thompson, Desarrollo y Forma, p.16

Factores de Cohesión y Segregación de la Estructura (Gestalt)

00 000 00 0000 00 000

La analogía con la percepción musical es obvia, cuando sustituimos tiempo por

En el ejemplo de Webern, por otra parte, el efecto de la semejanza de altura es mucho

Por ejemplo, si la coordenada vertical representa las alturas, el diagrama mostrará el

De esta manera, la proximidad en en el tiempo está representada por la proximidad en

Una explicación de estas condiciones podría eventualmente ser derivada de ciertos

Si bien la descripción previa de la tendencia a la formación de grupos del factor de

La analogía entre estas características y lo que he llamado intensidad paramétrica es

Un cuarto factor que puede influenciar en la formación de clangs es el factor de

James Joice, Retrato del artista adolescente, pag. 212

“Ahora, el estado, incluyendo la silueta o forma, de una porción de materia, es el resultado

D'Arcy Wentworth Thompson, De Crecimiento y Forma, pag. 16-17

Antonin Artaud, “Sobre el teatro Balines”,

La base propuesta para un nuevo marco conceptual de trabajo para la descripción y el

He definido estructura como involucrando las “interrelaciones entre partes

El método gráfico de representación de perfiles paramétricos usado en la ultima

Otro ejemplo de ritmo implícito, aunque envuelve sólo un parámetro, es el tercer

Hemos ya tratado con un ejemplo en el cual la determinación del perfil formal se

El siguiente ejemplo (Ejemplo 16) debe ayudar a clarificar estos últimos

Otro importante factor en la delineacion de esta secuencia es la diferencia en el

Las relaciones morfológicas entre clangs, mencionadas en la pagina anterior, son la

En términos de las definiciones anteriores, la secuencia Barroca seria una secuencia

Esta clase de transformaciones incluirán, por ejemplo, (1) Expansiones o

Ejemplos de estas transformaciones morfológicas son tan numerosas en la literatura

El Ejemplo 19 muestra otra clase de secuencia monomórfica, en la cual los cambios

2. Nótese que los parámetros listados aquí son específicamente parámetros

4. Obra citada, pag. 240

5. Routledge & Kegan Paul Ltd., London, 1962.

7. Especialmente su libro, A la Recherche d'une Musique Concrète, Editions du

8. Disponible en traducción al inglés en A Source Book of Gestalt Psychology,

9. Vea los listados de estos autores en la bibliografía de pag. 96.

10. Una escala ordinal representa un “ordenamiento clasificatorio” de magnitudes

11. Koffka, obra citada, pag. 186-209.

13. Para un repaso de esta teoría, y los conceptos de la teoría de la información en

17. Dover Publications, Inc., New York, 1967.

CLANG. Un sonido o configuración sonora que es percibida como una unidad

CLANG—RESONANCIA. El sostenimiento o repetición de un clang más allá de los

CLANG RESONANTE. Una suerte de fenómeno fronterizo –entre el clang y la

COHESION Y SEGREGACION, FACTORES GESTALTICOS DE. Fuerzas (o

CONTORNO MORFOLOGICO O PERFIL. Estos términos han sido usados aquí

DENSIDAD TEMPORAL. Uno de los siete parámetros musicales más