Está en la página 1de 80

leA 3

JUANA GI L FERNÁNDEZ

Los Sonidos
el Lenguaje
ISBN 84-7738-005-8

788 477 380 054 ' (11'


EDITORIAL
SINTESIS
LOS SONIDOS
DEL LENGUAJE
LOS SONIDOS
DEL LENGUAJE
JUANA GIL FERNÁNDEZ

EDITORIAL
SINTESIS
f;2. :l/
G 55

NS 006515:2 102
índice
FL-II 00 'b:2-
Páginas

o. Pres entación . 7

1. Nociones de acúsü ca ........... ... . .. ................ . II


1.1. Las ondas sonoras. . .............. . II
Primera reimpresión: abril 1990
Segunda reimpresión: noviembre 1991
1. 2. Propiedades de los sonidos 20
Tercera reimpresión: julio 2005 1.3. La resonancia. 26

z. La producción del habla , , , .. . ...... , ...... , ... , ... . .. . 31


Diseño de cubierta: Isidro Úbeda 2.1. Los órganos articulatorios. 31
2.2. La creación de un flujo de aire 37
2.3. La fonación. 38
Reservados todos los derechos. Está prohibido, bajo las
sanciones penales y el resarcimiento civil previstos en
2.4. Tipos de fuente ........... , 42
las leyes, reproducir, registrar o transmitir esta publi- 2.5. La resonancia en el tracto vocal: los formantes ..... . . 44
cación, íntegra o parciahnente, por cualquier sistema de
recuperación y por cualquier medio, sea mecánico, elec- 3. Técnicas instrumentales , .. . .. .. ". ", ., .. ... . . . .. .. ,. 49
trónico, magnético. electroóptico, por fotocopia o por 3.1. Los primeros métodos. . . . . . .. . ............ . 49
cualquier otro, sin la autorización previa por escrito de 3.2. Las nuevas técnicas ....... , . 51
Editorial Síntesis, S. A.
3.3. La síntesis del habla .. 59
© Juan Gil Femández
4. La audición y la percepción de los sonidos . . . . . . . . . .. , 61
© EDITORIAL SÍNJESIS, S. A. 4.1. La audición. .. ............ . 61
VaIlehermoso, 34. 280 15 Madrid 4.2 . La percepción del sonido. . . . . . . . ..... , . 65
Teléfono 91 593 20 98
http://www.sintesis.com 71
5. Descripción y clasificación de los sonidos . . . . . .. . , .. . .
5.1. La segmentación de la cadena hablada. 71
ISBN: 84·7738·005·8
Depósito legal: M. 28.890·2005 5.2. La diferenciación vocal·consonante .. 73
5.3. Las vocales: características articulatorias ...... , . 76
Impreso en España - Printed in Spain 5.4, Las vocales: características acústicas ........ , . , . 84

5
5,5, S mlvoca les y semiconsonantes: aspectos
a rtic ula torios y acústicos . 88
5,6. Las consonantes: características articulatorias
5.7, Las consonantes: características acústicas. 91
99
6. Los aUabetos fonéticos
6.1. La transcripción foné;i·~a' . : : . : . : : : : . . ... : : . : . : . : . . .. , 107
107
6.2. Los alfabetos fonéticos .. .... .. , .. 108
6.3. Ejemplos de transcripción 112
7. La combinación de los sonidos .. .. ... . .. .... ...........
7.1. La sílaba
115
115
presentación
7.2. Otras agrupaciones de s;~id;s ~~. I~ ~ad~n~ ... . . .
123
7.3. La coarticulación y otros fenómenos combinatorios
124
8. De todos es bien sabido que los seres humanos tendemos a no
Los rasgos prosódicos . .. ... .. ... ................ ..... .. 127 reparar en los objetos, en los paisajes o en los hechos que nos resultan
8.1. El acento .
127 familiares y habituales. Sin embargo, cuando, empujados por circuns-
8.2. Los rasgos prosódicos de tono 130 tancias diversas, nos detenemos a examinarlos con una cierta atención,
d escubrimos frecuentemente en ellos motivos de interés o de admira-
9. Aplicaciones de la fonética
137 ción. Pues bien, nada hay más familiar ni más habitual para nosotros
9.1. La enseñanza de segunda·s· i~~~~~~· ,:: :. :: ::: ' :: :.... 137 q ue los sonidos con los que nos expresamos, a través de los cuales nos
9.2. El reconocimiento de la voz y la identificación del relacionamos y manifestamos nuestros sentimientos: los estamos emi-
hablante . .. .... .. ' . ... .. . . .... , ' . .
138 tiendo y escuchando permanentemente, nos educamos y vivimos con
9.3. La patología del habla ... ...... . . . .. ... . .. . . . . 140 ellos. Este libro es una breve reflexión acerca de esos sonidos y del
modo en que llegamos a producirlos y percibirlos, en un intento por
Glosario . . . . .. .. . .. ...... .. . . , . . .. ..... . . .... . . .
147 despertar, también en este caso, el interés del posible lector por uno
de los aspectos más fascinantes de su propia existencia.
Referencias bibliográficas . . . . . . . . . . . . . . . . . . , . . ... 151 Es ésta una obra introductoria , y , por tanto, en ella hemos pretendi-
do abordar las principales cuestiones referentes a la naturaleza y al uso
de los sonidos en forma tal que cualquier persona, aun sin poseer
ninguna formación lingüística especial, pueda entenderlas y asimilarlas
con facilidad. No obstante, creemos que este trabajo puede resultar
particularmente útil para los estudiantes de Lingüística o Filología, en
concreto para aquellos que deban cursar asignaturas como Fonética o
Fonología . En todo caso, el profesor deberá suplir con sus explicacio-
nes las carencias que se aprecien en su contenido , por lo que el libro
viene a ser un texto de apoyo para su labor docente.
A pesar de la mención conjunta que acabamos de hacer a ambas
disciplinas, debemos aclarar que éste es un libro de Fonética y no de
Fonología. En otras palabras, nos hemos ocupado de los sonidos en
cuanto realidades físicas, mensurables y registrables mediante proce-
dimientos instrumentales , estudiando sus características y su combina-
ción en la secuencia hablada. Hemos dejado de lado, en cambio , todo lo
6
7
que se refiere a la función que estos sonidos cumplen en las distintas It I minología, los procedimientos de investigación, los estilos de argu-
I nguas, es decir, todo aquello que constituye el centro de atención de
111 ntación, todo es, en principio, distinto para la una y para la otra.
los fonólogos. Explicaremos mejor esta diferenciación con un ejemplo. I'odríamos añadir, incluso, que existe una cierta desconfianza entre
En español, existe un sonido [kJ que no se pronuncia del mismo 1011 tistas y fonólogos, nacida , sin duda, de los prejuicios albergados
modo si va situado delante de una [iJ, como en kilo, que si va situado po r ambas partes. A este respecto, cabe recordar la célebre frase del
d e lante de una [o], como en copa. En el primer caso , la [kJ, que es un lonólogo N. S. Trubetzkoy , para e l cual la fonética era a la fonología lo
sonido articulado en la parte posterior o velo del paladar , adelanta su que la numismática a la economía . frase que ha sido replicada por
zona de articulación por contacto con la [iJ , que es una vocal muy ,!I ún fonetista con la idea de que la fonética es a la fonología lo que la
anterior; en e l segundo, mantiene su zona habitual d e pronunciación IIs lca a la metafísica. En cualquier caso, y dejando ya aparte estas
porque la vocal [al es ella misma posterior. Este tipo de matices son I'omparaciones discutibles, la opinión más generalmente aceptada en-
muy importantes para el fonetista, cuyo trabajo consiste precisamente 11 la comunidad cie ntífica internacional es la de que se trata de dos
en señalarlos y explicarlos, pero no poseen especial relevancia para el !!loterias que pueden abordarse por separado . Es cierto que en ocasio-
fonólogo , desde el momento en que el oyente no los percibe e inter- lIes se hace preciso afrontar un problema desde ambas perspectl-
preta ambos sonidos como realizaciones de un mismo elemento Ik/, VdS con lo que podríamos denominar un «enfoque híbrido», porque
bien diferenciado de los restantes elementos fónicos que constituyen su !!luchas cuestiones fonológicas tienen una explicación fonética, y mu-
lengua y capaz de distinguir significados: Ikopal frente a Ipopa/, por ('has observaciones fonéticas no son realmente relevantes hasta que
ejemplo. Estas unidades abstractas que interesan al fonólogo - y que, 110 se comprueba su trascendencia para el sistema de la lengua .
no lo olvidemos, se manifiestan en el habla por medio de sonidos- son I:sto, sin embargo, no invalida nuestra afirmación inicial de que fo-
los denominados fonemas. Se conciben como conjuntos de propiedades 1I010gía y fonética son dos materias bien diferenciadas e indepen-
mínimas simultáneas, de carácter articulatorio o acústico, llamadas ras- ,II e ntes.
gos distintivos. El adjetivo distintivos se debe a que son estas caracte- En los dos primeros capitulas de este libro, intentamos responder a
rísticas , estos rasgos, los que oponen los fonemas entre sí dentro del IdS preguntas básicas que toda persona interesada en e l tema suele
sistema de cada lengua, de modo que la sustitución de uno por otro hacerse , esto es, cómo y por qué se producen los sonidos del lenguaje .
conlleve siempre una variación en el significado d e la palabra de que Para ello, tenemos que explicar algunas nociones fundamentales de
se trate . ,lcústica , que pueden ayudar al lector -especialmente al estudiante de
Pues bien, según decíamos , en este libro hemos prescindido, ex- I.etras, cuya formación al respecto suele ser escasa- a comprender el
cepto en alguna referencia aislada , de todas aquellas consideraciones complejo conjunto de fenómenos físicos que tienen lugar en su aparato
que pudieran interpretarse como fonológicas. Lo hemos hecho así mo- fonador cada vez que emite un sonido. Dichos fenómenos están, en la
vidos por diversas razones. actualidad, bien estudiados gracias al variado grupo de medios instru-
En primer lugar , frente al número relativamente alto de manuales mentales de que disponen los fonetistas y a los que dedicamos el
introductorios de fonología que pueden encontrarse hoy en el mercado capítulo tercero .
bibliográfico español, originalmente escritos en castellano o traducidos No sucede lo mismo en lo que se refiere al proceso de percepción
de otras lenguas, las introducciones a la fonética son mucho menos del habla : todavía hay muchos puntos sin aclarar por completo y mu-
numerosas . Parecía por ello oportuno contribuir con esta pequeña obra chas interrogantes sin contestar, según detallamos en el Capitulo 4. Los
a equilibrar mínimamente la situación. Capítulos 5 y 6, por su parte, presentan una visión general de los
En segundo lugar, en la actualidad existen dentro del ámbito de la criterios utilizados para clasificar los diversos tipos de sonidos, así
fono logía diversas escuelas o corrientes, cuyos planteamientos y méto- como una descripción de los distintos alfabetos empleados para trans-
dos difieren considerablemente entre sí. Resultaba por tanto casi impo- cribirlos.
sible ofrecer una visión completa de todas ellas en el espacio del que En e l Capitulo 7, estudiamos las posibilidades combinatorias de los
disponíamos, sin caer en simplificaciones inadecuadas . e lementos fónicos dentro de la secuencia hablada, las clases de agrupa-
En tercer lugar, creemos que la fonética y la fonología son materias ciones a que dan lugar , y , asimismo, las modificaciones que los propios
muy relacionadas --como corresponde a dos disciplinas que compar- sonidos experimentan al entrar en contacto unos con otros. El Capítu-
ten el mismo dominio o campo de estudio- pero independientes. La lo 8 está destinado a los llamados rasgos prosódicos o suprasegmenta-
8 9
les, es decir, aquellas propiedades que caracterizan un fragmento de-
terminado del decurso fónico, no necesariamente coincidente con un
sonido.
Finalmente, hemos dedicado el Capítulo 9 a revisar las aplicaciones
prácticas que el análisis fonético tiene en diversos campos de conoci-
miento, algunos de ellos muy distantes de la Lingüística, como la Medi-
cina o el Derecho.
A lo largo de todo el libro hemos empleado los símbolos del Alfabe-
to Fonético Internacional para transcribir los distintos sonidos a que
hacemos mención. Como es práctica habitual, estos sonidos aparecen
entre corchetes, en tanto que los fonemas -a los que aludimos en muy
pocas ocasiones- aparecen entre barras oblicuas. Aunque no se trata
de un estudio específico sobre fonética española, sino de una introduc-
Nociones
ción general, siempre que ha sido posible nos hemos servido de ejem-
plos tomados del castellano, con la esperanza de que, por conocidos,
de acústica
resultarán más clarificadores para el lector.
Antes de concluir esta breve presentación, queremos agradecer a
los profesores Victoria Rodellar y Pedro Gómez Vilda, del Departa-
mento de Electrónica de la Facultad de Informática de la Universidad
Politécnica de Madrid, su inestimable ayuda en la confección mediante 1 .1. Las ondas sonoras
ordenador de algunas de las figuras que acompañan al texto. Igual-
mente, agradecemos al profesor Francisco Marcos Marín la confianza 1.1.1. Los sonidos del habla no son más que un pequeño grupo dentro
que depositó en nosotros, su apoyo y su paciencia: fueron tres factores del conjunto enorme de sonidos que el oído humano es capaz de
decisivos para la realización de esta obra. percibir. Todos ellos tienen una causa última común: el movimiento.
Evidentemente, este movimiento puede ser de muchos tipos según sea
producido por una fuente de sonido o por otra. Cuando hacemos sonar
las cuerdas de una guitarra, por ejemplo, su movimiento produce un
resultado muy diferente al que se obtiene moviendo un diapasón o
dejando caer un jarrón al suelo. En todos los casos, sin embargo, el
impulso motriz que hemos transmitido a la fuente del sonido (las cuer-
das de la guitarra, el diapasón o el jarrón) ha causado una perturbación
considerable en la masa de aire circundante. Esta alteración se irá
propagando desde las zonas más cercanas a la fuente hasta la más
lejanas, para alcanzar finalmente nuestro tímpano. Así pues, desde el
momento en que se ha producido el movimiento original hasta que
nosotros percibimos el sonido a que da lugar transcurre un cierto
I

periodo de tiempo, en la mayor parte de las ocasiones tan breve que


nos resulta imperceptible.
La velocidad de transmisión de esta perturbación es, en efecto, muy
elevada y depende del medio a través del cual se produzca. Es sabido
que el agua es, por ejemplo, mejor transmisor que el aire: la velocidad
de propagación llega, en la primera, a los 1.500 m/seg., en tanto que, a
través del aire, es de 348 m/seg., aproximadamente.

10 11
1.1.2. Imaginemos que disponemos de un diapasón y movemos sus sin antes haber desplazado a la partícula 8 hacia la e, transmitiéndole ,
puntas hasta conseguir escuchar su sonido característico. ¿Qué es lo de esta forma, su propio movimiento . Cada línea horizontal representa
que ha ocurrido para que hayamos obtenido ese resultado? un momento en el tiempo posterior al representado por la línea prece-
La masa de aire que rodea al diapasón está dividida en partículas. dente y anterior al representado por la siguiente. Por e llo, en la cuarta
En aras de una mayor claridad en la explicación, centraremos nuestra línea, la partícula A ha sobrepasado su punto de reposo en dirección
atención en sólo nueve de ellas, a cada una de las cuales le hemos opuesta, a causa de su propia inercia, acercándose al diapasón -ahora
asignado una letra diferente para identificarlas. Si observamos con con las puntas casi juntas- para, por fin en la quinta línea, volver, al
atención la Fig . 1.1 , vemos que en la primera línea horizontal, que igual que el diapasón, al estado de reposo desde el que comenzará de
suponemos anterior en el tiempo a las demás, el diapasón no vibra y las nuevo todo el ciclo vibratorio. Lo mismo sucede con las otras ocho
nueve partículas se mantienen en su posición de reposo. partículas, según puede apreciarse claramente en la Fig. 1.1.
Podemos ver, entonces, que cada partícula recibe el impulso motriz
de la partícula vecina y que todas ellas se comportan como un péndulo,
Diapasón - - - - - - - - - - - - - - - - - - - - - - - - - - esto es, se desplazan desde su punto de reposo hacia cada lado una
A B C D E F G H cierta distancia para regresar de nuevo a él y reiniciar el proceso . De
V este modo se transmite , a través de toda la masa de aire, la perturba-
y A BCD E F G H
clón causada por la fuente, en nuestro ejemplo el diapasón.
Cuando las partículas están más próximas entre sí de lo normal
V A BCD E F G H
decimos que existe un estado de compresión. Por el contrario, cuand~
Q A BCD E F G H se encuentran más distantes entre sí de lo habitual, hablamos de un
estado de rarefacción . Si ahora observamos de nuevo la Fig . 1.1 com-
V A B C D E F G H
probaremos que las zonas de compresión y rarefacción (es decir, las
y A B C D E F G H variaciones en la presión del aire) van transmitiéndose desde el ángulo
supenor lzqUlerdo hasta el extremo inferior derecho , a medida que ,
V A BCD E F G H con el paso del tlempo, la perturbación ha ido propagándose. Cuando
por fin alcance nuestro oído, serán estos cambios de presión , más alta
Q A BCD E F G H
-<:ompresión- o más baja - rarefacción-, los que nos harán percibir
A B C D E F G la sensación de sonido, en la forma que explicaremos detalladamente
V H
más adelante.
y A BCD E F G H
1.1.3. El tipo de fenómeno descrito en el apartado anterior recibe
V A B CD E F G H
el nombre de onda. Puede definirse como la propagación de una per-
Q A BCD E F G H turbaclón a través de un medio
material como es el aire. en for-
V A B C D E F G H ma de una serie sucesiva de
compresiones y rearefacciones
Figura 1.1. [Tomado de Denes y Pinsan : 1963: pág. 30]
alternas que afectan a cada una
de las partículas componentes
En la segunda línea , sin embargo, las puntas del diapasón se han de ese medio . Representada en
movido como consecuencia de nuestro impulso, y, al abrirse, han des- un diagrama, la onda descrita
plazado a la partícula A que se encuentra, así, mucho más cercana a la por las partículas,.4. B. etc., de
partícula B. En la tercera linea, los brazos del diapasón han vuelto a su nuestro ejemplo anterior, sería
posición original, como parte de su movimiento vibratorio, y lo mismo tal y como se representa en la
ha sucedido con la partícula A, que ha vuelto a su punto de origen no Fig. 1.2. Fig. 1.2.

12 13
Esta onda reproduce el movimiento ondulatorio más simple y es ese lapso la onda B ha realizado d os vibraciones completas. Decimos ,
exactamente del mismo tipo que la que obtendría un matemático al e ntonces , que el período de la onda A, esto es, el tiempo que tarda en
trazar el gráfico de los valores del seno de un ángulo indefinidamente completar un ciclo, es el doble del de la ond a B. Aquélla realizará en la
en aumento a partir de O· (v. Brosnahan y Malmberg: 1970, 12). Por ello, unidad de tiempo considerada -convencionalmente e l segundo- la
es conocida con el nombre de onda sinusoidal o penódlCa slmple mitad de ciclos que ésta y por ello decimos que su frecuencia es
(véase más adelante, apartado 1.1.4). Por supuesto, en la práctica es menor. En efecto, la frecuencia es el número de ciclos completos que
dificil constatar la realización de ondas tan simples como la que aquí tienen lugar en un segundo y se mide en Hertzios (abreviado c.p.s. o
presentamos: los sonidos con los que estamos más familiarizados, y Hz). Lógicamente , el período y la frecuencia guardan entre sí una
particularmente los lingüísticos, responden a movimientos ondulatorios relación inversamente proporcional: cuanto mayor sea el período, me-
mucho más complejos que el de nuestro diagrama, como posterior- nor será la frecuencia y viceversa.
mente veremos. No obstante, sobre este esquema, hasta cierto punto Cuando una onda presenta una frecuencia muy baja (como en el
teórico, podemos estudiar los principales rasgos que caracterizan a una caso de los infrasonidos), el oído humano no puede percibirla. Al pasar
vibración. las hojas de un libro. por ejemplo. producimos una perturbación en
el aire que a veces incluso llegamos a sentir, pero que no oímos
Consideremos otra vez la onda de la Fig . 1.2, pero comparándo-
1.1 .4 .
porque su frecuencia no es lo suficientemente alta. Nuestros oídos
interpretarán como sonidos las frecuencias comprendidas entre los 16-
la ahora con otra un poco diferente , tal como se hace en la Fig. 1.3.
20 C.p.S. Y los 20.000 c.p.s. Por encima de este limite (ultrasonidos)
tampoco percibiremos nada, quizá porque nuestro tímpano no puede
x'
vibrar a tales velocidades (véase Capítulo 4. apartado 4.1.2). La mayo-
ría de las frecuencias importantes en e l habla se sitúan entre los 50 y los
8.000 Hz.
Volviendo a nuestras dos ondas, A y B, comprobamos que mantie-
nen entre sí todavía una diferencia más. La masa que está vibrando y
x describiendo con su movimie llto el perfil de la onda A (pensemos que
se trata de una de las nueve partículas de la Fig. 1.1) se separa más de
su punto de reposo que aquella otra cuya vibración representa la onda
B. La primera recorre, aproximadamente, el doble de la distancia que
se aleja la segunda. Por ello se dice que la onda A tiene mayor amplitud
que la onda B. La amplitud se define como el máximo desplazamiento o
Onda A Onda B elongación de un cuerpo en vibración con respecto a su punto de
Figura 1.3. reposo . En nuestro ejemplo, la amplitud de la onda A es la distancia
x- x' y la de la onda B es y-y'.
A pesar de todos estos rasgos que las distinguen, las dos ondas
Es, en primer lugar. evidente que nuestras dos ondas, a las que tienen también, como sinusoides que son, una propiedad común: ambas
hemos llamado A y B, son dos sinusoides, es decir, dos movimientos son periódicas o repetitivas . Una onda periódica es aquella en la que el
oscilatorios sumamente simples. En ambas, a un aumento d e presión le mismo perfil del ciclo se repite a intervalos de tiempo regulares. Lógi-
sucede un descenso de ésta, esto es, a la fase de compresión le sucede camente , todas las ondas sinusoidales son periódicas, pero existen
la de rarefacción. La suma de estos dos momentos es lo que denomina- otros muchos sonidos periódicos -como veremos en el siguiente
mos ciclo . En otras palabras, un ciclo es una vibración completa o, si se apartado- que no presentan esta forma tan simple. Tenemos un ejem-
prefiere, la variación completa desde la cresta de la onda (máxima plo en la Fig. 1.4, donde hemos incluido , asimismo, el perfil de una
compresión) hasta el valle de la onda (máxima rarefacción) y nueva- onda aperiódica o no repetitiva , con sus alteraciones características,
mente a la cresta (Borzone de Manrique : 1980, 20). para que pueda apreciarse la diferencia entre ambos tipos de oscila-
El ciclo de la onda A tarda en realizarse 0,0 1 seg., en tanto que en ciones.

11 15
1.1.5. En el apartado anterior ya
señalábamos que existen ondas
periódicas no sinusoidales. Estas
Onda A
últimas no son, en realidad, sino el
tipo más sencillo de ondas repeti-
Onda periódica tivas y, como también dijimos , no
abundan entre los sonidos que nos
resultan familiares. En concreto,
las ondas sonoras que genera
nuestro aparato vocal y que aquí
Seí'lal sinusoidal de amphtud UnIdad
nos interesan casi nunca son sinu- y l OO Hz de frecuencia
soidales (la correspondiente a un
silbido sería quizá la más similar
en su forma acústica a una sinusoi-
de). No obstante, cualquier onda
periódica que podamos imaginar,
como la de la Fig. 1.4, por ejemplo,
está formada por la combinación
de dos o más ondas sinusoidales.
En este sentido, se la denominará Senal sinusOidal de amphtud
Onda aperiódica onda compleja. 0,5 y 200 Hz de frecuencia

Cuanto más compleja es una


v onda , más componentes sinusoida-
les o armónicos la conforman y más Onda e
complicados son los movimientos
C\ C\ C\
de las partículas de aire que le
han dado origen. Ello es así por- v V V
que los cuerpos elásticos vibran Señal sinusoidal de amplitud
0,25 y 300 Hz de frecuenCia
simultáneamente de distinto modo
a como lo haría, por ejemplo, un
diapasón . Si pulsamos una cuerda
de guitarra o de piano, vibrará
Figura 1.4.
como un todo, es decir, en su lon-
gitud total, a una velocidad o fre- Suma
Estrictamente hablando . cualquier sonido que consideremos posee cuencia determinada, pero cada
una onda aperiódica. porque las variaciones de la presión del aire no una de sus partes lo hará también,
se repiten exactamente igual de forma indefinida. A medida que los a la vez y a frecuencias más altas.
sonidos se van amortiguando, la amplitud disminuye y los ciclos no son De esa forma , se generan varias
ya idénticos . Sin embargo, la práctica habitual es desatender estos ondas simples de diferentes valo- Suma tres sunusOldes;
(1 A-lOO Hz). (0,5 A-200 Hz)
matices, puesto que no suponen errores importantes y, sin ellos, la res frecuenciales, que, superpues- (0,25 A-300 Hz)
descripción acústica resulta más simplificada. Así pues, seguiremos tas, constituyen la compleja resul-
dividiendo las ondas en periódicas y aperiódicas (v. Ladefoged: 1962, tantes . En la Fig. 1.5 tenemos un
3 1 Y 48). ejemplo . Figura 1.5.

16 17
La onda de más baja fr ecuencia, A, es la frecuencia fundamental CF;')· mento de su ciclo vibratorio, o puede suceder. por el contrario. que
Las otras, B y e, son los armónicos , parciales o hipertonos. Estos armó- mientras algunas estén en un determinado estadio del ciclo . otras no
nicos se numeran como si el fundamental fuera de hecho el armónico hayan llegado a é l o lo hayan sobrepasado. En el primer caso, se dice
número 1: así, la onda B es el segundo armónico y la e, el tercero. que las ondas están en fase; en el segundo, que están fuera de fase. El
Como se puede observar en el diagrama, la frecuencia de la onda perfil de la onda compleja varía en uno y otro caso. En la actualidad.
compleja coincide siempre con su frecuencia fundamental, que , en existe cierta polémica sobre si la diferencia de fase afecta o no a la
nuestro supuesto, es de 100 Hz, o c.p.s. Las frecuencias de los armóni- cualidad del sonido resultante. La mayoría de los autores consideran
cos, por su parte, son todas ellas múltiplos de la fundamental: el segun- que el oído no capta el efecto de la discordancia de fase entre las
do armónico tiene dos veces la frecuencia del fundamental , el tercero frecuencias componentes de una onda compleja (v. Quilis: 1981.50), así
tiene tres veces la frecuencia del fundamental, etc. Por consiguiente, la que éste es un factor que no se tiene en cuenta habitualmente en
frecuencia fundamental es el máximo común divisor de las restantes fonética.
frecuencias componentes. Por lo que respecta a las ondas ape riódicas o no repetitivas, todas
Este método de descomposición de la onda compleja periódica se ellas son complejas, pero, a diferencia de las periódicas, poseen com-
conoce con el nombre de análisis de Fourier, porque el teorema en el ponentes de todas las frecuencias y de más o menos idéntica amplitud.
que se sustenta fue formulado por el matemático francés del siglo XIX Así pues, pese a que también pueden analizarse en forma de espectro,
Joseph Fourier. La sintesis de Fourier, por el contrario, permite el éste no estará formado por una serie de líneas verticales discretas
proceso inverso, es decir, la reconstrucción de una onda compleja a representando al fundamental y a sus armónicos múltiplos, sino que
partir de todos sus componentes. constará de sólo una línea continua que. con su movimiento ascendente
o descendente. indicará la amplitud de la vibraciÓn en cada frecuencia .
1.1.6. Una onda compleja pe- En la Fig . 1.7 presentamos una onda compleja aperiódica y su corres-
riódica puede representarse mu- rg pondiente espectro. Obsérvese que en él la curva es lo que indica que
cho más fácilmente de como lo \

hicimos en la Fig. 1.5 si nos ser,


\
,,
vimos de otro tipo de diagrama
,,
,,
en el cual el eje de ordena-
das registre la amplitud (esto es,
, ,,
la máxima elongación o despla-
zamiento) de cada componen-
te, y e l de abscisas, su frecuen- 100 200
t300 Hz
~
r--J

cia respectiva. La onda de la

~
Fig. 1.5 serfa, por tanto, la de la Figura 1.6,
Fig. 1.6. ~ ~
Según vemos, las amplitudes relativas de los armónicos se corres-
ponden con la longitud también relativa de las líneas verticales que los II
representan. No es preciso asignarles valores numéricos absolutos V
porque la forma de la onda compleja viene determinada por la fuerza
relativa de todas sus ondas integrantes. A un diagrama como el que
hemos logrado se le denomina espectro del sonido. En principio, es
posible obtener el espectro de cualquier onda compleja, pero convie-
ne señalar que, aunque esta práctica nos informa acerca de qué fre-
V
cuencias la componen y con qué amplitudes se presentan, no nos espe-
cifica el modo en que se combinan para configurar la onda. Puede
ocurrir, por ejemplo, que todas e llas se encuentren en el mismo mo- Figura 1.7a.

18 19
más débil dependiendo de varios factores que nosotros tendremos en
cuenta para conseguir el efecto deseado. Sabemos, además, que este
sonido posee una cualidad absolutamente diferente a la que caracteriza
al producido por la cuerda de un violín, así que - aunque quizá sólo
intuitivamente- somos conscientes de las tres principales formas en
que los sonidos pueden diferir entre sí: en tono, en intensidad o sonia y
en timbre .

1.2.2. El tono o la tonía es la impresión auditiva que nos produce la


frecuencia de una onda sonora. Es, por tanto, una cualidad subjetiva
dependiente de una propiedad física. Cuanto mayor sea la frecuencia
de un movimiento oscilatorio, es decir, cuanto más deprisa se sucedan
sus ciclos de vibración, más alto será el tono del sonido resultante. Así
o !OOO 2000 3000 4000 SOOO 6000 ' 7000 0000 9000 pues, una onda con 100 Hz de frecuencia producirá un sonido más bajo
Frecuencia (Hz) q~~rn~~fu .
En una onda compleja periódica, el tono depende de su frecuencIa
Figura l.Ib. fundamental (Fo) que, como dijimos, es la frecuencia de repetición de la
onda . En una vibración aperiódica, sin embargo, la altura tonal vIene
dada por el conjunto de frecuencias componentes predominantes .
la energía del sonido está muy dividida entre toda la gama de frecuen- Lógicamente , los objetos más pesados y de mayor tamaño vibran
cias, más despacio que los pequeños y ligeros, por lo que los sonidos que
Existen, por consiguiente, dos tipos de espectros: los de línea, que generan los primeros poseen un tono más bajo que los originados por
describen generalmente a las ondas complejas periódicas, y los conti- los segundos: un contrabajo tiene cuerdas más gruesas y largas que
nuos, que caracterizan a las aperiódicas. un violín y ello explica la diferencia tonal de sus somdos caracte-
Para elaborar los espectros propios de cada sonido, en particular rísticos.
de los del habla, se utiliza un aparato de fácil manejo denominado Si queremos variar el tono de un determinado sonido, habremos de
espectrógrafo o sonógrafo. del que volveremos a hablar con deteni- modificar su frecuencia, lo que puede lograrse de diversas maneras .
miento en próximos capitulas. Podremos cambiar las dimensiones de la fuente, que, como acabamos
de señalar, son determinantes: cambiar, por ejemplo, la cuerda larga
del contrabajo por la corta del violín o al revés. Podemos, también,
1.2. Propiedades de los sonidos aumentar o disminuir la tensión de esa misma fuente: si tensamos las
cuerdas del violín, la frecuencia será mayor; si las aflojamos, la fre-
1.2.1. De todo lo explicado anteriormente podemos extraer una pri- cuencia disminuirá . Y, finalmente, podemos alterar la masa de la fuente
mera clasificación de los sonidos en sonidos m usicaJes o armónicos y y ello ha de afectar, asimismo, a la frecuencia : una cuerda más gruesa
ruidos. Los primeros son el producto de ondas periódicas y, en conse- vibrará con menos rapidez que una más fina. Conviene recordar estos
cuencia, son más regulares, más melódicos y más agradables al oído. principios, porque se aplican al funcionamiento de las cuerdas vocales
Los segundos resultan de ondas aperiódicas yeso les confiere su ca- durante el proceso de producción del habla (véase Capítulo 2, apar-
rácter irregular y poco «musicabl. Adelantaremos que, por lo que se tado 2.2.2).
refiere a los sonidos del habla, las vocales, por ejemplo, son sonidos En los sonidos de frecuencias bajas -inferiores a 1.000 Hz-. un
musicales, en tanto que algunas consonantes, como la [s], son ruidos . simple cambio de 2 o 3 c.p.s. entraña ya una variación en el tono. En las
Pero ésta no es la única diferenciación posible entre sonidos. Para frecuencias altas, por el contrario, la modificación ha de ser más impor-
cualquiera de nosotros es evidente que el sonido producido por la tante para que se interprete como una alteración de la tonía. Ello expli-
cuerda de una guitarra puede ser más bajo o más alto y más fuerte o ca que las diferencias tonales entre sonidos de 400 y 600 fu, por

20 21
ejemplo, sean más perceptibles que las existentes entre frecuencias d e presentan todos los puntos por los que pasa una línea como la x o la y
4,400 y 4.600 c.p .s . de la Fig . 1.8. Después, esos valores se elevan al cuadrado, de forma
La unidad utilizada para medir el tono de los sonidos es e l me/o que los negativos pasen a positivos, se suman los cuadrados, se divide
Convencionalmente se acepta que a un sonido con una frecuencia el resultado entre el número de puntos considerado y se extrae la raíz
de 1.000 Hz, le corresponde un tono de 1.000 meles . A partir de cuadrada de la cantidad obtenida. Comprobamos así que la amplitud
ahí pueden calcularse los valores tonales de cualquier sonido, de tal de ondas como la a de nuestro ejemplo es mayor que la de ondas como
modo que los pares de sonidos separados por idénticas cantidades de la A, a pesar de lo que pudiera pensarse a primera vista. Este procedi-
meles mantendrán también entre sí las mismas diferencias de altura miento matemático simple se emplea también cuando las ondas objeto
tonal. de análisis son sinusoidales.
Dado que la onda a posee mayor amplitud media que la onda A,
1.2.3. Si, según hemos explicado, la frecuencia de una onda sonora según acabamos de explicar, la intensidad de la primera será igual-
condiciona e l tono del sonido percibido, su amplitud, en cambio, deter- mente mayor que la de la segunda. El término intensidad, utilizado en
mina la intensidad de ese sonido, o, hablando en términos psicológicos este contexto, no debe interpretarse en e l sentido en que lo usamos
y subjetivos, su sonia. habitualmente, esto es, como «fuerza, vehemencia o energía». Ésta
Cuando pulsamos la cuerda de una guita rra con mucha energía, el sería, más bien, la definición de la impresión subjetiva que hemos
resultado que obtenemos es un sonido más fuerte que el que consegui- denominado sonia. Por el contrario, la intensidad en acústica es una
mos al tañer esa misma cuerda con mayor delicadeza. En el primer característica física inherente a la propia onda sonora, fácilmente men-
supuesto, hemos originado un movimiento más amplio de la fuente, que surable en el laboratorio y definible como la potencia acústica que se
.se traduce en un movimiento también más amplio de las partlculas del transmite a través de una onda, medida en una superficie de un centí-
aire, o lo que es igual, en una metro cuadrado perpendicular a la dirección de propagación de dicha
mayor fluctuación de la presión onda. ¿Qué entendemos por potencia acústica? Se trata simplemente de
aérea. Los ciclos de la onda so- a' la energía que posee cualquier partícula en movimiento y que se va
nora correspondiente tendrán, en transmitiendo de unas a otras a partir del lugar en que se encuentra la
consecuencia, una amplitud con- fuente de sonido .
siderablemente mayor que los - ( \ -- Onda A La intensidad es proporcional al cuadrado de la amplitud de la onda
de la onda provocada en el se- a V v sonora, de manera que un aumento en ésta de 10 dinas por centímetro
gundo supuesto, lo que explica cuadrado (la dina es la unidad de fuerza que se emplea para medir la
el diferente grado de intensidad presión del aire y se expresa siempre en relación a un centímetro
de los dos sonidos resultantes. cuadrado) supondría un aumento en la intensidad de 100 watios.
Supongamos que deseamos El watio por centímetro cuadrado es, en efecto, una de las unidades
dilucidar cuál de los dos sonidos en las que puede calcularse la intensidad. Una intensidad de 10 - 16
representados por las ondas A Onda B
watios, esto es, de una diezmilésima de una millonésima de una millo-
y a de la Fig. 1.8 posee más so· nésima de un watio/cm2 , es ya suficiente para producir un sonido audi-
nía , esto es, cuál sentiremos ca· ble. Con todo , la intensidad o potencia acústica de una onda sonora
mo más fuerte y cuál como más Figura 1,8. suele medirse con mucha frecuencia en otra unidad distinta del watio y
débil. que, a diferencia de éste, no tiene un valor prefijado, sino que es una
Si consideramos únicamente los máximos de amplitud alcanzados, unidad relativa: nos estamos refiriendo al decibelio (abreviado da). El
entonces la onda A seria con claridad el sonido más fuerte , puesto que hecho de adoptar esta unidad se debe a que , en la mayor parte de los
la distancia a-a' es superior a la b-b'. Pero es claro que ésta no sería casos, los fonetistas, o los físicos en general, no están interesados en
una compa ración válida . Habremos de hallar e l valor medio de la conocer los valores absolutos de intensidad de un sonido, sino en saber
amplitud para cada onda y comparar posteriormente los resultados cuál es su nivel de potencia con respecto a otro u otros. Consiguiente-
alcanzados. El valor medio de la amplitud de una onda o valor de mente, cuando decimos que la intensidad de un sonido es de x deci-
eficacia se calcula anotando en una escala de presiones los valores que belios, queremos decir en realidad que ese sonido posee una intensi-
22 23
dad mayor en una proporción dete rminada que la de otro sonido . Lo túa , en un segundo o en un minuto , el mismo número de vibraciones
que importa , entonces , es la razón o ra tio --en el sentido matemático que efectuaría si sus movimientos tuvieran una mayor amplitud como
del vocablo , esto es , en una comparación , el e x ceso de un término respuesta a un impulso inicial más fuerte. Ello es debido a que la
sobre el otro-- que mantienen entre sí los sonidos confrontados. frecuencia depende siempre de las características físicas del cuerpo en
En principi o , podemos valorar la intensidad de una onda sonora con vibración. Así pues , si queremos cambiar la de nuestro péndulo , ha­
respecto a cualquier otra con la que la rela cionemos , pero , en la practi­ bremos de modificar sus dimensiones , haciéndole más largo (menor
ca , los especialistas han establecido como punto de referencia el sonido frecuencia) o más corto (mayor frecuencia) ,
que posee una potencia de 1 0 - 1 6 watios , de1 que hablábamos antes y en Un cambio en la intensidad de un sonido tampoco debe conllevar ,
torno al cual se ha elaborado toda la escala de deóbelios. La diferencia consecuentemente , una variación e n su tono. Sin embargo, esto n o es
en decibelios entre dos sonidos, de acuerdo con dícha escala , se define del todo cierto . En general , al aumentar la intensidad de un sonido cuya
como diez veces el logaritmo de su razón de potencia acústica o intensi­ frecuencia sea superior a 1 . 500 Hz, se produce una elevación propor­
dad . La explicación más simple puede darse sobre la tabla que presen­ cional del tono . Por el contrario , si la frecuencia de la onda sonora
ta P. Ladefoged en sus E1emen ts oí Acoustic Ph one tics (pág . 82) : considerada es inferior a los 1 . 500 Hz, el aumento de la intensidad
provocará el descenso del tono , Estas modificaciones son , no obstante ,
muy poco importantes , por lo que podemos seguir manteniendo a
Razón o relación efectos expositivos la asociación de la intensidad con la amplitud y del
de intensidad Logaritmo de Diferencia en
la razón decibelios tono con la frecuencia .
entre los sonidos
10 a 1 l lD 1 .2.5. La última propiedad que caracteriza a los sonidos y los diferen­
I DO a 1 2 20
cia entre sí es , como hemos dicho (véase apartado 1 . 2. 1 ) , el timbre, la
cualidad acústica propia de cada uno de ellos . Así , la misma nota
1 . 000 a l 3 30
musical , tocada con idéntico tono
etc . etc. e c.
e intensidad , no sonará igual en
una guitarra que en un laúd ; di­ (u]

Para calcular el logaritmo , l o único que hay que hacer e s contar e l ferirá en timbre .
número d e ceros que indican l a proporción o razón de los dos sonidos . El timbre depende de la confi­
Después , multiplicamos esa cifra por diez y ya obtenemos la cantidad guración particular que p r esente
de decibelios que separan a los sonidos en cuestión . el espectro (véase el aparta­ 300 700

Por lo que respecta , finalmente , al atributo psicológico de la sonía , do 1 . 1 . 6 ) de la onda complej a .


se ha propuesto como unidad de medición conveniente el son o , hacién­ de modo que dos somdos se F,
dolo corresponder con la soma producida por una onda sono ra de percibirán con timbre diferente [i]
1 . 000 Hz , con una intensidad de 40 dB . Los oyentes que hayan de juzgar si el número y la amplitud relati­
sobre el grado de sonía de un sonido determinado utilizarán la escala va de los a rmónicos que compo­
numérica construida en virtud de esta unidad , según la cual una onda nen sus ondas son , asimismo ,
distintos En la Fig . 1 . 9 aparecen 300 2000
con una sonia de 2 sanos es dos veces más intensa, desde el punto de
vista subj etivo , que una con sólo 1 sono , y ésta , por su pa rte , será los espectros correspondientes a Figura 1 .9.
también el doble de intensa que la onda que posea 1 /2 sano. las vocales españolas [u] e [i] .
Puede apreciarse fácilmente que la vocal [ u] tiene los armónicos de
1 .2.4. En orden a entender correctamente la diferencia entre frecuen­ mayor amplitud situados en la zona de frecuencias baj as , mientras q u e ,
cia y amplitud y sus propiedades derivadas , tono e intensida d, convie­ en el caso de la [i] , h a y una gran cantidad de armónicos , algunos d e
ne aclarar que un cambio en la amplitud no implica un cambio en la ellos de considerable amplitud , e n l a s frecuencias altas . La primera
frecuencia . Por ejemplo , un péndulo que describe un movimiento de vocal , la [u] , es , por tanto , un sonido gra ve; la [i] , en cambio , es un
poca amplitud , porque se le ha transmitido un impulso pequen.o , efec- sonido agudo.

24 25
Ahora bien, para explicar cómo es posible que dos ondas sonoras nuestra posición. En lugar de aumentar la amplitud del balanceo, el
como las que aparecen en la Fig. 1.9, producidas por la misma fuente vaivén disminuye, y si los golpes sucesivos se dan siempre antes de
-la vibración de las cuerdas vocales-, tengan una composición tan que se complete el vaivén, la hamaca se detiene .»
diferente , es preciso entender un concepto fundamental en fonética En otras palagras, la velocidad en que se suceden las compresiones
acústica, el de resonancia , al que dedicaremos los próximos apartados. y rarefacciones de la onda incidente (la onda que produce el primer
diapasón) debe corresponderse con la frecuencia natural del resona-
dor (nuestro segundo diapasón) y, entonces, no sólo el primero resue-
1,3. La resonancia na en el segundo, es decir, le hace moverse, sino que las amplitudes
de ambos movimientos se suman y el sonido que obtenemos se re-
1.3.1, Los cuerpos en general tienen dos modos distintos de vibrar. fuerza.
Pueden, en primer lugar, verse desplazados de su estado de reposo al Estos objetos - los diapasones- producen, como hemos visto, on-
recibir un impulso externo y continuar, a partir de ese momento, vi- das sinusoidales. Pensemos ahora qué sucede con las ondas complejas.
brando libremente a su frecuencia natural, es decir, a la frecuencia que Sabemos que la composición de dichas ondas se refleja con claridad en
le es propia de acuerdo con sus caracteristicas físicas (véase nuestro el diagrama que denominamos espectro (véase apartado 1.1.6), el cual,
apartado 1.2.4). Si movemos, por ejemplo , las puntas de un diapasón, al indicarnos todas las frecuencias de vibración de un cuerpo, y sus
éste vibrará exactamente en la forma que acabamos de describir. En amplitudes relativas, nos está informando también de cuáles son las
segundo lugar , los cuerpos pueden también comenzar a vibrar al verse frecuencias a las que ese cuerpo responderá mejor si actúa como
«contagiados» por la vibración de otro cuerpo. Las oscilaciones del resonador. Dado un espectro como el de la Fig. 1.6, por ejemplo,
diapasón anterior se transmitirán fácilmente a una mesa con tan sólo podremos deducir que la fuente que ha producido esta onda compleja
apoyar su base sobre ella. De igual manera, las vibraciones de las entrará en vibración fácilmente si le llega una onda de alrededor de
cuerdas de una guitarra provocarán perturbaciones en la masa de aire 100 Hz de frecuencia, puesto que ésta es su propia frecuencia natural
contenida en la caja del instrumento. de vibración. Por ello, y a pesar de que no coinciden estrictamente, la
Pues bien, al fenómeno por el cual un cuerpo se p one en movimiento frecuencia natural de vibración de un cuerpo se considera también su
a causa de las vibraciones de otro cuerpo se le conoce con el nombre frecuencia de resonancia y de ahí que la curva de resonancia de un
de resonancia. El cuerpo o volumen que se ve afectado se denomina cuerpo coincida con la curva de su espectro. En nuestro ejemplo de la
resonador. Fig. 1.6, la curva nos indica que este cuerpo o volumen de aire resona-
Para que la resonancia se produzca es preciso que la frecuencia ría algo a las frecuencias de 200 y 300 Hz, pero con menor efectividad a
natural de vibración del resonador se asemeje a la de la fuente de frecuencias mayores.
sonido. Así, si colocamos muy próximos entre sí a dos diapasones de la Así pues, una curva de resonancia no es sino la representación de la
misma frecuencia y hacemos vibrar a uno de ellos, los movimientos de conducta potencial de un resonador (v. Brosnahan y Malmberg:
esta vibración original actuarán como pequeños «golpes» en el otro 1970, 26).
diapasón, al que pondrán también en movimiento. Pero esto sólo se
producirá si los «golpes» de las moléculas llegan al segundo diapasón 1.3.2. Los sonidos que estimulan a un resonador y lo ponen en movi-
en el momento adecuado, esto es, si la frecuencia natural de ambos miento, es decir, las ondas incidentes que llegan a él, se denominan
cuerpos coincide . Ladefoged (1962, 57) ejemplifica muy claramente esta entrada del resonador. Las que resultan de la vibración del resonador
idea, utilizando un símil que Borzone (1980, 34) traduce: en respuesta a esta entrada se conocen, en cambio, con el nombre de
«Supongamos que un niño quiere hamacarse (sic) . Comenzamos por salida.
dar un pequeño empujón a la hamaca, que se desplaza alejándose de Si al cuerpo cuya curva de resonancia se corresponde con la de
nuestra posición. Luego, cuando la hamaca vuelve y se encuentra en el la Fig . 1.6 le hacemos llegar una entrada como la representada en
punto máximo de su desplazamiento hacia atrás, aplicamos otro empu- la Fig . 1.10, la salida resultante tendrá la forma del diagrama de la
jón. Este aumentará la amplitud del vaivén y así, con golpes sucesivos, Fig . 1.11 : la vibración óptima estará situada en torno a los 100 Hz y
se alcanzará el máximo balanceo. ( ... ) Supongamos que se aplica el será la que posee mayor amplitud . Los armónicos de 50 y 150 Hz pre-
segundo empujón a la hamaca cuando ésta está todavía volviendo hacia sentarán ya una menor amplitud, que irá descendiendo cada vez más

26 27
a medida que nos acerquemos a las frecuencias más alejadas de la que no deje pasar las frecuencias superiores a los 600 Hz. Como es
frecuencia natural de vibración o frecuencia de resonancia del cuerpo lógico, nuestro filtro dejará pasar los armónicos de 200, 400 Y 600 Hz y
en cuestión. eliminará todos los restantes componentes de la onda compleja inicial.
Se tratará, entonces , de un filtro de paso bajo. porque permite e l paso a
las señales comprendidas entre O y la frecuencia de corte (en nuestro

,,
," ... ejemplo, 600 Hz). Si, por el contrario, este resonador fuera diseñado
para transmitir las frecuencias superiores a la frecuencia de corte y
,, eliminar las inferiores, sería un filtro de paso alto. Finalmente, un filtro
de pasa banda dejaría pasar toda una banda de frecuencias cuyo ancho
se determina previamente.
Según veremos en próximos capítulos, el tracto vocal humano es un
tubo que actúa como resonador y cuya forma varia como resultado de
100 200 300 400 500 Hz los movimientos de los distintos órganos articulatorios. Estas modifica-
ciones conllevan cambios en las frecuencias de resonancia de los volú-
Figura 1.10. Figura l.ll.
menes de aire contenidos en cada una de las cavidades que lo confor-
man y ello constituye, realmente, la base de las diferencias entre los
La gama de frecuencias a la que un resonador responde con efecti- sonidos del habla.
vidad se llama ancho de banda y abarca todas aquellas frecuencias con
una amplitud de por lo menos el 70,7 por 100 de la amplitud de su
frecuencia de resonancia. En nuestro ejemplo anterior, el resonador
sería realmente efectivo en el margen comprendido entre los 50 y los
150 Hz, porque cualquier frecuencia dentro de esos límites posee, al
menos, el 70,7 por 100 de la amplitud de la frecuencia de 100 Hz. El
efecto de un resonador puede describirse, por tanto, especificando su
frecuencia de resonancia (en nuestro ejemplo, 100 Hz), Y su ancho de
banda (en este caso, 100 Hz).
Ya explicamos que la intensidad de un sonido dependía del cuadra-
do de la amplitud (véase apartado 1.2.3). Eso significa que si la intensi-
dad de un determinado sonido es la mitad que la de otro. la amplitud
de ese primer sonido ha de ser 0,707 veces la del segundo, puesto que
el cuadrado de 0,707 es 0,5, es decir, la mitad. Por consiguiente, la
cantidad de 70,7 por 100 que se marca como criterio para establecer el
ancho de banda no es arbitraria: todas las frecuencias que poseen una
amplitud de ese valor con respecto a la frecuencia de resonancia tienen
por lo menos la mitad de su intensidad y no se diferencian de ella en
más de 3dB.

1.3.3. En algunos casos, un resonador puede actuar como filtro. De


hecho. un filtro no es más que un resonador con capacidad selectiva
respecto a las frecuencias, utilizado para transmitir o pasar un sonido.
Supongamos que tenemos una fuente de sonido que emite energía
acústica en forma de ondas de 200, 400, 600 Hz, etc., hasta un máximo
de 2.000 Hz , e imaginemos también que diseñamos un filtro de tal modo

28 29
La producción
del habla

2.1. Los órganos articulatorios

2.1.1. Ninguno de los órganos que utilizamos habitualmente en la pro-


ducción del habla tiene como función principal esta actividad. Los pul-
mones, por ejemplo, nos sirven para respirar; la lengua y los dientes
intervienen en el proceso de ingestión de alimentos, etc. Sin embargo,
puesto que todos ellos son parte fundamental del mecanismo de articu-
lación del lenguaje, es lícito denominarlos órganos articulatorios y de-
dicar algún espacio a su descripción.

2.1.2. En la Fig . 2.1 se muestra la sección longitudinal de todo el


aparato fonador. En su parte inferior puede apreciarse con claridad el
diafragma , los pulmones y la tráquea , los cuales constituyen las cavida-
des infraglóticas .
El diafragma es un músculo delgado en forma de cúpula que separa
el tórax del abdomen y sobre cuya superficie superior se apoyan los
pulmones. Debido a la acción muscular, el diafragma puede alterar su
forma al perder parte de su curvatura, desplazándose hacia abajo y un
poco hacia adelante. Ello origina el aumento del tamaño de la caja
torácica, en la que están situados los pulmones, y la consiguiente ex-
pansión de éstos.
Los pulmones son dos órganos de textura porosa y esponjosa, com-
puestos básicamente por muchos pequeños saquitos de aire, los alveo-
los pulmonares, en los que se efectúa el proceso de purificación de la

31
do cricoides, que recuerda por su configuración a una sortija de sello ,
con su parte más ancha detrás. En realidad, el cricoides es el último de
los anillos superiores de la tráquea, según puede apreciarse en la
Fig . 2.2. Sobre el cricoides, y articulado con sus laterales, está el cartí-
lago más importante, el tiroides, constituido por dos grandes láminas
cuadrangulares dispuestas en forma de escudo, unidas en ángulo agu-
do por la parte anterior y separadas por completo en la posterior. La
Paladar
unión de ambas puede apreciarse con facilidad -especialmente en el
blando
caso de los varones- como una protuberancia (por debajo de la piel)
Hioides conocida por «nuez de Adán». Asimismo, sobre la zona posterior del
Epiglotis cricoides se asientan dos pequeños cartílagos con forma de pirámide,
los aritenoides, que poseen gran movilidad, pudiendo rotar y despla-
Cartilago zarse paralelamente con respecto al eje longitudinal de la articulación
cricoides _ _ Il -
cricoaritenoidea (Fig. 2.2) .

Hoides
Esófago _-f,~o;':j Epiglotis

Tiroides -'!&r'r'---;
Tiroides
Aritenoides

cricoaritenoideo
Cricoides posterior
'Tráquea -~..;,;;: _ Tráquea
Figura 2.1.

Cartilagos de la laringe Cartilagos de la laringe


sangre. Rodeados por una membrana, la pleura, los pulmones se en- (cara anterior) (cara posterior)
cuentran, como hemos dicho, en la caja torácica, circundados por las
costillas y apoyados sobre el diafragma. Figura 2.2.
La tráquea es un tubo de alrededor de 11 cm de largo, constituido
por anillos cartilaginosos abiertos, dividido en su parte inferior en dos
ramas o bronquios por los que conecta con los pulmones, y unido en Desde las apófisis vocales de los aritenoides, esto es, las partes más
su parte superior con la laringe o cavidad glótica en el modo que a salientes en su cara interna, hasta el ángulo interior de la parte delante-
continuación se describe . ra del tiroides (nuez), se extienden dos músculos gemelos, recubiertos
por mucosa laríngea, con un cono elástico reforzado por fibras elásti-
2.1.3.La laringe es una caja cartilaginosa situada en el extremo cas. Son los repliegues vocales, o, como se les ha llamado tradicional-
superior de la tráquea. La base de la laringe es el cartílago denomina- mente, las cuerdas vocales.

32 33
El espacio triangular que existe entre las cuerdas vocales se deno- la laringofaringe, desde el cartílago cricoides hasta el hueso hioides, la
mina glotis, por lo que a la cavidad laríngea se la conoce también como orofaringe, desde el hueso hioides al velo del paladar y la rinofaringe
cavidad glótica . La glotis puede variar de dimensión en función de la desde el velo del paladar hacia arriba, es decir, hacia la parte poste-
posición que adopten las cuerdas vocales. Así. al rotar los aritenoides rior de la cavidad nasal (Figs. 2.1 Y 2.2) .
hacia adentro, las cuerdas vocales se juntan, lo que provoca el cierre Las dimensiones de la faringe no son uniformes a lo largo de toda su
de la glotis . Si, por el contrario , las cuerdas vocales se separan debido e xtensión, según puede apreciarse en nuestros diagramas . Su parte
a la rotación hacia el exterior de media es más ancha que las restantes, si bien el tamaño de cada una de
los aritenoides, la glotis se abre estas zonas puede modificarse por los movimientos de distintos ele-
en mayor o menor grado. En la mentos: el volumen de la laringofaringe, en primer lugar, depende de
Fig. 2.3 se aprecian las posicio-
nes más frecuentes que suelen
~ ji;
los desplazamientos de la laringe, la lengua y la epiglotis; el de la
orofaringe, de la posición más retraída o más adelantada que adopte la
presentar las cuerdas vocales . Su lengua, y, finalmente, el volumen de la rinofaringe y su intervención en
tensión puede regularse llevan-
do hacia adelante el cartílago ti-
roides (al que, recordemos, es- Cue rdas Durante
Ji
En
el proceso de producción del sonido depende de la disposición de la
parte final del velo del paladar (véase, más adelante, este mismo apar-
tado).
tán sujetas las cuerdas por uno vocales la e misión vibr ación
en la de una
La cavidad oral se extiende desde la orofaringe hasta los labios, que
de sus extremos) de modo que re spiración consonante la limitan por su parte anterior. Sus paredes laterales son la cara interna
las partes anteriores de los cartí- sorda de las mejillas, en tanto que su techo está formado por el maxilar
lagos tiroides y cricoides se superior con los dientes, el paladar duro y el paladar blando . La parte
acercan . Figura 2.3. inferior -«el suelo})- de la boca está ocupada casi por completo por la
lengua .
El control de la abertura glótica impide que penetren en las vías En la Fig. 2.4 se indican las principales zonas que se diferencian
respiratorias cuerpos extraños, función ésta a la que contribuye en dentro de la cavidad oral y que, posteriormente, nos servirán para
gran medida la epiglotis, cartílago con forma de cuchara que, a modo localizar y describir los distintos sonidos.
de lengüeta, cierra la entrada de la laringe a los alimentos . El tamaño y la forma de la cavidad bucal varían en función de la
Toda la laringe puede desplazarse hacia arriba y hacia abajo. Se movilidad que caracteriza a algunas de las estructuras que la constitu-
eleva en el momento de la deglución, por ejemplo, o durante la emisión yen . Así, los labios pueden -como decíamos anteriormente- alargar
de sonidos agudos; desciende cuando bostezamos o producimos soni- la cavidad al redondearse y proyectarse hacia afuera, en tanto que la
dos graves . Sus movimientos varían el volumen de las cavidades supra-
glóticas y la presión del aire en ellas contenido . Veremos a continua-
ción cuáles son las características de dichas cavidades .
Incisivos

2.1.4. Las cavidades faríngea , oral y nasal, conectadas entre sí , com-


pletan el conjunto de los órganos del habla . Algunos autores distinguen YeIo del paladar
aún una cavidad más, la labial, que se formaría al redondear los labios Labios
por delante de los dientes para la pronunciación de algunos sonidos
' \ - f - - - - Úvula
(véase, por ejemplo , Brosnahan y Malmberg : 1970, 39 y 43). Sin embar-
go , el criterio adoptado más generalmente la considera parte integran- Lengua
te de la cavidad oral, sin dejar de señalar por ello la influencia que el
redondeamiento de los labios tiene en la caracterización acústica final
de los sonidos que lo requieren. Alveolos
La faringe es un tubo membranoso que conduce de la laringe a la
boca y a las fosas nasales. En ella se diferencian, por tanto, tres zonas: Figura 2.4.

34 35
abertura y la conformación general de la boca cambian de acuerdo con 2.1.5. Llamaremos al conjunto de las cavidades infraglóticas, glótica y
los movimientos de la lengua y del maxilar inferior. supraglóticas tracto vocal. Hay que precisar, sin embargo, que, en
No todos los órganos que componen la cavidad oral son móviles o opinión de muchos autores, el tracto vocal es tan sólo la zona compren-
activos. Los dientes superiores, la protuberancia alveolar o alveolos y dida entre la laringe y los labios, con una longitud próxima a los 17 cm
el paladar duro son órganos pasivos o inmóviles sobre los que actúan (Denes y Pinson: 1963, 48; Borzone de Manrique: 1980, 45; Ladefoged:
la lengua o los labios para articular determinados sonidos. 1975, 3, entre otros). Si nosotros hemos optado por una interpretación
La lengua es el articulador activo más importante. Puede dividirse más amplia del término, siguiendo a algunos fonetistas (Catford : 1977,
en tres zonas: el ápice o punta; el dorso, que, a su vez, se subdivide en 17), es porque resulta más útil para la descripción fonética utilizarlo con
predorso, mediodorso y postdorso , y la ralz, que es, al mismo tiempo, tal sentido. De este modo, el tracto vocal puede entenderse como un
la pared anterior de la orofaringe (Fig. 2.5). La lengua, debido a su mecanismo neumático consistente en un par de fuelles (los pulmones),
peculiar estructura, puede tanto extenderse más allá de los dientes conectados con un tubo (la tráquea) con un pistón (la laringe) en su
aproximadamente 5 cm como retrotraerse hasta 3 cm dentro de la parte superior. Este pistón, que puede subir y bajar, tiene en su
cavidad; elevarse (como un todo O en las diversas partes que la compo- interior una válvula (la glotis) y, sobre él, tres cavidades (faríngea, oral
nen) hasta llegar a tocar el techo de la boca, o bien descender para y nasal) con, a su vez, un número determinado de válvulas (la úvula, los
dejar paso libre a la corriente de aire proveniente de los pulmones. labios, la lengua).
Todos estos movimientos, y algunos más que aquí no mencionamos, son Aunque existen obvias diferencias entre el tamaño del tracto vocal
fundamentales para la articulación de cada sonido y por ello merecen en hombres, mujeres y niños - lo que explica sus distintas cualidades
una descripción más detallada (véase el Capítulo 5). Normalmente con- de voz- no parece haberlas (al menos de importancia) entre los tractos
llevan desplazamientos concomi- vocales de las diversas variedades étnicas, y ello permite considerar el
tantes de la mandíbula o maxilar tracto vocal y su funcionamiento como factores universales, sobre los
inferior, el único hueso móvil de que habrá que basar la descripción y clasificación de todos los sonidos
Predorso MediOdorso
la cara, de modo que cuando la Postdorso que el hombre es capaz de producir. En los siguientes apartados trata-
lengua desciende para dar lugar Dorso remos de explicar cómo actúa nuestro aparato fonatorio.
a una articulación abierta, la
mandíbula también lo hace y el
ángulo formado por los dos ma- 2.2. La creación de un flujo de aire
xilares se ensancha. Por el con-
trario, en las articulaciones ce- 2.2.1. Dijimos en el Capitulo primero (véase apartado 1.1 .1) que para
rradas, la lengua se eleva y el que se produzca cualquier tipo de sonido es preciso que previamente
ángulo maxilar es, asimismo, Figun 2.5. Partes de ta lengua. haya existido un movimiento en la fuente que lo origina. El caso de los
más agudo. sonidos del habla no es una excepción.
La cavidad nasal presenta una forma y unas dimensiones fijas : nin- En primer lugar, se hace necesaria la creación de una corriente, de
guna de sus partes realiza movimientos musculares independientes. un flujo de aire en el tracto vocal. En la mayor parte de las ocaSlOnes,
Está dividida por el tabique nasal en dos canales paralelos, o fosas los pulmones, a los que hemos comparado con dos fuelles (véase apar-
nasales, que se abren al exterior por los orificios o ventanas de la nariz tado 2.1.5) son los encargados de crear esa columna de aire que sale al
y que se comunican, en su parte posterior, con la rinofaringe por otros exterior durante la espiración.
orificios denominados coa nas. Las paredes de la cavidad nasal están Para comprender todo el proceso, conviene recordar que el aire
recubiertas por una mucosa gruesa y húmeda. fluye siempre de las zonas de presión más alta a las zonas de presión
Si la úvula, esto es, el apéndice final del velo del paladar, conocida más baja. Asi, para que se produzca la primera fase de la respiración,
vulgarmente como «campanilla», está elevada contra la pared de la llamada inspiración, el volumen de la caja torácica debe aumentar
faringe, la comunicación entre la boca y las fosas nasales se ve mediante la acción del diafragma y los músculos intercostales externos.
interrumpida; si está caída y separada de la faringe, el paso entre Como todo aumento del volumen torácico supone una expansión de los
ambas cavidades permanece abierto . pulmones, la presión del aire en ellos contenido desciende hasta hacer-

36 37
se menor que la presión atmosférica y e llo produce un flujo de aire de nuevo la glotis. Suponiendo que no varíe el ajuste muscular de los
ingresivo, es decir, que penetra en los pulmones. Durante la segunda uritenoides, este proceso continúa repitiéndose en forma periódica y
fase, la espiración, e l diafragma y los músculos intercostales vuelven a cada uno de los golpes de aire que se van sucediendo pone en vibra-
su situación anterior (véase apartado 2.1.2) y, consiguientemente, el ción a los volúmenes de aire contenidos en las zonas supraglóticas del
volumen de los pulmones desciende, la presión interna aumenta y el tracto vocal, los cuales resonarán a diferentes frecuencias en función de
aire es expulsado hacia el exterior en una corriente egresiva. la configuración que presenten las diversas cavidades.
Cuando hablamos, la fase de espiración se prolonga un poco más A la vibración producida de este modo en las cuerdas vocales se la
q ue durante la respi ración habitual en silencio, debido a que la articu- denomina tono laríngeo. En la Fig. 2.6 aparecen representados su es-
lación de un gran número de sonidos entraña la obstaculización de la pectro y su perfil. Como puede apreciarse, se trata de una onda com-
corriente de aire en alguna o varias zonas del tracto oral. pleja periódica que posee una frecuencia fundamental (Fo) de conside-
rable amplitud, y unos armónicos, múltiplos del fundamental, muy débi-
2.2.2. Aunque el sistema anteriormente descrito es el más frecuente- les, pero abarcando un amplio margen de frecuencias (véase, a este
mente utilizado para crear un flujo aéreo, existen otros mecanismos de respecto, lo que explicamos en el apartado 1.1.5 sobre el modo de
los que podemos servirnos . La laringe, tiene, según señalamos (véase vibrar de los cuerpos elásticos). La frecuencia de vibración que alcan-
apartado 2.1.3) una cierta movilidad. Pues bien, e l ascenso de la larin- zan las cuerdas depende de su propia tensión, de su masa y de la
ge , con la glotis cerrada, disminuye el volumen de la faringe y origina presión subglótica que exista en
también una corriente egresiva de aire; su descenso causa, por el e l canal vocal: cuanto mayores lO

contrario, un flujo ingresivo. Independientemente, la lengua puede lle- sean esta pr,?sión Y la tensión
var a cabo vahos movimientos que generen, asimismo , un flujo de este de los pliegues, más alta será
tipo : si bloquea, por ejemplo, la cavidad oral en un punto del paladar y, la frecuencia de vibración y el
preservando el b loqueo, se desplaza hacia adelante producirá una tono del sonido emitido será más
corriente egresiva; si lo hace hacia atrás, una ingresiva. agudo (véase Capítulo 1, apar-
Estos procedimientos laríngeos y orales, sin embargo, provocan tado 1.2.2); cuanto más finas y
flujos de pequeña magnitud comparados con la corriente que crean los más cortas las cuerdas -como O ~~~~~~~~~-
600 1200 1800 2400 3000 3600
pulmones, sobre la cual se articulan, por otra parte, todos los sonidos lo son las de las mujeres y los Frecuencia
de la lengua española . niños- más elevados también
la frecuencia y el tono del so- Figura 2.6. Tono glotal.
nido.
2.3. La fonación Por lo que se refiere al resto de los armónicos componentes su
debilidad es tal, que no podríamos percibir ningún sonido si no existie-
2.3.1. Una vez que contamos con un flujo de aire continuo, el siguiente ran unas cavidades resonantes, a
paso consiste en poner ese volumen de aire en vibración , de modo que lo largo del tracto vocal, que los 10

origine ondas sonoras tal y como explicamos en el capítulo anterior. En amplificaran. En la Fig. 2.7 pue-
un gran número de sonidos esto se logra mediante la acción de las den verse las modificaciones que
cuerdas vocales, en el proceso que denominamos fonación . En el mo- ha sufrido el tono laríngeo al ar-
mento en que va a iniciarse la emisión , los pliegues vocales se juntan e ticularse la vocal [a). Lo que ha
impiden que el aire pase a través de ellos, por lo que la presión del sucedido, en efecto, es que las
aIre en la parte del tracto vocal inferior a la glotis aumenta considera- cavidades situadas más arriba de
blemente. Cuando esta presión subglótica excede a la presión que la glotis - algunas, no todas , en
mantiene juntas a las cuerdas, éstas se separan y pasa un golpe de aire, este caso-- han actuado como OLU~~ ~~1~200~~~~LUIL-
generándose de inmediato entre los propios pliegues una fuerza filtros acústicos (véase aparta- Frecuencia
de succión (conocida como efecto Bernoulli por el físico suizo del do 1.3.3) sobre la onda compleja
siglo XVIII , Daniel Bernoulli, que lo describió) que los acerca y cierra inicial facilitando el paso y refor- Figura 2.7.

38 39
zando a determinados componentes (concretamente los comprendidos
p ues, en un sonido sonoro la glotis vibrará antes y después del relaja-
entre los 500 y los 1100 Hz y entre los 1200 y los 1500 Hz) y eliminan-
mie nto de dicha constricción (cierre absoluto o estrechamiento), en
do o debilitando las frecuencias más alejadas de las resonantes .
tanto que en un sonido sordo sólo lo hará una vez que la salida del aire
Los armónicos que se refuerzan son distintos para cada sonido . Para
se vea libre de obstáculo . Pues bien , en el caso de los sonidos aspira-
ello es necesario que varíen las dimensiones de los resonadores en
dos , sordos generalmente, las cuerdas vocales no comienzan a vibrar
cada caso, lo que se consigue por medio de la articulación , esto es,
hasta un cierto tiempo después de desaparecer el obstáculo formado
mediante los movimientos o posturas de los órganos articuladores para
e n las cavidades superiores, por lo que una determinada cantidad de
interrumpir o modificar la salida de la corriente de aire, continua y
aire escapa antes de iniciarse el sonido siguiente . Consecuentemente,
uniforme. Fonación y articulación no son, pues, términos sinónimos y
la dicotomía aspirado/no aspirado está basada en la sincronización de
así conviene recordarlo.
los movimientos articulatorios con la actuación de las cuerdas vocales.
Más adelante hablaremos con detenimiento de la articulación, pero,
La laringe puede presentar, por otra parte , estados intermedios en
por lo que concierne a la fonación, cabe aún señalar que sO,bre ella se
los que la glotis no está ni abierta ni cerrada por completo .
han formulado diversas teorías. La que hemos expuesto aqUl se conoce
Una posibilidad es que las partes posteriores de las cuerdas, es
con el nombre de teoría mioelástica de la producción de la voz (enten-
decir, las zonas directamente unidas a los cartílagos aritenoides, es-
diendo por «voz» la vibración de las cuerdas vocales). En ella se
tén separadas y las partes anteriores, sin embargo, estén juntas y vi-
asume, según hemos explicado , que los pliegues vocales vIbran como brando .
resultado de la presión sub glótica combinada con el llamado «efecto
En esas circunstancias, se producirá un sonido que podríamos de-
Bernoulli» y en función de las propiedades elásticas características de
nominar suspirado , porque su mecanismo de producción es el mismo
las mismas cuerdas . Durante los años cincuenta, sin embargo, el cientí-
q ue actúa en los suspiros y, en general, siempre que la espiración se
fico francés Raoul Husson propuso una nueva teoría denominada neuro-
hace audible . En este tipo de emisiones, la velocidad de salida de la
cronáxica, según la cual las vibraciones laríngeas no tendrían este
corriente de aire experimenta un aumento considerable y , si queremos
origen «mecánico» o aerodinámico que se les supone, sino que respon-
deríail a la estimulación y contracción nerviosa experimentadas rítmi-
camente por los músculos de las cuerdas vocales, cuyo movimiento
estaría, por tanto, dirigido por el cerebro mediante impulsos nerVIOSOS.
Esta teoría neurocronáxica no cuenta en la actualidad con muchos de-
fensores, en tanto que la mioelástica es aceptada generalmente y, por
ello, la hemos presentado aquí.

2.3.2. La actividad fonatoria de la laringe descrita en el apartado ante-


rior divide a los sonidos en sordos si la glotis está abierta y no hay, en
consecuencia, vibración, y sonoros si se dan todas las condiciones Sonido Sonido Voz
enumeradas y se produce un tono laríngeo modificado con posteriori- sordo sonoro suspirada
dad en el tracto vocal. Pero, además de éstas, la laringe presenta otras
posibilidades fonatorias . . .
Consideremos, en primer lugar, el caso de las lenguas que dlstm-
guen sonidos aspirados de sonidos no aspirados. En inglés, por ejem-
plo, determinadas consonantes como la [p], ~a [t] o la [k] ,. SI van en
posición acentuada inicial de palabra, se realIzan como aspIradas. No
así en otros contextos . Pero, ¿en qué consiste la aspiración?
Cuando articulamos cualquier sonido, sea éste sonoro o sordo , las
Voz rota Voz susurrada
cuerdas vocales empiezan a vibrar inmediatamente después de que
desaparezca la constricción existente en el tracto. De esta manera, Figura 2.8.

40
41
suprimir el efecto obtenido, habrá, por tanto, que reducirla por medio formado por los labios aumenta de forma considerable, hasta que, al
de los músculos respiratorios. El sonido [h) del inglés comprehensive, separarse bruscamente éstos, es liberada y actúa como un único estí-
por ejemplo, responde a estas características. mulo para excitar los volúmenes de aire contenidos en las cavidades
Si, por el contrario, las partes posteriores de las cuerdas vocales del tracto. Por lo tanto, la [p) es un sonido producido con un ruido de
están unidas y son las anteriores las que dejan pasar el aire, vibrando al explosión debido a la acción de una fuente transitoria .
mismo tiempo, tenemos la así llamada voz rota o cascada.
2.4.2. Los dos tipos de fuente que acabamos de describir en el aparta-
Finalmente , en el susurro o murmullo, las cuerdas vocales se acer-
do 2.4.1 pueden combinarse entre sí y con la fuente glotal. Por consi-
can e, incluso, pueden llegar a juntarse por su parte delantera , dejando
guiente, su actividad no está restringida a los sonidos sordos - aunque
un espacio más amplio entre los cartílagos aritenoides.
en ellos es decisiva-, sino que se extiende también a algunos sonidos
Todas estas modalidades de fonación , esquematizadas en la Fig. 2.8,
sonoros. Veamos algunos ejemplos.
junto con otras en las que no nos vamos ahora a detener , pueden
combinarse entre si, de modo que las variedades fónicas se multipli- • El sonido [6), de ido, por ejemplo, es el resultado de la acción de
can. Vemos, pues, que la actividad de la laringe ofrece un gran número la fuente periódica o glotal -dado que es sonoro- y de una
de posibilidades para la realización de sonidos distintos. fuente de ruido turbulento ocasionada al crearse un estrecha-
miento entre la punta de la lengua y la cara interna de los incisi-
2,4, Tipos de fuente vos superiores.
• El sonido [b) posee también dos fuentes, la glotal-es sonoro- y
2.4.1. Consideremos ahora el caso de los sonidos que hemos llamado la de ruido transitorio , puesto que se articula con un cierre abso-
sordos, es decir , aquellos en los que la corriente de aire atraviesa la luto del canal, como la sorda [p).
glotis abierta sin generar turbulencia o ruido alguno. En ellos no actúa • La consonante [tn es decir, la eh española de chato, chopo, etc.,
una fuente periódica o glotal o, dicho en otros términos, no ha existido combina una fuente de ruido transitorio con una de ruido turbu-
una vibración de las cuerdas vocales que haya originado el tono larín- lento, al articularse mediante un cierre inicial y un estrechamiento
geo inicial. En consecuencia, debe haber otra fuente, aunque ya no sea posterior (véase Capítulo 5, apartado 5.6).
periódica (de pulsos repetidos a intervalos regulares) como la laríngea, • Finalmente, el sonido [d3) - la y de cónyuge, yugo, etc.- ejem-
sino que produzca ruido turbulento y/o transitorio . Dicha fuente de plifica la cuarta posibilidad: una fuente glotal (porque es sonoro),
ruido , creada mediante la acción de los diferentes articuladores, estará junto con una fuente de ruido transitorio y otra de ruido turbulen-
situada en alguna zona del tracto vocal y consistirá, básicamente, en un to (porque existe, como en el caso anterior, un cierre y un estre-
estrechamiento o un cierre de éste. chamiento).
Si, por ejemplo, articulamos una [s)-que es un sonido consonántico En el esquema de la Fig. 2.9 se recogen todas las posibilidades.
sordo- el flujo de aire atraviesa libremente la glotis, pero se ve obli-
gado a pasar a través de una zona estrechada del tracto, a la altura Vocales Consonantes
aproximada de los alveolos superiores. Cuando una corriente rápida
de aire atraviesa una constricción se crean, como sabemos, turbulen- Sonoras Sordas
cias en ella. Estas perturbaciones, que son aleatorias (en cuanto que no ,
Oclusivas , Fricativas Oclusjvas Fricativas
son previsibles las alteraciones que sufren las partículas a partir de su
estado de reposo), constituyen una fuente de ruido turbulento . La [s) es, Fuente glotal + I Fuente glotal + Fuente de ruido I Fuente de ruido
Fuente Fuente de ruido : Fuente de ruido transitorio I turbulento
pues, un tipo de sonido de ruido turbulento producido por un estrecha-
miento.
glotal transitorio
: turbulento I

Afrjcadas Africadas
Si pronunciamos, en cambio , una [p) - también consonante sorda-
juntamos los labios, cerramos el canal e impedimos así la salida del aire Fuente glotal + Fuentes de ruido Fuentes de ruido transitorio y
durante una o dos centésimas de segundo. En ese breve periodo de transitorio y turbulento turbulento
tiempo no se genera energía acústica alguna (recordemos que la fuente
glotal no ha intervenido), pero la presión del aire detrás del cierre Figura 2,9,

42 43
Asignamos las denominaciones oclusiva, frica tiva y africada, res- Pues bien, cada una de esas zo-
pectivamente, a los sonidos articulados con un cierre completo del nas espectrales en las que se F,
tracto oral ([p), lb), etc.), a los que s6lo requieren un estrechamiento concentra la energía acústica se 10
([s), [f), etc.) y a los que combinan ambos modos de articulación ([íj'J, denomina forman/e. Este término [il
[d3), etc.). Explicaremos más detenidamente estas clasificaciones en es, en su origen, una palabra 5
r,
próximos capítulos. Por el momento basta recordar que la corriente alemana y lo usó por vez prime-
con que contábamos en un comienzo y los volúmenes de aire conteni- ra el físico Ludimar Hermann en
dos en las distintas cavidades pueden verse perturbados por la acción la segunda mitad del siglo XIX.
300
de varias fuentes diferentes, especialmente si estamos pronunciando Los formantes de un sonido
una consonante. En el caso de las vocales, todas ellas sonoras, actúa dependen, como vemos, directa-
siempre la fuente glotal. (Para las vocales «sordas» existentes en algu- mente de la configuración que
nas lenguas amerindias, v. Ladefoged: 1971 , 11.) presente el tracto vocal para r,
pronunciarlo y caracterizan a 10 r,
ese sonido frente a todos los de- [al
2.5. La resonancia en el tracto vocal: los formantes más. En consecuencia, aunque 5 r,
alteremos la frecuencia funda-
2.5.1. Hemos dicho que en todos los sonidos sonoros las cuerdas voca- mental con la que lo pronuncia-
les producen un tono laríngeo -un zumbido característico- compues- mos, para obtener un tono más
700 1'00
to por la frecuencia fundamental y sus armónicos múltiplos . Hemos alto o más bajo, la situación de
explicado también que ese tono laríngeo sufre modificaciones cuando los formantes no variará, es de-
la vibración se transmite a las cavidades superiores del tracto vocal, en cir, no se alterará la cualidad o FI!J1ll"l 2.10.
lo que constituye un ejemplo claro del fenómeno físico de la resonancia timbre de dicho sonido y su es-
(véase apartados 1.3 y 2.3.1). En efecto, el canal vocal es un resonador pectro presentará el mismo tra-
con varias frecuencias naturales de vibración (puesto que se subdivide zado. Las características del trac- l(dB)
en varias cavidades), que refuerza determinados componentes de dis- to determinan su respuesta como Onda A
tintas frecuencias de la onda glotal. Los valores de las frecuencias resonador, que será la misma [a]
naturales del tracto vocal dependen de su forma : en consecuencia, para cualquier tono laríngeo .
cada modificación del tracto implica el cambio de sus frecuencias natu- Veámoslo con los ejemplos de la
rales de vibración y el reforzamiento de diferentes armónicos del tono Fig. 2.11. F,-
100 Hz
laríngeo en cada caso. Con independencia de que las 1100 "00 P(Hz)
Consideremos, por ejemplo, las vocales castellanas [a) e [i) , pronun- lineas espectrales que represen-
ciadas con la misma altura tonal y por la misma persona, es decir, con tan los armónicos estén más se-
la misma frecuencia fundamental. El tono laríngeo del que se parte en paradas entre sí en la onda B
ambos casos será idéntico, pero, para cada uno de estos sonidos, se que en la onda A, como resultado l(dB)

reforzarán distintos hipertonos en función de la forma que presenta el del aume nto de frecuencia fun- [al
tracto vocal: para la [a) , la cavidad bucal totalmente abierta, con una damental , se observa que el es- Onda B
separación de unos 10 mm entre los incisivos, y la cavidad faríngea pectro presenta la misma envol-
disminuida por e l retroceso de la raíz de la lengua: para la [i), el dorso vente, o curva de respuesta con
de la lengua elevado hacia el paladar duro dejando un canal estrecho similares cimas de amplitud en r, -
para la salida del aire y los labios estirados. El resultado es el que se idénticas zonas de frecuencias . 200 Hz '-;;~~~':'::':-'-Ll::~-'-:+.
200 600 1100 2200 P(Hz)
ofrece en la Fig . 2.10. Este fenómeno explica que un
Mientras que en la vocal [a) se observan picos en torno a los 700 sonido particular se reconozca
Hz y a los 1.200 Hz, en [i) están situados en torno a los 300 y 2.000 Hz . como tal y no se confunda con Figura 2.11.

44 45
ningún otro tanto si es pronunciado por un hombre, una mujer o un niño,
pese a las considerables diferencias en las dimensiones del tracto vocal
y en la gama de frecuencias fundamentales que existen entre ellos.
El conjunto de los formantes y su especial disposición es lo que
denominamos estructura [ormántica .·

2.5.2. De todos los sonidos sonoros, los que presentan una estructura
formántica más clara son las vocales. Para su reconocimiento y diferen·
ciación, basta señalar los valores que presentan los dos primeros foro
mantes en cada una de ellas. Cuando decimos «dos primeros forman·
tes" o, lo que es igual, FI y F" nos estamos refiriendo a los dos forman·
tes que poseen frecuencias más bajas. En el ejemplo de la Fig. 2.11, el
FI estaria situado en torno a los 600 Hz, Y el F, a los 1.000 Hz. Los valores del
tercer formante, F" y de los restantes que pudieran aparecer no suelen
citarse excepto para dar cuenta de algunas características peculiares
de ciertas vocales (nasalización, retroflexión, etc .) o para reflejar las
divergencias debidas a factores individuales (edad, sexo, particulari-
dades anatómicas ... ) y sociales (lengua o dialecto utilizado, condición
social, etc.).
En el Capítulo 5 veremos cuáles son las estructuras formánticas de
las vocales del castellano, qué relación guardan en cada caso con las Figura 2.12.
propiedades articulatorias, y cómo pueden compararse entre sí me-
diante las llamadas cartas de [arman/es cuya elaboración explicaremos
aquí con brevedad. por ejemplo, en el caso de las consonantes sordas, sean fricativas u
Una carta de forman tes es un gráfico sobre cuyos dos ejes, el de oclusivas?
abscisas y el de ordenadas, se representan los valores del F, y el del F;, El tracto vocal actúa, también en estas ocasiones, como resonador,
respectivamente. Las escalas de frecuencia utilizadas son logarítmicas, de modo que el ruido originado en alguna zona del canal -labios ,
de forma que los intervalos sonoros que nosotros percibimos como alveolos, dientes, etc.- se verá modificado considerablemente en ra-
iguales se corresponden con distancias también iguales, reproducien· zón de la configuración que presente el tracto a ambos lados del obs-
do así mejor las impresiones tonales relativas que el oyente recibe . En táculo interpuesto a la salida del flujo de aire. Así, la diferencia entre
la Fig. 2.12 presentamos una carta de formantes, antes de que se hayan una fricativa [O] , como la z de zapa/o , y una fricativa [x], como la j de
trasladado a ella los valores de éstos, para obtener finalmente un resul- j amón , viene dada entre otros factores físicos complejos por la distinta
tado como el que se muestra en la Fig. 5.6, del Capítulo 5. longitud de las cavidades constituidas en uno y otro caso: en el de [O],
Las consonantes sonoras que poseen características vocálicas, como consonante interdental pronunciada con la lengua entre los bordes de
la [m] de mes o la [1] de luz, también ofrecen una estructura formántica los incisivos, la formación de un resonador posterior largo e indiviso,
que, aunque definida, nunca es tan clara como la que ofrecen las voca- que abarcaría desde los dientes a la faringe, explica el predominio de
les. La estudiaremos en detalle cuando consideremos, uno por uno, los las frecuencias situadas por encima de los 5.000 Hz. En el caso de la [x],
sonidos consonánticos del español. por el contrario , la cavidad resonadora más amplia está situada delante
del obstáculo, esto es, del estrechamiento que produce el postdorso de
2.5.3. Si esto que acabamos de explicar es lo que sucede en todos los la lengua elevado contra el velo del paladar, por lo que se ven reforza-
sonidos sonoros, es decir , en los generados por una fuente periódica das frecuencias más bajas. Comprobamos, pues, que el tracto vocal
glotal - las cuerdas vocales- , ¿qué ocurre con aquellos otros que son actúa como un [iltro (véase apartado 1.3.3), absorbiendo y reduciendo
producto de una fuente de ruido turbulento o transitorio? ¿Qué sucede , las amplitudes de algunos de los múltiples componentes de los ruidos y

46 47
modificando las de aquellas otras frecuencias que coincidan con las
frecuencias resonantes de las distintas cavidades.

2.5.4. Señalemos, finalmente , que en aquellos sonidos producidos me-


diante la acción combinada de dos fuentes, la glotal y la de ruido
transitorio o turbulento, las modificaciones del tono laríngeo y de la
turbulencia que la articulación conlleva se superponen , de modo que el
espectro de sus ondas presentará al tiempo características propias de
los sonidos periódicos y de los aperiódicos. Así, una consonante fricati-
va sonora como la [z] ([s] sonorizada) que aparece en la palabra espa-
ñola asma exhibe un formante situado en las bajas frecuencias y, a la
vez, una distribución desordenada de la energía a lo largo de una
amplia zona de altas frecuencias. Técnicas
En resumen, hemos visto que los sonidos del lenguaje son produci-
dos a partir de una señal , periódica o aperiódica , generada por una
instrumentales
fuente y modulada posteriormente por las resonancias de las diferentes
cavidades. Este proceso es, en realidad, la base de toda la infinidad de
sonidos que los seres humanos podemos pronunciar y , por su especial
carácter, ha atraído la atención. desde antiguo, de numerosos estudiosos.
En el próximo capítulo , daremos un repaso a las principales técnicas de 3.1. Los primeros métodos
las que los fonetistas se han servido para investigar científicamente la
naturaleza real de las emisiones fónicas.
3.1.1. La práctica totalidad de las descripciones fonéticas clásicas esta-
ban basadas sobre la observación de los movimientos articulatorios y
las distintas impresiones auditivas que ellos producían. Así pues , para
realizar su trabajo , los fonetistas se apoyaban, por una parte, en su
propia habilidad para reconocer, al oírlos , los diversos tipos de soni-
dos y , por otra, en algunos métodos no demasiado sofisticados, como ,
por ejemplo, el método palatográfico.
Este sistema consiste en introducir en la boca un paladar artificial
recubierto de una sustancia especial, de tal modo que, al entrar la
lengua en contacto con determinadas zonas del mismo durante la pro-
nunciación de los diferentes sonidos, estas partes de su super[¡cle
quedan limpias y claramente delimitadas. A pesar de que este método
ha experimentado modificaciones y mejoras importantes , con las que,
como explicaremos más adelante , sigue usándose en la actuahdad , los
palatogramas que con él se obtienen no informan más que sobre lo
que sucede en la cavidad oral, dejando al margen la faríngea o la
nasal. Además, no se determina cuál es el volumen y la forma de la
boca cuando se establece el o los contactos de la lengua con el falso
paladar. .
Con posterioridad, la plastograffa supuso un importante avance
dentro del conjunto de técnicas instrumentales de carácter fisiológico
o , si se prefiere, articulatorio . Ideado por E. A. Meyer, este procedi-
48
49
miento consistía en introducir en
la boca un paladar artificial del 3.2. Las nuevas técnicas
que pendían un conjuntos de fi-
nos hilitos de estaño, los cuales 3.2.1. Conviene, ante todo, distinguir con claridad los procedimientos
se doblaban en cada pronuncia- aplicados a investigar la generación del sonido y la articulación qu~ lo
ción y adoptaban, así, la forma conforma, de aquellos otros destinados a analIzar los resultados acustI-
de la lengua. Su mayor ventaja cos a los que da lugar la combinación de ambas actividades . Vamos a
era que proporcionaba la ima- referirnos, en primer lugar, a los métodos utilizados para medIr el
gen de la configuración que la volumen, la presión o la velocidad de la corriente de .aire, factores
cavidal bucal presenta delante y todos que, como ya explicamos, condicionan la generacIón de somdo
detrás de la zona de articulación (v. al respecto Hardcastle, 1985).
de que se tratara, brindando así Actualmente, el volumen de aire empleado en el habla puede me-
dirse con el espirómetro, que podemos describir, a grandes rasgos,
una información más completa Figura 3.1. Un palatograma.
que la que ofrecía el método pa- como una caja vacía de metal con una tapadera que se desplaza al
latográfico. penetrar el aire procedente de los pulmones en ella. El regIstro de este
desplazamiento se hace mecánica o eléctricamente en un c~lmdro rota-
No faltaron, por otra parte , intentos de conseguir aparatos válidos torio y a partir de él se puede estimar cuál es la capacIdad de los
par~ estudIar las condiciones aerodinámicas en que se generan los
pulmones y del tracto vocal del sujeto estudiado . .
somdos o los efectos acústicos que se producen en cada caso. El quimó-
Por lo que respecta a la presión del aIre en las cavIdades oral y
grafo, por ejemplo, fue creado en 1847 por Karl Ludwig, con el princi-
faríngea, es posible establecerla introduciendo en una de ellas, . o en
pal objeto de regIstrar la cantidad de aire espirado en la unidad de
ambas un tubo conectado a un conversor que transforma las vanaClO-
nes d~ la presión aérea en variaciones de voltaje, reflejables en un
tIempo. En su variante más antigua, el quimógrafo constaba de un
cIlmdro que giraba alrededor de su eje y que se recubría con papel
gráfico. Más en concreto, el nivel de presión sub glotal. ~uede obtener-
ennegrecIdo con el humo de una llama. Sobre este papel se recogían
se introduciendo un tubito en la tráquea, por un onfIclO practIcado
los movm~Ientos de un estilete apoyado en él. Cuando se ponía en
debajo de la laringe, o bien, si se desea evita:- esta delicada inter-
funcIOnamIento el aparato, la persona cuya pronunciación interesaba
vención sondando el esófago mediante un cateter termmado en un
debía hablar por una bocina, conectada por un tubo de goma con una
globo, ~arcialmente inflado, que se sitúa en la parte inferior de la
membrana lo bastante tensa para vibrar, y los movimientos de esta
laringe y que recoge las variaciones de presIón en ese punto.
membrana se transmitían al estilete, unido a ella, que los inscribía
sobre el papel. El quimógrafo, del que hemos hablado antes (véase apartado 3.1.1)
ha sufrido varias modificaciones en relación a su formato antIguo . Las
Más tarde, el científico alemán Hermann Helmholtz inventó los lla-
impresiones sobre papel ennegrecido se han sustituido; en los modelos
mados resonadores de Helmholtz, conjunto de cavidades de frecuen-
actuales, por mecanismos eléctricos que sIguen utIlIzar:dose para re-
cias naturales de resonancia diferentes, con los que su creador intentó
producir la relación volumen/velocidad del flUJO de aIre que sale o
formar sonidos similares a las vocales. La frecuencia fundamental la
entra en la cavidad oral y/o nasal.
proporcionaba un diapasón, en tanto que los tonos más elevados se
Existen aún otros muchos aspectos de la que, en terminología de J.
obtenían, a partir de ella, en los ocho resonadores que componían el
sistema. C. Catford (1977), se denomina «fase aerodinámica» -es decir, elyro-
ceso por el cual, bajo determinadas condiciones, se genera la cornente
. Con todo, es en la segunda mitad de este siglo cuando se ha produ-
de aire que origina el sonido- susceptibles de ser estudIados y r:nedI-
CIdo el avance más espectacular en el diseño y la fabricación de instru-
dos en laboratorio. No vamos a detenernos aquí en la descnpclo~ de
mentos aplicables al estudio de la fonética. Mencionaremos algunos de
ellos en el próximo apartado. los equipos utilizados en esa labor. Baste señalar que puede, po~ eJem-
plo, investigarse la velocidad de las partí~ulas de aIre, el tIpo de
corriente, turbulenta o no, de que se trata, e, mcluso, puede consegUIr-
se la visualización de la trayectoria del flujo de aire dentro y fuera de la
boca.
50
51
3.2.2. En lo que se refiere a la observación y medición de los movi- 3.2.3. Una vez que el sonido ha sido generado y modulado,. las carac-
mientos articulatorios. las técnicas son numerosas y muy diversas. terísticas fisicas de la onda q ue lo produce pueden anallzarse con
Para estudiar las variaciones en el tamaño de la caja torácica suele diversos medios electrónicos, entre los cuales destacaremos el espec-
usarse la cinerradiografla. aunque hay otras opciones. Una de ellas, y trógrafo de sonido y e l oscilógrafo u osciloscopio. Veremos, en primer
no la más compleja, consiste en llevar a cabo una pneumografla, es lugar, en qué consiste este último aparato. . '
decir, un registro de los cambios en el perímetro torácico, el cual, El osciloscopio convierte la onda sonora en onda lummosa y SIrve,
previamente, se rodea por uno o varios «cinturones». Mediante cual- básicamente. para reproducir su forma en una pantalla. Su elemento
quier mecanismo apropiado para el caso, se van reflejando las altera- principal es un tubo de rayos catódicos con la pantalla en uno de sus
ciones en la tensión o tirantez de estas bandas, lo que, claro está, nos extremos. pero necesita, además, una fuente de allmentaclón, tres am-
proporciona la información deseada sobre el tamaño del tórax. plificadores y una base de tie mpos. Como parte mtegrante del tubo se
Los desplazamientos verticales de la laringe (véase apartado 2.1.3) e ncuentra un cátodo, que no es sino un electrodo capaz de emItIr,
se pueden observar a través de la cinefotografía o con un instrumento cuando se calienta al ser conectado a la red eléctrica, un haz de electro-
llamado cricrotirómetro, que rastrea estos movimientos con su brazo nes. Ese haz converge en la pantalla, dond e aparece como un punto
telescópico, en tanto que la actividad de los cartílagos laríngeos puede luminoso que, desplazándose vertical y horizontallnente, describe la
recogerse mediante cinerradiografía. forma de la onda sonora. Los informantes utilizados en los expenmen-
La laringoscopia, por otra parte, supone la observación directa o, tos han de hablar por un micrófono directamente conectado al aparato ,
incluso, la fotografia desde arriba de la glotis. Actualmente se utiliza de modo que, al no utilizarse bocinas o máscaras como sucedía en el
para este propósito la fibra óptica, que ilumina la glotis al tiempo que quimógrafo, se e liminan las consig uientes deformaCIOnes del habla de
transmite su imagen a la cámara o al investigador. Otro conjunto de cada individuo.
técnicas, encuadradas bajo la denominación general de glotografia, se El espectrógrafo, también llamado sonógrafo, lleva a cabo el análi-
emplean a menudo para estudiar los estados de la laringe. En todas sis de la onda compleja en sus armónicos componentes. Es, por tanto, la
e llas, se hace pasar luz de un lado a otro de la glotis, de modo que los constatación instrumental del teorema de Fourier (véase Capitulo 1,
cambios producidos en el área de ésta se traduzcan en variaciones en apartado \. \. 5). Desarrollado en los laboratorios americanos de la Bell
la intensidad de la luz, fácilmente registrables. Telephone Ca . durante el de-
Los movimientos producidos en las cavidades supraglóticas, y las cenio 1930-1940, el principal
propias cavidades, se examinan con la ayuda de radiografías o fotogra- objetivo de sus diseñadores
fias. En el caso de la úvula, el procedimiento más cómodo para averi- fue encontrar un método para
guar su posición es, sin duda, comprobar el flujo de aire que sale de la volver visible el habla de for-
cavidad nasal (véase apartado 2.1.4). ma que los sordos pudieran
La palatografia continúa usándose , como ya dijimos, para obtener leerla y vieran, así, aumenta-
información sobre las zonas de contacto de la lengua con el paladar, si das sus posibilidades de co-
bien ya no se utiliza el paladar falso, sino que se recubre directamente municación. A lo largo de la
el auténtico con un polvo oscuro. Por lo general, el palatograma se segunda guerra mundial, a
acompaña dellinguagrama, fotografía de la lengua en la que se obser- este propósito se sumó el de
van cuáles de sus zonas están coloreadas como resultado de haber conseguir un instrumento para
tocado el paladar. analizar los mensajes inter-
En los laboratorios de fonética convenientemente preparados y pro- ceptados e identificar , al mis-
vistos de material podemos encontrar todos los instrumentos necesa- mo tiempo, a los emisores.
rios para aplicar éstas y otras técnicas que aquí no mencionamos. El espectrógrafo se compo-
Cuando las circunstancias no son tan favorables y no se dispone del ne básicamente de cuatro ele-
equipo adecuado, es posible, sin embargo, extraer conclusiones con- mentos: un sistema de graba-
cernientes a la articulación de las mediciones de las condiciones aero- ción, un sistema de filtrado, un
dinámicas o acústicas . tambor giratorio conectado al Figura 3.2. Un espectrógrafo.

53
52
sistema de grabación y recubierto de un papel especial y una aguja De este modo, la onda compleja inicial va siendo descompuesta en
eléctrica para inscribir sobre este papel. Trataremos de explicar el sus armónicos componentes, que aparecerán ordenados de abajo arri-
funcionamiento de todo el conjunto de modo simple. ba en el papel según va aumentando su frecuencia. El resultado final
Cuando queremos analizar una emisión tenemos, en primer lugar, es lo que conocemos como sonograma o espectrograma . En la Fig. 3.3
dos opciones: o hablar directamente frente al micrófono que el propio reproducimos uno de estos registros .
espectrógrafo posee, o efectuar una grabación de nuestra voz en cinta
con el magnetófono que el aparato lleva incorporado y operar después
sobre ella. Esta segunda posibilidad es la más recomendable porque
nos permite comprobar la calidad de la grabación, reproduciéndola
cuantas veces deseemos, y porque posibilita también la conservación
en archivo de la emisión analizada. La duración máxima que puede al-
canzar una emisión grabada, para este tipo de análisis, es 2.4 segundos.
Una vez realizada dicha operación, la grabación se somete a un
proceso de filtrado para seleccionar sólo unas determinadas bandas de
frecuencias (recuérdese lo que explicamos sobre los filtros de pasa
banda en el apartado 1.3.3). Un filtro puede admitir, por ejemplo, todas
las frecuencias comprendidas entre los 155 y los 200 Hz y reducir la
intensidad de todas las que quedan fuera de estos márgenes. En tal
caso, decimos que el ancho de banda del filtro abarca 45 Hz. Pues bien,
el sistema de filtrado de un espectrógrafo consta, en realidad, de un
único filtro que normalmente posee un ancho de banda de 45 Hz o 300
Hz - banda estrecha o banda ancha- y cuyos márgenes de frecuencia
se desplazan a lo largo de toda la gama recogida por el aparato (por lo
general, de los 80 a los 8.000 Hz). Esto quiere decir que, si optamos por
el ancho de banda de 45 Hz, el mismo filtro efectuará 176 filtrados Figuza 3.3. Espectrograma de banda ancha.
diferentes: de los 80 a los 125 Hz, de los 125 a los 170 Hz, de los 170 a los
215 Hz, etc., hasta los 8.000 Hz. Como puede verse, en el eje de ordenadas se marcan las distintas
A medida que la grabación o los sonidos pronunciados directa- frecuencias y en el de abscisas, el tiempo. Este espectrograma es de
mente en el micrófono pasan una y otra vez por este circuito, el filtro irá banda ancha, es decir, se ha realizado utilizando unos filtros de 300 Hz
variando sus márgenes de frecuencia, captando, en cada caso, las cada uno, mientras que el que se presenta en la Fig . 3.4 es de banda
señales componentes de las ondas complejas comprendidas dentro de estrecha, obtenido mediante filtros de 45 Hz.
ellos y eliminando las que queden fuera . 3.2.4, La representación que brindan los sonogramas de banda ancha
Si el sonido que analizamos tiene, por ejemplo, una frecuencia fun- es la más adecuada para estudiar la secuencia de los sonidos del habla,
damental de 200 Hz Y estamos utilizando un filtro de banda estrecha (45 en tanto que los espectrogramas de banda estrecha resultan ser los más
Hz) como el que explicábamos anteriormente, los dos primeros filtra- indicados para el análisis de la entonación de la frase . La razón de esta
dos (de los 80 a los 125 Hz Y de los 125 a los 170 Hz) no producirán diferenciación es fácil de entender si pensamos que el filtro de banda
ningún tipo de registro, simplemente porque en esa gama de frecuen- estrecha presenta una mejor resolución de frecuencia y el de banda
cias no hay energía alguna que registrar. El tercer filtrado, sin embar- ancha, una mejor resolución de tiempo. ¿Qué quiere decir esto?
go, abarca todas las frecuencias desde los 170 Hz a los 215 Hz y, por Los filtros -o los resonadores en general- que responden bien a
consiguiente, detectará la intensidad del fundamental, convirtiéndola una gama reducida de frecuencias (es decir , los que poseen un ancho
en corriente eléctrica. La corriente activa la aguja y ésta inscribirá de banda menor , véase apartado \.3.2), tienen la particularidad de que
sobre el papel sensible a las señales eléctricas, colocado previamente retienen bastante tiempo la vibración que se les ha transmitido porque
sobre el tambor, una linea oscura: el registro del fundamental. la amortiguación es muy pequeña . Eso significa que, si a un filtro de

54 55
tado 2.5.1), si los tuviera , se observan mejor en este último tipo de
registros, puesto que aparecen como anchas barras oscuras conforma-
das por armónicos de gran intensidad y situadas en zonas de frecuencia
diversas e n cada caso. Por otra parte, al tener una mejor resolución de
tiempo, los filtros de banda ancha detectan y recogen todos los fenóme-
nos acústicos que se produzcan, aunque se sucedan con una gran
rapidez. Así, las finas estrías verticales que se perciben en ellos se
corresponden con los impulsos de aire de la corriente glotal, produci-
dos al abrirse las cuerdas vocales.

3.2.5. Un sonograma nos proporciona también información sobre la


intensidad global de los sonidos y sobre la amplitud de cada uno de sus
componentes.
Si contemplamos de nuevo la Fig. 3.3 observaremos en ella una
curva, situada en la parte superior del espectrograma y cuyos ascensos
y descensos representan, respectivamente, los aumentos y disminucio-
nes de la intensidad a medida que se van sucediendo los sonidos. Esta
es la llamada curva de intensidad, mediante la cual podemos apreciar a
simple vista las diferencias existentes entre los segmentos que compo-
Figura 3.4. Espectrograma de banda estrecha. nen la emisión. Si deseamos expresar tales variaciones de modo exac-
to, podemos hacerlo aplicando la medida de conversión generalmente
este tipo, que haya respondido ya a una primera señal, se le hace llegar aceptada, según la cual 1 mm de distancia en el papel del sonograma
una segunda en un breve período de tiempo, la salida que obtendre- equivale a 1 dB de diferencia en la intensidad sonora.
mos (véase apartado 1.3.2) será la superposición de los dos efectos, el En el caso de que nos interese conocer cuál es la amplitud relativa
primero y el segundo, sin posibilidad alguna de distinguirlos. de cada armónico de un cierto sonido, debemos programar el espec-
Los filtros de banda ancha, en cambio, no diferencian las frecuen- trógrafo para que nos brinde
cias demasiado próximas, pero tienen un alto grado de amortiguación, la sección de ese sonido. En
por lo que el fenómeno antes descrito no se produce nunca en ellos: la Fig, 3,5 se reproduce la sec- [el
cuando la posible segunda señal los alcanza, el efecto de la primera ya cción correspondiente a la vo-
ha desaparecido. Así pues, la resolución de frecuencia (capacidad para cal [e].
separar frecuencias cercanas) es mayor en un filtro de 45 Hz que en Como puede apreciarse, se
uno de 300 Hz, pero la resolución de tiempo (capacidad para distinguir trata de un corte del sonido
las señales próximas en el tiempo) es mucho menor en el primer caso en un determinado momento
que en el segundo. de su extensión, Las frecuen- 2 3 4 5
Si comparamos ahora los dos espectrogramas de las Figs. 3.3 y 3.4, cias componentes se ordenan, Frecuencia (kHz)
comprobaremos que entre ellos hay algunas diferencias evidentes, de menor a mayor y de iz-
atribuibles a las también distintas propiedades de los filtros con los que quierda a derecha en el eje Figura 3.5
fueron realizados, según acabamos de explicar. En el sonograma de horizontal, mientras que la in-
banda estrecha, cada línea horizontal representa un armónico y los tensidad relativa en dE que éstas presentan se refleja en el eje verticaL
blancos que entre ellos quedan revelan la ausencia de energía en esas La mayor diferencia de intensidad que un filtro es capaz de registrar
frecuencias. En el sonograma de banda ancha, sin embargo, el análisis es de 30 dB , de modo que cualquier armónico inferior es más de 30 dB
no llega a tales extremos y las manchas horizontales comprenden va- al armónico más fuerte aparecerá en la sección con intensidad cero,
rios armónicos juntos. Los forman tes del sonido estudiado (véase apar- Al margen de estos dos procedimientos, aún podemos deducir el

56 57
grado de intensidad de un sonido a partir del negror con que se refleje do por A. Quilis (Quilis, 1983: 425). Comprobamos la aparición de la
su estructura en el espectrograma: a mayor oscuridad, más intensidad. curva de intensidad en su parte superior, la existencia de formantes a
diferentes alturas en los sonidos armónicos y, también en ellos, la
3.2.6. La frecuencia fundamental de la onda compleja periódica puede presencia de estrlas verticales o pulsos glotales. Fijémenos ahora en
estudiarse tanto sobre un espectrograma de banda ancha como sobre aquellos otros sonidos que no poseen fuente penódlca, es decIr, los
uno de banda estrecha. En el primer caso, las finas estrías verticales. inarmónicos: la [s], la rífl y la [k].
espaciadas a lo largo de toda la escala de frecuencias y que, como El primero es un ejemplo óptimo de ruido turbulento (véase aparta-
explicamos (véase apartado 3.2.4), se corresponden con cada abertura do 2.4 .1) y, como tal, presenta una distribución desordenada de la
de las cuerdas vocales, nos sirven para calcular la Fo del sonido. En energía, en este caso en las frecuencias altas.
efecto. la separación que existe entre estas líneas representa el perío- La [k], por su parte, se debe a una fuente transitoria y es un ruido de
do de vibración de manera que, si medimos esa distancia y calculamos explosión. Su imagen espectrográfica se resuelve en dos componentes
después el período (a partir de la equivalencia 1 mm = 7,5 milésimas sucesivos: un espacio en blanco que refleja la ausencia de energía - la
de segundo), deduciremos la frecuencia con facilidad, puesto que sa- salida del aire está obstaculizada por cierre del canal- y una barra
bemos que ambos valores son inversamente proporcionales (F = l/?). vertical, de mínima duración y no siempre presente, que representa la
La segunda posibilidad es realizar un espectrograma de banda explosión producida al deshacerse el obstáculo de manera brusca.
estrecha y determinar sobre él a qué altura del eje de ordenadas está Finalmente, la [tn combina las características de los ruidos de ex-
situado el primer armónico, esto es, la frecuencia fundamental. Actual- plosión y de los turbulentos y ello se refleja con claridad en nuestro
mente se dispone de espectrógrafos que permiten obtener ampliacio- espectrograma.
nes de las bajas frecuencias -en concreto, de los primeros 500 Hz- en Así pues, el análisis espectrográfico ilustra las diferencias entre
las que pueden apreciarse con toda claridad las variaciones de fre- sonidos armónicos e inarmónicos, a la par que hace visible las caracte-
cuencia que este armónico presenta y que, según veremos (véase rísticas acústicas inherentes a cada uno de ellos.
Capítulo 8), son indicativas de las fluctuaciones en el tono de la fras'! .
Los valores más frecuentes del Fa son 125 Hz para las voces masculi-
nas, 250 Hz para las femeninas y 350 Hz para las infantiles. 3.3. La síntesis del habla
3.2.7. Observemos la Fig . 3.6. Se trata del espectrograma de banda 3.3.1. La síntesis del habla no es sino una técnica para simular los
ancha correspondiente a la frase : «Mis hechos dirán quién soy» , obteni- sonidos del lenguaje humano , es decir, para producir habla artificial.
Numerosos han sido los intentos que, desde el siglo XVIII, se fueron
sucediendo a lo largo del tiempo, destinados todos ellos a conseguir
este objetivo . Nombres bien relevantes de la investigación fonética se
han visto asociados en uno u otro momento a tales experimentos -van
Kempelen, Helmholtz, Stumpf, etc.- pero, ciertamente, es en este siglo
cuando se han logrado los primeros resultados por completo sallsfacto-
rios.
¿Por qué tanto interés en reproducir el habla una vez que el desa-
rrollo del análisis espectrográfico ha permitido conocer y entender
toda la complejidad de la onda sonora? La respuesta se desprende. del
propio planteamiento de la pregunta. La información que proporclOna
~
,, el espectrógrafo es tan abundante que resulta difícil saber qué datos
... son los auténticamente decisivos para la comprensIón del mensaje y
qué otros responden sólo a factores individuales o esporádicos. Co-
mo veremos en el próximo capitulo (véase apartado 4.2.2), nosotros no
Figura 3.6. necesitamos toda la información acústica que llega a nuestros oídos

58 59
para d e scodificar e interpretar la emisión de que se trate ; actuamos todos ellos se basan en la idea de que el tracto es una estructura tubular
B lectiva mente: seleccionamos claves, pistas, que nos revelan la natura- de sección variable e irregular. Por consiguiente,. las propIedades
loza d e l sonido o sonidos que escuchamos. Son los llamados índices acústicas del habla se hacen equivaler con las propIedades eléctncas
ac ústicos. de un circuito de transmisión a través de las dlstmtas seCCIOnes del
El sintetizador de habla, en cualquiera de sus variantes, a las que tubo. Actualmente se está aplicando este modelo a la sínteSIS de voz por
nos referiremos más adelante, es un instrumento diseñado para que e l ordenador.
investigador pueda aislar y combinar rasgos acústicos sustituyendo Con todos estos procedimientos se han obtenido ya espectaculares
unos por otros y comprobando en qué medida estos cambios afectan a avances en el descubrimiento de los índices acústlcos. En próxImos
la respuesta del oyente . De esta forma, al introducir variaciones contro- capítulos precisaremos cuáles de ellos se han revelado, a . través de
ladas - lo que en el lenguaje natural es imposible- , el fonetista sabrá diversos experimentos, como fundamentales para la ldentlflcaclón de
con certeza cuáles son los índices sobre los que fundamentamos el las vocales y de las consonantes castellanas.
reconocimiento del habla.

3,3.2. Existen esencialmente dos clases de sintetizadores: los análogos


terminales y los análogos del tracto vocal. Con los primeros se preten-
de recrear la onda sonora partiendo de una simulación de la actividad
de la fuente y de las cavidades de resonancia. Con los segundos, se
intenta obtener este mismo resultado pero reproduciendo, asimismo,
todas las operaciones que el s istema fonador humano lleva a cabo
durante la emisión.
Al primer grupo pertenecen modelos muy conocidos, como el Pat-
tem Playback o los sintetizadores de formantes; al segundo , en cambio.
todos los modelos analógicos que remedan el tracto vocal.
El Pattern Playback se utilizó principalmente en los laboratorios
Haskins, de Nueva York, durante los años cincuenta. Dado que este
aparato es capaz de convertir los espectrogramas, dibujados por el
investigador sobre una banda de celuloide transparente , en voz -me-
diante un sistema que hace coincidir la composición espectral de los
sonidos con la de la corriente de luz posteriormente convertida en
ondas sonoras-, el método seguido en los experimentos para los que
se empleó consistió, por lo general, en sintetizar un conjunto de soni-
dos que sólo difirieran e n un rasgo acústico. De la respuesta que los
oyentes dieran al oír estos sonidos sintetizados se podía deducir la
importancia de dicho rasgo como índice para la identificación.
Los sintetizadores de formantes parten también del sonograma, pe-
ro actúan de modo distinto al Pattern Playback . En ellos existe una serie
de circuitos eléctricos resonantes que son excitados cuando les llega
una vibración similar al tono glotal humano , o bien la energía produci-
da por un generador de ruido (según se trate de sonidos periódicos o
aperiódicos). El espectrograma proporciona la información necesaria
para que tanto e l tipo de fuente como las resonancias subsiguientes se
ajusten a las características de los sonidos originales.
Por lo que se refiere a los modelos analógicos del tracto vocal,
61
60
~o
La audición y la
percepción del sonido

4.1. La audición

4.1.1 . En los capítulos anteriores hemos examinado el proceso de pro-


ducción de las ondas sonoras que constituyen los sonidos del lenguaje,
las fuentes que las generan y las modificaciones que sufren hasta el
punto en el que alcanzan nuestros oidos. A partir de ese momento,
entramos en un terreno menos conocido , en el que abundan las pre-
guntas todavía sin respuesta.
En efecto , aunque el proceso de la audición comienza en el oído,
cuya anatomía y funcionamiento están bien estudiados, sus fases más
importantes y su culminación tienen lugar en el sistema nervioso cen-
tral, en el cerebro, en donde se produce un complicadísimo tratamien-
to de la información, en gran medida desconocido .
Por otra parte , hasta llegar a las zonas de la corteza cerebral apa-
rentemente esenciales para la audición, las señales recibidas han de
transmitirse a través de una intrincada red de nervios y son, también,
algunos aspectos de esta transmisión los que permanecen aún en el
misterio.
No obstante , en los apartados que siguen trataremos de explicar lo
que en este momento conocemos acerca de nuestra capacidad de oír y
escuchar.

4.1.2. En el oído podemos distinguir tres partes principales (Fig. 4.1):


el oído externo, el oldo medio y el oído interno.

63
huesecillos conocidos como martillo, yunque y estribo. El martillo, uni-
do por su «mango» al tímpano, vibra conjuntamente con él y este
movimiento pasa al yunque, de ahí al estribo y, finalmente, a la ventana
oval, la entrada al oído interno.
El oído medio no actúa simplemente como un mero transmisor de
las vibraciones, según acabamos de explicar, sino que cumple, ade-
más, la función de «adaptador» . ¿Qué quiere esto decir? A partir de la
ventana oval, es decir, en el oído interno, el medio de propagación de
las oscilaciones es ya líquido (el llamado líquido perilinfático, del que
hablaremos más adelante). Esto significa que las ondas que, hasta ese
punto, eran aéreas van a ser líquidas. En ese cambio siempre se pier-
de intensidad y el oído medio es el encargado de recuperarla, con-
virtiendo los movimientos que llegan al tímpano, con poca fuerza
pero de grandes dimensiones (recordemos que el tímpano tiene una
superficie considerable), en movimientos de gran fuerza aunque de
pequeña dimensión, como requiere el tamaño inferior del estribo
Figura 4.1. Esquema del oído . y la ventana oval. En otras palabras, toda la energía recogida en el
tímpano se concentra en una superficie mucho más pequeña y así
La primera de ellas, el oído externo, consta, a su vez, de dos partes: se recuperan los decibelios perdidos, al tiempo que se vence la resis-
el pabellón y el conducto auditivo externo. El pabellón recoge las tencia del líquido del oído interno a recibir energía proveniente del
ondas que a él llegan y les facilita el paso hacia el conducto auditivo exterior.
externo. En algunos animales, no así en el hombre, este pabellón tiene Por otra parte, en el caso de que los sonidos que llegan al tímpano
una considerable movilidad, de modo que reviste gran importancia en sean excesivamente intensos, el oído medio funciona como amortigua-
la localización de la fuente del sonido . En los seres humanos, su fun- dor, mediante la acción conjunta de un músculo que tensa el tímpano
ción se limita a aumentar ligeramente la intensidad de las ondas inci- para que vibre menos, y del músculo del estribo, que lo aleja de la
dentes. ventana oval y modifica su eje de rotación. Así, la capacidad transmi-
El conducto auditivo externo tiene de 25 a 30 mm de longitud y es sora del oído medio se reduce y no se produce daño en los sensibles
un canal sinuoso por el que las ondas pasan en su camino hacia el oído órganos del oído interno (Fig. 4.2) .
medio e interno. Actúa como resonador, con una frecuencia natural de El oído interno, extremadamente complejo, se denomina también
unos 3.000 c .p.s., al tiempo que amortigua los sonidos demasiado agu- laberinto y consta de dos partes principales: los canales semicirculares
dos, potencialmente dañinos para los órganos sensibles situados en el y el caracola cóclea. Los canales semicirculares, situados en tres pla-
oído interno. nos rectangulares, se ocupan de controlar el sentido del equilibrio, en
Ya en el oído medio se encuentra el tímpano, delgada membrana tanto que el caracol es el órgano principal del mecanismo de la
elástica, con una superficie de alrededor de 0,75 cm 2 y de forma cónica, audición. Se trata de un tubo de paredes rígidas, completamente
que cierra el conducto auditivo externo . Está situado en el interior de cerrado y enrollado sobre sí mismo dos veces y media. Está lleno de
una cámara de aire, la caja del tímpano, conectada con la rinofaringe un líquido denominado perilinfa y si lo desenrolláramos ofrecería un
mediante el conducto denominado trompa de Eustaquio. Si la presión aspecto semejante al de la Fig. 4.3.
en el interior de esta cavidad difiere en exceso de la presión atmosféri- Como en ella puede observarse, el caracol está dividido en dos
ca, la trompa de Eustaquio se abre y el equilibrio se restablece. zonas o rampas por medio de la lámina espiral cuyo interior constituye
Al estar rodeado de aire, el tímpano entra en vibración cuando le una tercera región. En la parte más ancha del caracol, y conectándolo
alcanzan las variaciones de presión que toda onda sonora conlleva. Sus con el oído medio, como anticipamos, están las ventanas oval, directa-
oscilaciones en ambos sentidos se transmiten a la cadena osicular que mente ligada al estribo, y redonda, situadas en cada una de las rampas,
lo conecta cori el oído interno. Dicha cadena está formada por tres a cada lado de la lámina espiral. La ventana redonda, que está cubierta

64 65
por una fina membrana elás- namiento del sistema nervioso, que ha recibido distintos tratamientos a
tica, tiene como función Martillo Yunque Estribo lo largo del tiempo, algunos de ellos muy divergentes entre sí. En
compensar, abombándose realidad, la carencia de pruebas experimentales, difíciles de obtener
hacia fuera o desplazándo- Ventana por cuanto se debe operar sobre sujetos vivos, facilita la formulación
se hacia dentro, los cambios oval de hipótesis contradictorias. Veamos las más importantes.
de presión que se producen La Ley acústica de Ohm, postulada en el siglo XIX por el científico
dentro del caracol cuando Ventana alemán G. S. Ohm, sostiene que nuestros oídos actúan como auténticos
el líquido perilinfático se redonda analizadores de las ondas complejas en sus frecuencias integrantes,
pone en movimiento por Trompa suponiendo que éstas no sean ni demasiado numerosas ni demasiado
transmisión de las vibracio- de débiles . De acuerdo con tal idea, Hermann van Helmholtz, en la segun-
nes aéreas a través del es- da mitad del mismo siglo, sugirió que esta descomposición de los
tribo. sonidos percibidos tiene lugar en el mismo caracol, concretamente en
Al vibrar, la perilinfa la membrana basilar . Las fibras que la componen resonarían a frecuen-
transmite su oscilación a Figura 4.2. Oído medio. cias diferentes unas de otras, en función de su tensión y su peso . Así,
una de las membranas que una vez que el líquido perilinfático recibe las vibraciones procedentes
separan las distintas zonas del oído medio, sólo se verían contagiadas por la perturbación aquellas
de la cóclea, la denominada fibras de la membrana cuya frecuencia natural coincidiera con las del
membrana basilar, cuya im- estímulo y los tonos percibidos corresponderían a las frecuencias reso-
portancia reside en que es nantes de estas fibras . Por ello, esta teoría se denomina teoría de la
el soporte del órgano de resonancia, o periférica , puesto que el análisis de los sonidos tendría
Corti. Éste está constituido lugar, según sus supuestos, fuera del sistema nervioso central.
por unas 25.000 células ci- A comienzos de este siglo , E. Rutherford formuló la teoría telefóni-
liadas de las que parten las ca, así conocida porque en ella la membrana basilar desempeña el
fibras nerviosas que, reuni- Ventana Canal Rampa papel de una central telefónica ligada al cerebro por el nervio auditivo .
das, conforman el nervio redonda coclear timpánica Éste vendría a ser un verdadero cable de transmisión, conductor de las
auditivo. Cuando la vibra- señales eléctricas , no alteradas en su forma, al sistema nervioso central,
ción llega al órgano de Figura 4.3. Oído interno. (La cóclea .) donde se desarrollaría todo el procesamiento de la información . Cuan-
Corti, éste actúa como un do se elaboró esta teoría no se conocían los detalles sobre la transmi-
conversor de energía me- sión eléctrica en el sistema nervioso. Hoy se sabe que las neuronas no
cánica en energía eléctrica, de modo que las oscilaciones se transfor- funcionan como las líneas telefón~cas : la energía no se transmite de un
man en impulsos u ondas de naturaleza electroquímica que, a través del punto a otro a lo largo del axón o prolongación principal de la neuro-
nervio auditivo, llegan hasta el cerebro. En cada uno de sus dos hemis- na, sino que más bien es un pulso de actividad eléctrica local el que
ferios, existen zonas de la corteza cerebral que podemos llamar zonas se desplaza a lo largo de todo ese axón (v . Denes y Pinson: 1963, 127
auditivas, por lo que la destrucción de una de ellas no impide por Y 142).
completo la audición, si bien ésta queda sensiblemente deteriorada . Ciertamente, ninguna de estas dos hipótesis es aceptada en la actua-
lidad . No obstante , aunque el planteamiento general de Helmholtz se ha
4.1.3. Una vez revisada la anatomía del oído y explicado el proceso de demostrado incorrecto, algunas de sus aportaciones, como la idea de
conversión de la energía acústica en energía eléctrica en forma de que es en el oído interno -en el caracol- donde se realiza el análisis
impulsos nerviosos, quedan por aclarar algunas cuestiones o.scuras. frecuencial de los sonidos, parecen confirmarse por las investigaciones
Por ejemplo, cómo analiza el oído un sonido complejo en sus armónicos más recientes.
componentes, si es que tal análisis se lleva a cabo, de hecho , en este De acuerdo con estas mismas investigaciones, la descomposición
órgano . del estímulo en sus diversos armónicos componentes se efectúa me-
Ésta es una de las cuestiones, entre otras muchas referidas al funcio- diante la perturbación de distintas células del órgano de Corti para

66 67
cada una de dichas frecuencias , yen diferente medida según la intensi- y que nosotros oímos querámoslo o no, percibimos o, si se prefiere,
dad que presenten en cada caso. La estimulación de células distintas escuchamos sólo aquellas que se ajustan a los modelos o patrones
supone la subsiguiente estimulación de diferentes fibras del nervio adquiridos pGr la experiencia y que consideramos ,. por tanto, per-
auditivo y su proyección final en puntos distintos de la zona auditiva de tinentes. Así pues, la percepción no es una achvldad meramente
la corteza cerebral. Lo que sucede a continuación sigue siendo un fisiológica, sino que conlleva la selección y categorIzación de lo per-
misterio . cibido.
De toda la información que alcanza nuestro oído, el cerebro procesa
sólo un porcentaje mínimo y desecha el resto. En ocasiones, si:, embar-
4.2. La percepción del sonido go, esa cantidad de ondas sonoras irrelevantes que acampanan a las
realmente pertinentes, mezclándose con ellas, pueden llegar a mter-
4.2.1. Como explicamos en el Capítulo 1, el hombre es capaz de perci- feri r de tal modo en el proceso, que impidan por completo la percep-
bir todos los sonidos cuyos valores de frecuencia e intensidad estén ción. Por lo que respecta, en concreto, a las ondas sonoras del habla,
comprendidos dentro de unos determinados márgenes. Así, sabemos está demostrado que el mejor modo de conseguir este efecto de anula-
que el oido medio (definido como aquel cuyas características respon- ción es superponiéndoles otras ondas portadoras de señales lingüís~i­
den a la estimación promediada de las de un gran número de oídos caso En otras palabras, es evidente la dificultad que para todos entrana
estudiados; v. Matras: 1986,42-43) percibe toda la gama de frecuencias atender a dos personas hablando al mismo tiempo : el resultado más
comprendida entre los 16-20 Hz y los 20.000 Hz aunque esta capacidad probable es que no percibamos ninguno de los dos mensajes comUni-
se ve lógicamente disminuida con la edad. cativos.
En la Fig . 4.4 aparecen Frente a esta «vulnerabilidad» de nuestro mecanismo de percep-
marcados los límites de la ción del lenguaje, que afecta a su principal característica, la inteligibili-
percepción, en función de
la frecuencia y de la inten-
.~
e
e
140
IJO
.... ----. ( Umbral del dolor
dad, e l propio sistema lingúístico opone una gran reslstencla a la dls-
torsión, puesta de manifiesto en el considerable grado de redundanCia
sidad de los sonidos. A ta-
~ 120
e 110 : que define a todos los hechos de habla . Ciertos fenómenos fonétl~os,
• 100 ,
les limites se les denomina
umbral de la audición y um-
.
~
9\l
¡; \10
, campo
por ejemplo, son redundantes, ya sea en todas las lenguas -:-asl, la
aparición de transiciones en los formantes de una vocal anunClan, por
bral del dolor, porque to- .
70
d.
audIción así decirlo, la presencia de una consonante- o en alguna lengua con-

/'
60
dos los sonidos situados por ~ 50 creta -en español, la presencia de una vocal nasalizada lmphca la de
i 40
debajo del primero son im- JO Umbral de la una consonante nasal adyacente (véase apartado 5. 1.2)-. El conOCl-
~ 20 audición
perceptibles para un oído ~ 10
miento que poseemos, por otra parte, del idioma en el que nos expre-
medio y todos los consigna- ~ 31 62 125 250 500 1000 2(0)4000 800J 16000
samos, de sus reglas y de sus posibilidades, nos permlte dlstraer un
dos por encima del segun- FrecuenCia en Hz
poco nuestra atención en determinadas ocasiones sin que ello afecte a
do producen una sensación la percepción global del mensaje.
dolorosa. Figura 4.4.
Según puede apreciarse 4.2.3. Las clasificaciones más tradicionales de los sonidos siempre po-
en el diagrama , en la zona seyeron un carácter o bien perceptivo o bien articulatorio, debido en
de frecuencias medias podemos percibir sonidos de muy poca inten- buena medida al escaso desarrollo alcanzado por la mvestlgaclón pura-
sida, mientras que en las zonas de frecuencias bajas y altas, necesita- mente acústica antes del siglo XX. Denominaciones como, por ejemplo,
mos aumentar la potencia en una cantidad variable de decibelios si fricativo (sonido que requiere un estrechamiento en alguna zona del
queremos que los tonos resulten audibles. canal, en la que se produce una fricción del aire) o explOSIVO (SOnido
articulado con cierre completo del canal y posterior abertura brusca de
4 .2.2.La percepción auditiva, y en general toda percepción sensorial , éste) son claramente denominaciones de tipo perceptivo, puesto que es
es básicamente selectiva (v. Malmberg: 1971, 140 y ss.). Ello quiere el oído el que nos confirma.,si ha habido fricción, en el pnmer caso, .o Sl
decir que, de las múltiples impresiones que llegan a nuestros tímpanos se ha producido la pequeña explosión, en el segundo. Sus respechvos

68 69
términos sinónimos, constrictivo y oclusivo, poseen, sin embargo, ca- dental claramente fricativa y la posición dental (Navarro Tomás: 1971,
rácter articulatorio, ya que aluden claramente a la configuración del 99), SID que el oyente perciba diferencia alguna entre los dos sonidos .
tracto vocal requerida para la pronunciación. De igual forma, la vocal [<1>], anterior , media y redondeada, puede
Estos dos aspectos del hecho fónico , el articulatorio y el perceptivo, pronunciarse, en los idiomas que la poseen, como una [e] con una
mantienen entre sí una relación compleja todavía no bien comprendida especial reducción del orificio que forman los labios y un abocinamien-
por los fonetistas. No existe duda alguna, en la actualidad, de que para to de éstos, o como una [e] en la que la lengua se retrotrae: en ambos
la correcta articulación de los sonidos es imprescindible el autocontrol casos percibiremos la misma vocal.
auditivo del propio hablante que los emite: sólo de esta forma puede Así pues, parece llcito concluir que la articulación no debe ser el
ajustar los movimientos de sus órganos articulatorios de modo que el único condicionante del mecanismo de la percepción, según suponía
resultado sea el deseado. Que esto es así resulta fácilmente comproba- Liberman, sino que también la caracterización acústica es determinan-
ble con tan sólo estudiar cuáles son los problemas de índole articulato- te, especialmente en algunos casos. Con todo, como decíamos al princi-
ria que caracterizan el habla de los niños sordos o, incluso, de las pio, restan aún por esclarecer muchos aspectos de la compleja interre-
personas que padecen trastornos auditivos considerables. Pero, por el lación entre nuestros movimientos articulatorios , las ondas que con
contrario, no está claro hasta qué punto es importante la influencia en ellos producimos y la capacidad perceptiva de nuestro cerebro.
sentido inverso, es decir, en qué medida el oyente percibe en función
de sus propios hábitos articulatorios.
A. M. Liberman postuló, a este respecto, la teorla motriz según la
cual interpretamos los sonidos que escuchamos sobre la base de una
representación motriz de los movimientos que nosotros mismos produ-
cimos para articular sonidos similares. Tal planteamiento resulta útil
para explicar algunos hechos que, de otro modo, son difíciles de anali-
zar, como, por ejemplo, el que ciertas consonantes -especialmente las
oclusivas- presenten caracterizaciones acústicas (en el espectrogra-
ma) bastante diferentes, dependiendo del contexto en que se encuen-
tren, sin que ello haga dudar al oyente en su identificación. Si se acepta
la teoría de Liberman, esto es debido a que los movimientos articulato-
rios que originan a estas consonantes, y que son la clave para su
correcta percepción, son siempre los mismos en todos los contextos y
constituyen, por tanto, un elemento definitorio e identificador.
Pese a la evidente validez de este tipo de argumentación a favor de
la teoría motriz, muchos autores la han desechado sin reservas . Entre
ellos cabe destacar a B. Malmberg que , en su obra Les domaines de la
Phonétique (1971) llega a afirmar: «Los movimientos articulatorios re-
queridos para hablar solamente pueden constituir una ayuda aprecia-
ble para aquellas personas cuyo oído es defectuoso, para los que son
totalmente sordos, estos mismos movimientos son, claro está, el único
punto de referencia» (pág . 151, traducción nuestra).
Sin llegar a posturas tan extremas, es preciso señalar que la articu-
lación puede también variar sin que esto implique una percepción
diferente. En español , concretamente , diversas circunstancias hacen
que la articulación de la consonante dental fricativa sonora -que re-
presentamos como [iI] y que aparece, por ejemplo, en Aida, seda, etc.
(véase más adelante, Capítulo 5)- vacile entre la posición dentointer-

70 71
~D
Descripción y clasificación
de los sonidos

5.1 . La segmentación de la cadena hablada

5.1.1. Hasta el momento nos hemos venido refiriendo a los sonidos


como si éstos se presentaran de forma aislada en la cadena hablada, es
decir, como si existieran límites claros entre ellos, de modo que su
reconocimiento resultara sumamente sencillo. Sabemos , sin embargo,
que el movimiento de los órganos vocales es continuo, como lo es
también el producto acústico de él derivado , y que la tarea de deslin-
dar dónde acaba un sonido y dónde comienza otro no se revela fácil.
No obstante, es el paso previo para poder describir y clasificar todos
los tipos de segmentos fónicos que el aparato fonador humano es capaz
de producir.

5.1.2. Consideremos la palabra española par. Cualquier hispanoha-


blante, sin necesidad de poseer conocimientos fonéticos de ningún
tipo, distinguirá en ella tres elementos, convencionalmente representa-
dos por los simbolos [p] , [a] y [r]. Ello es debido, en primer lugar, a
que durante su pronunciación se producen cambios especialmente sigo
nificativos en la articulación que entrañan diferentes percepciones, y ,
en segundo lugar , a que el hablante, conocedor de su propia lengua ,
sabe que estos fragmentos de sonido pueden aislarse e incluso inter-
cambiarse con otros: la [p] puede sustituirse por [m] para obtener mar
la [a] por [o] para formar por; la [r] por [9] para constituir paz. Dicho d~
otro modo , el hablante conoce el funcionamiento y el valor contrastivo

73
de esos sonidos en su idioma y lo utiliza , más o menos conscientemente, paso a un breve período durante e l cual los valores de los parámetros
para llevar a cabo la segmentación. En este sentido podemos decir que articulatorios no varían: e l segmento.
la división de la cadena hablada se realiza a partir de fundamentos Esto es también aplicable al análisis acústico. Un cambio brusco de
fonéticos y fonológicos (véase nuestra Presentación). Si la lengua estu- una perturbación periódica a otra aperiódica, por ejemplo, o bien un
diada es la materna, aplicamos nuestro conocimiento de las unidades punto de máxima velocidad de variación en las características espec-
funcionales (fonemas) al comenzar a segmentar, para precisar poste- trales marcan los límites entre dos segmentos . Habitualmente, las divi-
riormente cómo es su realización fonética . Si, por el contrario, opera- siones resultantes suelen coincidir con las unidades obtenidas en el
mos sobre una lengua desconocida, el proceso se invierte : tenemos análisis articulatorio, y, asimismo, con las unidades funcionales o fone-
que saber primero cuántos posibles segmentos hay en la cadena para mas, pero no siempre sucede así. El correlato acústico de un fonema
después comprobar cómo funcionan y corroborar así nuestra división puede a veces estar constituido por uno o más segmentos acústicos:
inicial. recordemos cuál era la caracterización en el espectrograma de nuestra
El fonetista se interesa sólo, en principio, por establecer el criterio consonante eh W] (véase la Fig. 3.6). De igual forma, un único segmen-
para segmentar el continuo fónico en función de la serie de pará- to acústico puede corresponderse con dos fonemas si así 10 requiere la
metros articulatorios o acústicos que lo determinan , es decir, sin apo- estructura de la lengua concreta de que se trate: las vocales diptonga-
yarse en datos o informaciones no extraíbles del propio decurso fónico . das del inglés, por ejemplo, son en realidad segmentos unitarios lar-
Ello no significa que no deba recurrir en un momento dado a consi- gos, formados por un timbre fundamental ([a] , [e] , [o]) seguido de un
deraciones fonológicas para resolver determinados problemas , como deslizamiento vocálico más cerrado ([i], [u]) o más central , pero se
veremos. interpretan, sin embargo, como la combinación de dos fonemas distin-
Así pues, se trata de concretar, en primer lugar, cuáles son los tos, lo que ha llevado a muchos autores a intentar delimitar en el
parámetros relevantes sobre los que basar la segmentación . Volvamos espectrograma dos segmentos diferentes. (Los principios de la seg-
para ilustrar esta idea a nuestra palabra par. Podemos comprobar al mentación acústica están claramente descritos en Fant, 1973.)
pronunciarla que la consonante [p] se articula con un cierre absoluto Es interesante señalar que los Indiees (véase apartado 3.3) relevan-
del canal oral situado en los labios . La lengua, durante esta oclusión tes para la percepción e identificación de un cierto sonido no siempre
labial , toma ya la posición de la articulación siguiente , la [a], esto es, se están contenidos en el segmento acústico con el que lo hacemos corres-
extiende en el hueco de la mandíbula inferior, toca con sus bordes los ponder. En los próximos apartados veremos que muchas consonantes
molares inferiores de ambos lados y roza con la punta la cara inferior se reconocen en función de las vocales adyacentes, en las que están
de los incisivos inferiores, elevando un poco más el dorso en la zona presentes los índices decisivos para su determinación. Igualmente, los
media de la boca (v. Navarro Tomás: 1971, 54). En este caso, por movimientos articulatorios influyen en la p ercepción de los diversos
consiguiente, el parámetro articulatorio que podríamos denominar «po- sonidos en todo su desarrollo, y no sólo en la fase terminal. Por ejem-
sición de la lengua» no nos sirve para fijar la frontera entre los segmen- plo, e l movimiento de la úvula que supone la abertura de la cavidad
tos [p] y·[a] . Sin embargo , el parámetro «acción de las cuerdas vocales» nasal a la corriente de aire para pronunciar la [n] de la palabra [In'soli-
sí nos señala el límite claro entre estos dos sonidos . La [p] es un sonido to] comienza ya durante la articulación de la vocal [i] , nasalizándola y
sordo , sin vibración en la glotis , en tanto que la [a] es sonoro , como contribuyendo con ello de forma redundante a la percepción de la
todas las vocales, y lo mismo cabría decir de un parámetro «modo de consonante nasal. Así pues, el proceso perceptivo no resulta necesaria-
articulación» que nos diferencia un sonido oclusivo [p] de uno articula- mente condicionado por las unidades discretas establecidas tras la
do sin obstáculo alguno, [a]. segmentación.
En segundo lugar, habrá que determinar los momentos de la emi-
sión en los que los cambios producidos en los parámetros observados
sean lo suficientemente apreciables para marcar las fronteras entre 5,2. La diferenciación vocal-consonanle
segmentos. El movimiento de los órganos vocales, según venimos di-
ciendo, es continuo , gradual. y nunca brusco . Los cambios se producen Una vez efectuada la segmentación de la cadena hablada , la
5.2.1 .
permanentemente, pero sólo pueden considerarse límites de segmen- primera distinción que debe mencionarse es la que se establece entre
tos aquellos puntos en que los movimientos se han completado, dando sonidos vocálicos y consonánticos . Esta dicotomía clásica , que ya esta-

74 75
bledan, con algunas variantes, los gramáticos hindúes y griegos, ha miento en la lengua. Así pues , un sonido vocoide reuniría todas las
sido revisada en nuestros días por un buen número de fonetistas. características articulatorias y acústicas peculiares de las «antiguas»
En general, la idea de vocal se ha asociado siempre con una serie vocales y un sonido vocal, de acuerdo con Pike y sus continuadores,
de características auditivas, articulatorias y funcionales . La vocal sería sería todo aquel capaz de actuar como unidad central de la sílaba.
en principio el sonido más audible, e l más abierto , sin obstáculo alguno Otros fonetistas, por el contrario, mantienen los términos vocal y
a la salida del aire y articulado con menor esfuerzo que la consonante. consonante con su significado original, pero utilizan vocablos diferen-
Ésta, además, requeriría un mayor gasto de aire en su pronunciación y tes cuando clasifican a los segmentos por su función . Distinguen enton-
se caracterizaría por la menor estabilidad de las posiciones articulato- ces entre sonidos sonantes y no-sonantes o sanan/es y consonantes. En
rias que la originan. . cualquier caso, tampoco existe coincidencia sobre qué sonidos deben
Todas las hipótesis anteriores fueron examinadas exhaustivamente englobarse en cada grupo. Para P. Ladefoged (1975), las sonantes se-
por G. Straka en un trabajo importante (Straka, 1963), para llegar a la rían las nasales , las líquidas y, por supuesto, las vocales. Para otros
conclusión de que la diferencia entre vocal y consonante no es absolu- autores (los menos) en las sonantes no deben incluirse las vocales -a
ta, sino gradual con respecto a los criterios aludidos. Así, hay conso- las que se les presupone de antemano la capacidad para constituir
nantes, como la [r] o [J] que en determinadas circunstancias resultan núcleo silábico- puesto que aunque nasales y llquidas posean caracte-
más audibles que las vocales [i] o [u] , que por otra parte son más rísticas vocálicas no pueden equipararse a las vocales reales. Volvere-
cerradas y presentan mayor nivel de obstaculización que ciertas conso- mos más adelante sobre esta cuestión, al hablar de las consonantes
nantes, como [s] o [9]. (véase apartado 5.6).
La mayor parte de los argumentos que se han aportado para justifi-
car la división vocal-consonante carecen, por consiguiente, de validez 5.2.3. Pese a tantas matizaciones y a tanta disparidad de criterios y
general. Pueden resultar exactos si enfrentamos sonidos extremos, co- opiniones, ¿se puede seguir hablando de vocales y de consonantes
mo una [p] y una [al - los más alejados entre sí desde el punto de vista según se viene haciendo tradicionalmente?
fonético-, pero se revelan como sólo parcialmente verdaderos en los Es el propio Straka quien, en el artículo antes citado, ofrece una
restantes casos. posible justificació n de tipo fisiológico para la división que nos ocupa,
y, por otra parte, el análisis acústico proporciona también valiosa infor-
5.2.2. Por lo que respecta a la función que los dos tipos de sonidos mación.
desempeñan en la lengua , se adujo siempre como prueba irrefutable Afirma Straka que la propiedad diferenciadora de vocales y conso-
de su distinta naturaleza que las vocales son imprescindibles en la nantes aparece tan sólo cuando se produce alguna variación en la
constitución de una sílaba, no así las consonantes. Dicho de otro modo, energía articulatoria: «Una consonante pronunciada débilmente y la
las vocales podrían funcionar sin el apoyo de las consonantes , pero no misma consonante pronunciada con energía no se realizan de idéntico
al revés. modo, y lo mismo sucede en una vocal ( ... ). Pero la disminución y el
Evidentemente, este razonamiento queda invalidado en cuanto se aumento de la energía articulatoria no producen los mismos efectos en
toman en cuenta los numerosos casos en los que una consonante, espe- el comportamiento de una articulación consonántica y en el de una
cialmente una nasal o una llquida ([1], [rJ) , puede constituir por sí sola el articulación vocálica ( ... ). Bajo el efecto del refuerzo de la energía
núcleo o centro de la sílaba: el vocablo francés bisllabo perdre ['pu- articulatoria , la consonante se cierra y la vocal se abre. Al contrario,
dr] , el inglés collon ['ka-tn], el alemán Valer ['fa-tr], etc., son ejemplos bajo el efecto del debilitamiento articulatorio, la consonante se abre y la
de este fenómeno. En todos ellos, las consonantes que llevan el diacríti- vocal se cierra» (pág. 35, traducción nuestra).
co Ll suscrito son realmente el centro silábico y, en ese sentido, funcio- La razón de tal comportamiento dispar radica en la intervención de
nan como auténticas vocales. distintos grupos de músculos durante la pronunciación de las vocales y
Este hecho movió a muchos autores a introducir nueva terminología de las consonantes. En las primeras toman parte, principalmente, los
que lo reflejara . K. L. Pike (1943) propuso, por ejemplo, los términos llamados músculos depresores, menos numerosos y potentes que los
vocoide y contoide para sustituir a los antiguos vocal y consonante, músculos ele vadores, que intervienen en las articulaciones consonánti-
respectivamente, mientras que estas clásicas denominaciones se desti- cas. Dado que lo que entendemos por energía articulatoria no es sino la
naron a distinguir los dos grupos de sonidos en virtud de su funciona- fuerza de contracción de los músculos operantes en el sonido de que se

76 77
trate, resulta comprensible que , si ésta se incrementa durante la emi- del tracto se produzca dicha articulación . Las vocales, en cambio, se
sión de una vocal, los músculos depresores experimenten una contrac- clasifican en virtud de la posición vertical de la lengua -€s decir, a
ción más enérgica que producirá un descenso más acusado de la len- partir de lo más o menos alejado del paladar que se encuentre su zona
gua. Si, por el contrario, se refuerza la energía al pronunciar una más alta-, de la posición horizontal de la lengua -€sto es, de lo más o
consonante, serán los músculos elevadores los que causarán una mayor menos adelantado que se encuentre ese punto en el eje anteroposte-
elevación de la lengua hacia el paladar e, incluso , un contacto más rior de la boca- y de la disposición de los labios, con o sin redondea-
fuerte entre estos dos órganos. Como es lógico, si se disminuye la miento .
energía articulatoria se obtiene el efecto contrario. El primer criterio nos divide a las vocales en altas, medias y bajas o,
El análisis acústico proporciona también , como decíamos, razones si se prefiere, cerradas, medias y abiertas según el uso más extendido
para seguir manteniendo la dicotomía vocal-consonante. En primer en Europa. Fijémonos en la Fig . 5.1, donde se han contrastado los
lugar, cuando se articula una vocal, las cuerdas vocales están más perfiles que la lengua adopta en la pronunciación de las vocales caste-
tensas y más juntas que cuando se trata de una consonante sonora, por llanas [i), [e), [a), [u) y [o).
lo que la frecuencia de vibración es mayor y el tono más agudo en la
primera que en la segunda. Por otra parte, mientras que en las vocales
no existen apenas ruidos aperiódicos -aunque éstos no pueden ser
ignorados si hemos de ser precisos- en las consonantes, especial-
mente en las sordas, son estos ruidos los que determinan su naturaleza
y contribuyen a su identificación (véase Capítulo 2, apartado 2.4.1).
POI: ¡í1timo,:,cabe añadir la mayor estabilidad acústica de la vocal
frente á !a '.co,n~nimte, según señaló P. Delattre (1964). De acuerdo con
este emin"hté' fonetista, el reconocimiento de una consonante depende
de los camb.i os de frecuencia de los forman tes , propios O de las vocales
contiguas, e n tanto la estabilidad formántica se asocia siempre con una Figura 5.1.
vocal (véase a este respecto, lo que explicamos sobre las transiciones
vocálicas en el apartado 5.7 de este mismo capítulo).
Las investigaciones sobre esta compleja cuestión continúan desde Es evidente que la parte más alta de la lengua se más
perspectivas diferentes. Regularmente se proponen nuevos criterios próxima al cielo de la boca en las vocales [i) y [u) que en [e) y [o) y en
en la esperanza de que alguno de ellos, o la suma de todos, constituya estas últimas más que en la [a) . Por consiguiente, la [i) y [u) son cerra-
la confirmación definitiva de la clásica división de los sonidos de la das, la [e) y [o) medias, y la [a) abierta.
lengua en vocálicos y consonánticos. En todo caso, en una obra intro- El segundo parámetro divide a las vocales en anteriores (o palata-
ductoria como ésta, parece aconsejable aceptar la oposición tradicio- les), si la zona más elevada de la lengua se localiza en la parte anterior
nal, aun conociendo los problemas que plantea, por las ventajas que de la boca, y posteriores (o velares) , si , por el contrario, está situada en
ello supone para la exposición. la zona posterior. Aún existe otro término, central, que califica a las
vocales pronunciadas en la zona central de la cavidad oral. Compáren-
se, en la Fig. 5.1, los perfiles de las vocales españolas [e], [i) , clara-
5,3. Las vocales: características mente anteriores, con los de la [o) y [u), ambas posteriores. La [a) es
articulatorias central.
Vemos, pues, que mientras que en las consonantes se tiene en
5.3.1. Es práctica habitual y generalizada describir las características cuenta la situación de la zona de mayor constricción (sea ésta total,
articulatorias de las vocales y proceder a su clasificación en función de como en las oclusivas, o parcial, como en las fricativas), para establecer
unos parámetros distintos a los considerados para llevar a cabo la de la localización de las vocales se considera la de la parte más alta de la
las consonantes. Éstas, como veremos, se diferencian según sea su le ngua , que no tiene que coincidir necesariamente con el punto en que
modo de articulación (oclusivas, fricativas, etc.) y según en qué zona la constricción sea mayor. Como han señalado varios autores (v . Delat-

78 79
tre : 1967, 22-23; Ladefoged: 1975, 13, entre otros), en la descripción posteriores o anteriores comparten la misma posición en el eje antero-
articulatoria siempre se puede elegir entre distintas posibilidades sin posterior de la cavidad bucal. Sin embargo, el mayor problema gene-
que sepamos muchas veces cuál es la más acertada, porque cada una rado por la falta de precisión se constata al intentar describir una vocal
de ellas presenta, por lo general, ventajas e inconvenientes. Este siste- de una lengua concreta con referencia a las de otros idiomas, o una
ma de especificación de las vocales es, sin duda, el más simple, pero vocal pronunciada en un cierto momento por un hablante determinado .
en cambio, no refleja las considerables diferencias en la forma de la Si decimos, por ejemplo, que se trata de un sonido vocálico alto o
lengua para las vocales anteriores y posteriores, ni tampoco da cuenta cerrado, anterior o palatal y no redondeado, podemos estar refiriéndo-
de la variación del tamaño de la faringe en algunas de ellas, que tan nos tanto a la [i) del español mi, como a la del inglés sit, o a la del inglés
apreciables cambios acústicos entraña. Por este motivo, muchos fonetis- bean, etc.
tas han tratado de modificarlo, incorporando nuevos criterios, ya desde Para intentar suplir esta falta de puntos de referencia, con respecto
principios de siglo (v. Fischer-J~rgensen, 1985), sin que por el momen- a los cuales situar cualquier eventual realización vocálica sin posible
to ninguna de sus innovaciones haya sido unánimemente aceptada. ambigüedad, el fonetista británico Daniel Jones ideó, en 1917, un siste-
Por lo que se refiere al redondeamiento de los labios, se trata de un ma de Vocales Cardinales, aún empleado en la actualidad.
tercer parámetro independiente de los dos anteriores y combinable Adoptado por la Asociación Fonética Internacional. el sistema de
con ambos . Esto quiere decir que existen vocales anteriores redondea- Vocales Cardinales es una técnica descriptiva, cuyo dominio constituye
das y no redondeadas como se encuentran también, en muchas len- más un arte que un conocimiento científico. Conviene tener esto pre-
guas, vocales posteriores redondeadas y no redondeadas . Lo mismo es sente, porque algunos de los inconvenientes que se le han encontrado
válido para los diversos grados de abertura : todos son combinables provienen de una interpretación errónea del concepto.
con una u otra disposición de los labios. Ahora bien, conviene hacer El sistema está integrado, en efecto , por vocales teóricas (v. Monroy
dos precisiones a este respecto . Casas , 1980), que no han de confundirse con fonemas. Ninguna de estas
La primera es que existe una cierta correlación entre la altura de la vocales debe asociarse, por tanto, con una lengua concreta , incluso
lengua y el grado de redondeamiento . Cuanto más cerrada es una aunque en tal idioma existan uno o varios elementos vocálicos coinci-
vocal, más pequeña será la abertura que dejarán los labios al redon- dentes con los cardinales. Es por esto por lo que se ha repetido fre-
dearse, y cuanto más abierta sea la vocal, más amplia la abertura. El cuentemente que la elección de las vocales cardinales por parte de
abocinamiento de los labios en [u), por tanto, es mayor que el de [o), Jones fue arbitraria, lo que no es del todo cierto si tenemos en cuenta
siendo, como son ambas, vocales redondeadas. que, para establecerlas, partió de la «teoría del limite vocálicQ». De
La segunda observación, ampliamente constatada, es que el re don- acuerdo con ella, cada una de las vocales que los seres humanos
deamiento es más frecuente en las vocales posteriores que en las pode mos pronunciar, sean cuales fueren, se realiza con la parte más
anteriores. El castellano, por ejemplo, posee sólo dos elementos vocáli- alta de la lengua situada dentro de un espacio bien delimitado de la
cos redondeados, la [o) y la [u), y los dos son posteriores. Este hecho boca . De situarse la lengua más allá de este ámbito, obtendríamos de
tiene, por lo demás, fácil explicación. Dado que el redondeamiento inmediato, con condiciones normales de volumen y velocidad del flujo
supone un descenso en el tono de la vocal, que, como detallamos más de aire, una consonante fricativa .
adelante, se hace más grave (véase apartado 5.4), es lógico que sean El limite anterior de este «espacio vocálico» está representado por
los sonidos de tonalidad ya originalmente grave -los posteriores- los la W, que es la vocal cardinal número uno . La transcribimos con un
que lo presentan, consiguiéndose de esta forma la máxima diferencia- guión suscrito porque éste es el diacrítico que diferencia estas unida-
ción perceptiva entre vocales anteriores y posteriores . des de las restantes vocales . La W, como decimos, es la vocal más
cerrada y más anterior. Si eleváramos y adelantáramos la lengua en
5.3.2. La descripción de las vocales en los términos anteriormente mayo r medida, pronunciaríamos una consonante fricativa palatal. El
señalados, no es todo lo precisa que sería deseable. Hemos apuntado, límite posterior, sin embargo, está representado por la vocal [gJ , la más
por ejemplo, que con este sistema no se especifican las dimensiones abierta y la más retrotraída de todas las vocales . De hecho , si acercára-
que presenta la cavidad de resonancia faríngea en cada caso. Se ha mos más a la faringe la raíz de la lengua de lo que la aproximamos al
argumentado, asimismo, que no todos los sonidos denominados altos lo pronunciar esta vocal, la cardinal número cinco, daríamos lugar a una
son en igual media (la [u) lo es menos que la [iJ), ni todos los sonidos consonante faríngea.

80 81
Entre ambos límites están situados otros seis sonidos auditivamente mente difícil aun contando con la guía y el asesoramiento constante del
e~uidistantes: la vocal cardinal número dos [!l), la número tres [~), y la
creador del' sistema (Abercrombie : 1985, 18). Las dieciséis vocales
numero cuatro [ª), formadas todas ellas al descender poco a poco el representadas en las Figs . 5.2 y 5.3 pueden hacerse corresponder, m~s
d?rso de la lengua a partir de la posición de [i]; la número seis [Q], la o menos, con otros tantos sonidos vocálicos de dIversas lenguas, segun
numero sIete [Q] y la número ocho [y] , resultado de la elevación gra- indicamos a continuación, pero tal correspondencIa nunca es exacta y
dual del dorso lmgual desde la posición ocupada en [¡¡l. Así pues, debe entenderse más como aproximación que como equivalencia .
eXIsten dos series de vocales, [!-~-.-ª-g) y [g-:;>-Q-\!], que mantienen
entre sí distancias auditivas similares. En la Fig . 5.2, reproducimos el • La vocal número 1, W, es un poco más cerrada y anterior que la
esquema propuesto por Jones para representarlas y que sigue siendo vocal [i] del castellano si, por ejemplo.
utIlIzado en la actualidad. • La número 2, [!l], es, asimismo, mucho más cerrada que la [e] del
Las ocho vocales arriba transcritas se conocen como vocales cardi- español me y un poco más anterior.
nales primarias, para distinguirlas de las que ahora explicaremos, las • La número 3, lJ;], en cambio , se asemeja a la primera vocal del
cardmales secundarias. Evidentemente, ninguna vocal puede ser «más francés béte o. del español guerra, es decir, es mucho más abIerta
primaria» que otra, todas ellas son iguales. La razÓn de estas denomina- que la número 2.
ciones no tiene, pues, nada que ver con la primacía de unas vocales • La número 4, [ª], es más anterior que la [a) castellana --que
sobre otras: las vocales primarias se establecieron antes que las secun- tiende a ser posterior más que central- y recuerda a la pnmera
darias y a ello deben su nombre . vocal francesa de patte.
Supongamos que pronunciamos los ocho sonidos de la Fig . 5.2 man- • [a], vocal cardinal número 5, es un sonido muy posterior , seme-
temendo la configuración articulatoria de cada uno de ellos, pero cam- jante al de la primera [a) de ahora o de la palabra mglesa [ather.
bIando la disposición de los labios. De este modo, las vocales que antes • La vocal número 6, [º-], se parece al sonido vocálico que se emite
eran redondeadas son ahora no redondeadas y viceversa, con lo que en la palabra inglesa lost, por ejemplo, o a algunas variantes
obtenemos otros ocho sonidos diferentes a los anteriores denominados abiertas de la [o] castellana .
vocales cardinales secundarias. Sus símbolos son [K-~-oe-CE-Q-,,-I-W] y • La número 7, [Q], es una vocal posterior mucho más cerrada que
en la FIg. 5.3 se muestra su disposición paralela a la de las primarias: la [o] española. Se asemeja , por tanto, a la [o] del francés pot o del
inglés go .
• La vocal número 8, [y] , es también más alta que la castellana [u) .
8 9 16 Aunque recuerda a la [u] del francés tout, es un poco más poste-
u w
rior que esta última. . .
• La número 9, [y], es, en realidad, una [i] redondeada , SimIlar a la
1 15 del participio francés vu o el sustantivo alemán Mühe. .
o y
• La vocal cardinal 10, [~], es más cerrada y antenor que el somdo
de eu en la palabra francesa [eu o la alemana schón ..
, 6
A
l.
• La número JI, [oe], es más abierta que la antenor, SImIlar a eu en
el posesivo francés leur o a la vocal alemana de zwólf.
a o <E o
• 5 12 13 • La vocal cardinal número 12, [CE], es una [ª] redondeada .
• La número 13, [Q], se asemeja a la vocal inglesa de hot, muy
Figura 5.2. Sistema de vocales Figura 5.3. Sistema de vocales posterior y redondeada.
cardinales primarias. cardinales secundarias. • La vocal cardinal 14, [,,), se corresponde con las vocales de las
palabras inglesas punch o cut, a pesar de que éstas suelen ser
Llegar a pronunciar correctamente las vocales cardinales es una más centrales que la cardinal.
tarea ardua que requiere mucha paciencia y muchas horas de práctica. • La número 15, [1], es una [Q] sin redondeamiento. Vocales seme-
El fonetista británico D. Abercrombie, alumno del propio Daniel Jones, jantes se encuentran fácilmente en lenguas asiáticas, como el vIet-
apunta a este respecto que el proceso de aprendizaje le resultó suma- namita .
83
82
• Finalmente, la vocal cardinal número 16, [w), equivale a una [u) 5 .3.3.Los sonidos vocálicos pueden experimentar una serie de modifi-
sin labialización. caciones secundarias que afectan a sus características articulatorias y
acústicas . Las más importantes son la nasalización y la retroflexión .
A estas dieciséis vocales se suman otras seis que son consideradas Las vocales nasalizadas u oronasales son aquellas durante cuya pro-
por algunos autores - no por todos (v. O'Connor: 1973, 106 y ss.}- ducción la úvula ha descendido, por lo que el flujo de aire ' proveniente
vocales cardinales también. Tres de ellas no son redondeadas (i, ;), ª) Y de los pulmones sale al exterior a través de las cavidades nasal y oral.
las otras tres sí lo son (j,¡, s, e). Su situación en el trapecio vocálico sería Para que una vocal se nasalice es preciso que existan consonantes
la que muestra la Fig. 5.4. nasales en el contexto inmediato. La primera [e) de la palabra española
mente, por ejemplo, es una [e) nasalizada, que representamos [e). A
diferencia de lo que ocurre en otras lenguas, como en francés o en
portugués, en español las vocales nasalizadas no poseen valor fonológi-
co, es decir, no sirven para distinguir significados.
Las vocales retroflejas se articulan con la punta de la lengua levanta-
da y dirigida hacia el interior de la cavidad oral mientras toda la masa
de la lengua se contrae lateralmente. Este tipo de vocales, no existentes
en castellano, se escuchan con frecuencia en el inglés americano del
Medio-Oeste, en palabras como shirt o car en las que la consonante [r)
transmite a la vocal el «r-colouring», es decir, la retroflexión.
Estas dos modificaciones secundarias, cuyos efectos acústicos expli-
camos en el apartado 5.4.2, no aparecen recogidas en el sistema de
Figura 5.4. vocales cardinales porque nunca alteran la naturaleza de la vocal a la
que se superponen, sino que únicamente la modifican en algún aspecto
Todas ellas , como puede comprobarse en este esquema, son voca- (véase apartado 7.3 sobre coarticulación).
les centrales c n diferentes grados de abertura.
El sistema de vocales cardinales fue concebido a partir de presu- 5 .3.4. A menudo se establece una diferenciación entre vocales tensas
puestos de tipo auditivo (ya hemos dicho que todos estos sonidos son y vocales relajadas para dar cuenta de contrastes como los que se dan
auditivamente equidistantes) y de tipo articulatorio (cada vocal se co- entre las palabras inglesas seen (<<vistQ)') y sin (<<pecado»), o [001 (<<ton-
rresponde con una determinada posición <dímite» de los órganos arti- tO») y [ull (<<lleno»). En general, se considera que una vocal tensa
culatorios) . Por consiguiente, al intentar utilizarlas en la práctica fonéti- requiere para su articulación una tensión mayor de los órganos artIcu-
ca diaria , conviene acudir al tiempo a los dos aspectos, al auditivo y al latorios, asociada a una mayor deformación del tracto vocal con respec-
articulatorio, apoyándonos en nuestras sensaciones de uno y otro tipo to a su posición neutra o de reposo.
para juzgar qué relación guarda cualquier vocal con el sistema car- A pesar de que esta distinción resulta útil desde el punto de vista
dinal. fonológico, los términos en que se formula son, cuando menos, dudosos
El procedimiento, así, constará de varios pasos. En primer lugar, se desde el punto de vista fonético. En primer lugar, la llamada «posIcIón
trata de reproducir en el mejor modo posible el sonido que se desea neutra» es una cuestión muy controvertida. Muchos autores (v. Lass,
estudiar y clasificar. A continuación, se deberán examinar todos los 1976 y Catford, 1977, entre otros) cqnsideran que, de existir, debe ser
movimientos realizados por la lengua desde esa posición hasta la cardi- diferente para cada lengua - no universal- lo que comphca extraor-
nal más próxima y ello nos proporcionará la clave para describir el dinariamente la descripción . En segundo lugar, el esfuerzo muscular
sonido investigado en relación con el cardinal. En todo momento, nues- mayor que se supone entrañan las vocales tensas no ha sido medido
tras impresiones auditivas y de contacto articulatorio actúan como me- con exactitud y, en todo caso, ¿dónde situamos el limite?, ¿cuál es la
canismos de comprobación, de manera que las decisiones sobre la mínima cantidad de esfuerzo muscular que nos permite catalogar un
similitud o disimulitud de los sonidos son mucho más rápidas que si sonido como tenso? (v. Torreblanca , 1976).
careciéramos de puntos de referencia. Para explicar contrastes como los anteriormente citados, parece

84 85
más conveniente, por tanto, hacer uso de otros parámetros. Las vocales Para medir el valor frecuencial de un determinado formante -que,
de seen y fool son, desde luego, más altas o cerradas que las de sin y recordemos, no coincide con una única frecuencia o arm6n.ic~ , sino
full. Además, las primeras se pronuncian con la raíz de la lengua más que abarca a varios de e11os- pueden seguirse dos procedImIentos:
separada de la pared faríngea, es decir, con una cavidad faríngea de o bien se toma el valor de la frecuencia central del formante , sobre
mayor tamaño que las segundas. Finalmente, las vocales de seen y fool un espectograma de banda ancha, o bien , sobre una sección (véase
tienen mayor duración -son más largas- que las de sin y full. Hablar apartado 3.2.5) , se registra la frecuencIa a la que está sItuado el
de vocales anchas frente a estrechas (Ladefoged, 1975) o largas frente a pico más alto de la envolvente . En ambos casos, existen márgenes de
breves, es, en consecuencia, preferible. error permisibles: en torno a los 20 Hz para el F I , Y entre 20 y 90 Hz
para el F, . . .
Según resulta evidente si observamos de nuevo la Flg. 5.5 , eXIste
correspondencia entre la situación del F, y la abertura de la caVIdad
5.4. Las vocales: características acústicas oral, de manera que cuanto mayor sea dicha abertura, más elevada
será la frecuencia del F, . La [a] es el sonido más abIerto del castellano ,
5.4.1. Como explicamos en su momento (véase apartado 2.5.1), el tim- y, consecuentemente , su primer formante es el de frecuencIa más alta .
bre de una vocal depende de su estructura formántica, es decir, de la La [i] y la [u] son las vocales más cerradas yeso explica la dIspOSIcIón
disposición que presenten sus formantes en el espectro . Ya adelanta- de sus F en la zona inferior del espectrograma . La [e] y la [o] son
mos también en anteriores apartados (véase apartado 2.5.2) que, para vocales ~edias y sus F tienen también valores medios.
identificar una vocal y distinguirla de las demás, es suficiente , por regla Asimismo, podemo~ comprobar en nuestra Fig . 5.5 que cuanto más
general, especificar los valores frecuenciales de sus dos primeros for- anterior sea una vocal, más alto estará situado su F, y, al revés, cuanto
mantes, F; y F., si bien es cierto que, en ciertas ocasiones , como vere- más posterior sea la articulación, más bajo será el valor frecuencial del
mos, se hace preciso consignar la situación del F,. La síntesis de habla F•. Así, la distancia entre el F, y el F. en las vocales anterIores es la
ha confIrmado, en efecto, que, partiendo tan sólo de los dos valores de mayor posible . . .
los dos formantes más bajos, se puede reproducir adecuadamente la Finalmente , cabe señalar la e strecha relaCión eXIstente entre el re-
cualidad de la vocal que se desea simular. dondeamiento o abocinamiento de los labios y el descenso de la fre-
A continuación, en la Fig . 5.5, presentamos el esquema que refleja la cuencia del F,: si redondeamos los labios estamos alargando la cavidad
estructura formántica de las vocales españolas, confeccionado a partir de resonancia oral (algunos autores pIensan que, en realIdad , estamos
de las mediciones obtenidas por Martinez Celdrán (1986). creando una nueva: véase nuestro apartado 2.1.4), Y todo alargamIento
Estos valores, que, como apunta Martinez Celdrán (1986 : 290), han de este resonador supone un descenso en el tono del sonido , es decir ,
sido calculados sobre la pronunciación de las cinco vocales aisladas un descenso de la frecuencia .
por un informante masculino , varían considerablemente de un hablante
a otro, en función de factores individuales (edad, sexo, características 5.4.2. Como es lógico , las modificaciones articulatorias secunda~ias,
anatómicas ... ) o contextuales . Sin esto es , la nasalización y la retroflexión, producen unos efectos acuslI-
embargo, el elemento decisivo 2400 cos particulares. .
para el reconocimiento de cual- No existe un criterio unánime todavía sobre cuáles sean los índIces
2100
quier vocal no es el valor abso- acústicos responsables de que percibamos una vocal como nasalizada .
1800
luto de sus frecuencias formánti- Mientras que no pocos autores han supuesto que las resonancIas produ-
1500
cas, sino la relación que sus for- cidas en la cavidad nasal «se añadíam) a las resonancIas de la caVIdad
1200
mantes guardan entre sí y con oral, apareciendo en el espectrograma como nuevos formantes - los
900
respecto a los formantes de las formantes nasales o FN- , las investigaciones recIentes muestran que
600
restantes vocales, por lo que las mucho más importante que la presencia de estos formantes es el debIlI-
300
variaciones a que nos referimos tamiento de la intensidad de los formantes habituales, en concreto del
[iJ [eJ [al [oJ [uJ F, . El fenómeno se comprende si tenemos en cuenta que algunas de las
no dificultan en modo alguno .la
comunicación . Figll%a 5.5.
frecuencias que se producen en las fosas nasales se oponen a las que se
87
86
originan en la boca, por lo que la energía de estas últimas se anula o se lo presentan más cerca del primer formante que los agudos, en los
debilita en gran medida. cuales se localiza próximo al tercer formante y demás formantes
En cuanto a las vocales retroflejas, se observa en ellas un marcado superiores. Observando de nuevo nuestra Fig. 5.5, comprobamos que
descenso en la frecuencia del tercer formante, F3 , que en nada afecta a la [i] y la [e] son agudas, en tanto que la [o] y la [u] son graves. La vocal
la entidad misma de la vocal. [a] no es ni lo uno ni lo otro .
Otras modificaciones articulatorias posibles, tales como la velariza- El de bemolización es un rasgo de tonalidad, como el anterior. Las
ción o la palatización, es decir, el desplazamiento de la zona de articula- vocales redondeadas son bemolizadas, las no redondeadas son no be-
ción de la vocal más hacia el velo del paladar o más hacia la parte molizadas. El índice acústico que las diferencia es, según hemos dicho
antenor de éste, se manifiestan en el espectrograma por un gran des- anteriormente, el descenso del F, en las primeras.
censo de F, y F3 , la primera, y por una elevación de los mismos forman- Cada uno de estos rasgos, integrantes del conjunto de doce que
tes, la segunda. Jakobson, Fant y Halle concibieron para diferenciar entre sí tanto voca-
les como consonantes, presenta considerables problemas y puede ser
5.4.3. A partir de la publicación en 1951 de la obra de Roman Jakob- discutido - y de hecho lo ha sido- desde diversos puntos de vista.
son, Gunnar Fant y Morris Halle, Preliminaries lo Speech Analysis, las Pero éste no es un libro de fonología (véase la Presentación de esta
característICas acústicas mencionadas en los apartados anteriores, co- obra y, por tanto, no vamos a detenernos en examinar en profundidad
nocIdas merced al desarrollo del análisis espectrográfico, sirvieron de tan compleja cuestión, merecedora por sí sola de toda una monografía.
base para establecer distintas categorías de sonidos vocálicos: vocales Conviene recordar, no obstante, que es precisamente en este punto
densas frente a difusas, gra ves frente a agudas, bemolizadas frente a no donde fonética y fonología se acercan más actuando la primera en mu-
bemolizadas. Las oposiciones creadas de este modo poseen, en la chas ocasiones como disciplina de consulta a la que el fonólogo acude
teoría fonológica jakobsoniana, valor distintivo, esto es, tienen capaci- para confirmar sus hipótesis. En este sentido, cuanto mejor sea nuestro
dad para diferenciar significados. Las propiedades que las definen - la conocimiento de la realidad fonética, más fácil nos resultará la com-
d ensidad, la bemolización ... - se denominan por ello rasgos distintivos prensión de los constructos fonológicos.
y, al menos en la formulación clásica de la teoría, sólo pueden presen-
tar dos especificaciones [+] o [-] , sin admitir valores intermedios. 5.4.4. En la Fig. 5.6, reproduci-
Por consiguiente, si decimos que una vocal - un fonema vocálico- es mos una carta de formantes (véa-
[+ denso], estamos afirmando que las diversas realizaciones en el habla de se apartado 2.5.2), a la que se
ese fonema comparten un rasgo común, la densidad, por el que tal fone- han trasladado los valores del
ma se opone a otros y cuyos índices acústicos detallamos a continuación. F, y F, de las vocales españo-
Los sonidos densos se caracterizan por el predominio relativo de las, de acuerdo con las medicio-
los formantes situados en la región central del espectrograma. Los nes proporcionadas por Martí-
difusos, en cambio, presentan un predominio de las regiones formánti- nez Celdrán. Como puede ob-
cas no centrales. El indicio más revelador para saber si una vocal es o servars8,la figura que resulta si
no densa nos lo proporciona la posición del primer formante. En la [a] unimos los cinco puntos corres-
de nuestra Fig. 5.5, dicho F, está muy alto , de modo que se trata de un pondientes a las cinco vocales es
sonido denso; en la [i] y la [u], difusos ambos , el F por el contrario, un triángulo, semejante al que el
"
está muy baJo. La [e] y la [o] no son ni densos ni difusos: sus F ocupan alemán C. F. Hellwag concibió en
una posición media. 1 el siglo XVIII para describir los
Un sonido se categoriza como grave o agudo dependiendo de qué sistemas vocálicos de algunas len- 3000 20CXl 1000 500 250
parte del espectrograma predomine en cada caso : cuando lo que pre- guas y que normalmente se cono-:
domma es la parte baja, se trata de un sonido grave. Si, en cambio, ce como «el triángulo de Hellwag». Figura 5.6.
predomina la parte superior del espectro, el sonido es agudo. El índice
más característico de este rasgo en las vocales es la posición del segun- 5.4.5.En su obra clásica Manual de Pronunciación Española, Tomás
do formante en relación con la de otros formantes. Los sonidos graves Navarro Tomás precisa cuáles son las diferentes variantes que las voca-

88 89
les españolas pueden presentar en función del contexto. Se distinguen cie-Jo , pei-ne, ha-cia , cua- ira , claus-tro, ais-Iar, etc . Vemos que todos
variantes abiertas y cerradas para las vocales rilo [e]. [o] y [u] . y se estos vocablos constan de dos sHabas , una de las cuales posee dos
señalan tres tipos diferentes de [a]. la media, la palatal y la velar. vocales en su interior. Pues bien , estas combinaciones tautosilábicas (es
Además. se diferencia entre [i] y [u] semivocales e [i] y [u] semiconso- decir, pertenecientes a una misma sHaba) de dos vocales se denominan
nantes. diptongos . Si el número de vocales aumenta hasta tres. entonces habla-
En general. y de acuerdo con las observaciones de Navarro Tomás. mos de triptongo.
las variantes cerradas aparecen en sílaba libre . salvo en el caso de la Hay idiomas en los que no existe este tipo de agrupaciones vocáli-
[e] cerrada, que también puede aparecer en sílaba trabada por [m], cas. Sin embargo en alemán o en inglés. por ejemplo, son muy abun-
[n] . [s], [d] O [e]. Las variantes abiertas suelen producirse en sílaba dantes. En inglés , además. también es posible encontrar triptongos :
trabada (para la diferencia entre sHaba trabada y libre, véase más follower ['faloua], iron ['aian], player ['pleia] , etc . (Para la naturaleza
adelante, Capítulo 7, apartado 7.1.8), en contacto con [rr] , delante de [x]. fonológica de estos diptongos y triptongos, v. AJcaraz y Moody, 1976:
y, tratándose de [e] o de [o], en ciertos contextos adicionales, como los 85, 98).
diptongos [ej] y [oj]. En los diptongos y en los triptongos no todas las vocales desempe-
Las semiconsonantes y semivocales sólo pueden presentarse como ñan el mismo papel. Existe en ellos una vocal que es el auténtico núcleo
componentes iniciales o finales de diptongos. respectivamente. de la sílaba, mientras que la otra u otras restantes constituyen sonidos
Por lo que respecta a las variedades de [a], Navarro indica que la de transición hacia las consonantes vecinas. Esos sonidos de transición
palatal se encuentra ante consonantes palatales y en el diptongo [aj]; la o «deslizamiento», que en la tradición fonética anglosajona se conocen
velar, en los grupos [au] y [ao], en sílaba trabada por [1] y delante de [x]; como glides, son las articulaciones semiconsonantes y semivocales, a
finalmente, la media, en todos los demás contextos. las que dedicaremos los próximos apartados.
Emilio Alarcos, en su libro Fonologla Española (1964), ofreció una
justificación acústica para las distinciones establecidas por Navarro 5.5.2. El núcleo silábico es, en cualquier lengua, el sonido que reúne
muchos años antes y presentó los valores frecuenciales de los forman- las mejores cualidades de entre todos los sonidos que integran la
tes de cada variante . El planteamiento del ilustre fonetista se vio así sílaba: es el más abierto , el más perceptible, el más intenso, etc. (véase
corroborado, en un primer momento , por los nuevos datos brindados Capítulo 7, apartado 7.1). Por consiguiente , de todas las vocales que
por los espectrogramas , lo que contribuyó a que se siguiera conside- forman un diptongo o un triptongo, la que posea dichas características
rando como indiscutible. Sin embargo, los resultados de las investiga- en mayor medida será la que ocupe la posición nuclear . Así, en espa-
ciones más recientes ya no concuerdan con los de Alarcos. Si bien es ñol, la vocal abierta [a] y las medias [e] y [o] tienen prioridad' sobre las
cierto que existe una gran variabilidad en la realización de cada vocal, vocales cerradas [i] y [u] para constituir el núcleo silábico. En una
el contexto no parece ser el elemento responsable de la aparición de sílaba como pien, por ejemplo, la [e] es la vocal nuclear, de la misma
una u otra variante. Por el contrario, son otros factores de tipo indivi- forma que lo son la [o] y la [a] en toi y pau, respectivamente . En cuanto
dual , social o geográfico los que determinan el empleo de las diversas a los triptongos, su núcleo está formado siempre por la vocal central.
modalidades vocálicas (v . Momoy Casas, 1980). Consecuentemente, En castellano, pues, se consideran diptongos las uniones tautosilábi-
aunque admitamos la existencia de variantes, no podemos. a la vista de cas [i, u] con [o, e, a] ; las de [o , e, a] con [i, u] ; y las de [u] con [i] o [i]
los resultados del análisis instrumental. prever de forma sistemática la con [u]. Los primeros se denominan diptongos crecientes , puesto que
situación en que se presentarán. en ellos se produce, al pasar del segmento inicial al siguiente , un
incremento en la abertura, perceptibilidad, etc .; los segundos se llaman
decrecientes porque presentan una ordenación opuesta a la de los
5.5. Semivocales y semiconsonantes: aspectos anteriores; finalmente, en el tercer y cuarto caso, en los que existe
articulatorios y acústicos igual grado de abertura, no se habla de diptongos crecientes o decre-
cientes: el núcleo lo ocupa la vocal que posea mayor intensidad , es
5.5.1. Como explicaremos más detalladamente en el Capítulo 7, en decir, la que recibe el acento (en los inacentuados, predomina siempre
algunas lenguas dos o más vocales pueden aparecer agrupadas en una la segunda vocal) .
sola sílaba. Tenemos ejemplos de ello en muchas palabras españolas : Si el núcleo está situado en segunda posición, como en todos los

90 91
d iptongos crecientes, se dice que el otro segmento vocálico integrante hueco, huevo, etc., es decir , cuando van en posición inicial de palabra
de la sílaba tiene una articulación semiconsonante; si, por el contrario, o entre vocales, las vocales cerradas sufren un proceso de consonanti-
el núcleo ocupa la primera posición, según Ocurre en los diptongos zación que las convierte en auténticas aproximantes , las cuales en cier-
decrecientes, el segmento que le sucede presenta una articulación tos casos pueden llegar a desarrollarse a su vez como plenamente
semivocal. Esta diferenciación, mantenida durante largo tiempo y revi- fricativas: ['rerro], ['Ywe~o]. Parece , pues, razonable , aunque manten-
sada en la actualidad, se basa en la idea de que la semiconsonante es gamos la diferenciación semiconsonante-semivocal, tomar en conside-
una articulación a medio camino entre la consonántica y la vocálica, que ración la nueva categoría de aproximante , en estrecha relación, como
comienza con un grado de cierre casi similar al de una consonante vemos, con las anteriores.
fricativa para ir abriéndose paulatinamente, en tanto que la articulación
semivocal responde a movimientos articulatorios de carácter inverso, 5.5.3. Acústicamente es posible saber si dos vocales forman o no dip-
esto es, consiste en una transición desde la abertura vocálica a la tongo a partir de la velocidad de transición entre los formantes de una
constricción fricativa. Las vocales [i] y [u] de miedo y suelo son, de y otra . Si esta transición es rela-
acuerdo con lo anterior, articulaciones semiconsonantes y se represen- tivamente larga y se produce,
tan fonéticamente como D] y [w]; las vocales [i] y [u] de baile o feudal
son, en cambio, articulaciones semivocales, cuyos símbolos en el Alfa-
por tanto, lentamente, las dos vo-
cales constituyen un diptongo. Si, ~\
beto Fonético Hispánico (empleado en los países hispanohablantes) son en cambio, el paso de los for- :. " ~ ,,. '~~!
[i] y [\,l] y, en el Alfabeto Fonético Internacional, los mismos que para las mantes de la primera a la segun- . ..... "
" I~¡' ~ .
semiconsonantes correspondientes (véase al respecto el Capítulo 6).
Como decíamos, en el momento actual se tiende a no efectuar esta
da es rápido y dura poco tiempo,
entonces las dos vocales no
r ..
distinción y a considerar semiconsonantes y semivocales como sonidos
articulatoriamente similares - los dos suponen una transición- englo-
bados en un tipo articulatorio más amplio que es el de los sonidos
forman diptongo, sino que es-
tán en hiato, esto es, pertenecen
a dos sílabas distintas (v. Bor-

aproximan tes. Dado que en este grupo se incluyen sobre todo sonidos zone de Manrique: 1980). En la
consonánticos (la vibrante fricativa [1] , por ejemplo, o la labiodental Figura 5.7, se muestran las re-
[uJ), volveremos a ocuparnos de él en nuestro próximo apartado, 5.6. presentaciones espectrográficas
Baste por el momento señalar que se denominan aproximantes todos del diptongo [wá] y del hia- ti á w á
aquellos sonidos que presentan un grado de constricción menor que el to [u.á]. Pueden constatarse en
que ofrecen las fricativas, aunque mayor que el de las vocales, y, en ella las diferencias que seña- Flgun 5.7. Hiato [u.á] y
consecuencia, no van acompañados de ruido de fricción. Algunos auto- lamoso diptongo [wá].
res españoles (v. Quilis: 1981, 176 y ss., y Martínez Celdrán: 1986,
171) no están de acuerdo con la inclusión de las semivocales y semicon-
sonantes entre las aproximantes. El problema radica en que este último
concepto ha sido elaborado por fonetistas anglosajones (es creación de 5,6. Las consonantes: características articulatorias
P. Ladefoged), que lo han ejemplificado con las agrupaciones vocálicas
existentes en inglés, no equiparables en modo alguno con los dipton- .5.6.1. Las consonantes se han descrito tradicionalmente en función de
gos españoles. Así, los sonidos iniciales de las palabras inglesas you o tres parámetros: la acción de las cuerdas vocales durante su emisión, la
we serían, respectivamente, las aproximantes [j] y [w], que cumplirían zona en que su articulación tiene lugar y el modo en que se lleva a cabo
en realidad una función consonántica y que se diferencian en gran tal articulación . Sin embargo, cabe considerar otro criterio más, previo
medida de los sonidos españoles D] y [w] de cielo o pueblo, auténticos si se quiere a los anteriores, por el que se divide a las consonantes en
sonidos vocálicos transitorios. virtud de la corriente de aire que se utilice en su pronunciación.
En determinados contextos, sin embargo, las semiconsonantes espa- Así pues, las consonantes pueden ser, en primer lugar, egresivas,
ñolas adquieren una articulación bastante similar a la de las aproximan- ingresivas o eyectivas.
tes inglesas a que nos referimos. En términos como hiedra, hierro, Las egresivas , que son las más frecuentes, se articulan con el flujo

92 93
de aire proveniente de los pulmones . Todas las consonantes castellanas dad realmente distintiva - al menos en castellano (v. Martínez Cel-
son, como ya dijimos (véase Capítulo 2), egresivas . drán: 1984a).
Las ingresivas , en cambio , se realizan mediante el aire que penetra Al igual que ocurría en el caso de las vocales, se considera que una
desde el exterior. Entre ellas, las llamadas inyectivas requieren la consonante tensa posee una duración superior a la de una relajada y,
formación de una oclusión en la boca y otra en la glotis , que , cuando además, se articula con una deformación mayor del canal bucal con
están constituidas, crean una cámara de aire cerrada. Es entonces cuan- respecto a la posición neutra o de reposo y con una mayor intensidad.
do la laringe desciende, con el consiguiente aumento del tamaño de En el caso de las oclusivas, la explosión con que se deshace la oclusión
esta cavidad y el consiguiente enrarecimiento del volumen de aire en es, asimismo, más fuerte en las tensas que en las relajadas, y, en
ella contenido. Esta rarefacción de las partículas de aire explica que , al general, la perceptibilidad es mayor en las primeras que en las segun-
relajarse la oclusión bucal , penetre aire del exterior (recuérdese, a das. Estas características han sido ampliamente investigadas y se han
este respecto, todo lo explicado en el apartado 2.2 .1). Existe otro tipo visto corroboradas en muchas lenguas mientras que no lo han sido en
de consonantes ingresivas , los clics, cuyo mecanismo de articulación otras (v . Catford: 1977, 202 Y ss .). Por consiguiente, si, a pesar de las
difiere del que acabamos de explicar. En estos sonidos, también hay objeciones que la tensión ha recibido como parámetro fonético inde-
una oclusión doble, en el velo del paladar y en la zona anterior de la pendiente, se desea utilizarlo para describir una consonante, habrá que
boca. En la cavidad así formada se origina el enrarecimiento del aire especificar en qué sentido se está manejando el concepto , es decir,
haciendo que la lengua se arquee hacia abajo o descienda, para, de cuáles de las características anteriores lo manifiestan en la lengua con-
este modo, lograr que el aire del exterior entre en la boca. Los clics no creta de que se trate y cuáles no .
existen en las lenguas europeas , pero abundan en ciertas lenguas afri- En español parece que la tensión consonántica guarda una relación
canas como las pertenecientes a la familia bantú. directa con la duración y una relación inversa con la intensidad, según
Finalmente , para articular las consonantes eyectivas -€n realidad se desprende de algunas pruebas experimentales (v . Martínez Cel-
un tipo especial de egresivas- se utiliza el aire almacenado en la cavi- drán: 1984b). Así, por ejemplo, una oclusiva sorda, que no posee ape-
dad creada entre dos oclusiones, una de ellas en la glotis. Si se eleva nas intensidad y es comparativamente larga se considerará tensa y una
la laringe, este volumen de aire se ve constreñido hasta tal punto que oclusiva sonora será, en cambio, relajada . La cuestión, no obstante,
ha de salir bruscamente al exterior dando lugar a la consonante. queda abierta: pueden existir otras propiedades acústicas y/o articula-
torias, todavía no definidas, que reflejen la tensión. Estudiar y precisar
5.6.2. La actividad fonatoria de la laringe nos divide a las consonantes estas características es el paso previo para poder abordar el problema
en sordas y sonoras . Durante la emisión de las primeras , las cuerdas de la distintividad, esto es , para saber qué oposición, sordo-sonoro o
vocales no vibran , mientras que sí lo hacen en el caso de las segundas tenso-relajado, es pertinente - sirve para diferenciar significados- en
(véase apartado 2.2 .3). En la relación de la Fig . 6.1 puede verse cuáles nuestra lengua .
son las consonantes castellanas sonoras y cuáles las sordas .
A menudo se ha dicho que los sonidos consonánticos sordos son 5.6.3. El tercer criterio de clasificación de las consonantes se refiere a
tensos, fuertes o «fortis», en tanto que los sonoros son relajados, débi- la zona del tracto vocal en que se articulen. Preferimos emplear el
les o ,denis». Se alude con ello de nuevo al parámetro de tensión, al que vocablo zona en lugar del más difundido punto, porque este último da a
nos referimos a propósito de las vocales . E. Alarcos, por ejemplo , entender que los articuladores se unen o aproximan en lugares muy
escribe (1964, 199 Y ss .): «Esta correlación [la sonoridad] aparece exactos, lo que no se ajusta del todo a la realidad: hay un cierto grado
muchas veces combinada con la anterior [la de tensión] , y, así, una de de variación dentro de los limites correspondientes a cada división del
ellas es redundante. Las últimas experiencias muestran que para la tracto.
percepción de la (sonoridad) no siempre es necesaria la vibración de Podemos distinguir las siguientes zonas de articulación:
las cuerdas vocales .» La idea es, por tanto, que en las posiciones o
contextos en que se pierda la vibración laríngea (v.g. en la voz cuchi- 1. Zona labial. En ella se producen dos tipos de sonidos, los
cheada) , la distinción entre las consonantes sordas y sonoras se man- bilabiales y los labiodentales . Los primeros se articulan juntando o
tiene gracias a la propiedad concomitante de la tensión. Algunos aproximando los dos labios; los segundos, juntando o aproximando el
autores piensan incluso que es ésta y no la sonoridad la propie- labio inferior a los incisivos superiores . En castellano , son bilabiales la

94 95
[p], lb], W] y [m]; son labiodentales sólo la [1] y la nasal [11)] que se una fricativa palatal sorda , [<;:], que suena en vocablos como ich o
escucha, por ejemplo, en enfermo. Ello no quiere decir que no existan nicht.
muchas más posibilidades de articulación en esta zona. El sonido [q>] es 5. Zona velar. En la zona del velo del paladar se articulan un
una fricativa sorda bilabial que se da en bastante lenguas, entre ellas el gran número de consonantes. Al igual que sucedía en el caso anterior,
aleman (schwer) y algunas variedades del español americano. El soni- algunas de ellas pueden clasificarse, en realidad, como postpalatales,
do [v] es una fricativa sonora labiodental con la que se pronunciaban en puesto que se pronuncian en el limite entre la zona pala tal y la velar. En
castellano palabras como Valencia o vaca , antes de que se generalizara castellano son velares la [g] oclusiva y la fricativa [Y], la [k], [x] (que no
su confluencia con [b]. Finalmente, la [u] es una aproximante, es decir, debemos nunca confundir con la «x» ortográfica, puesto que se trata
una fricativa más abierta de lo normal (véase apartado 5.6.5) , labioden- del símbolo fonético empleado para representar a la «j» de jin"te, por
tal sonora. ejemplo) y la [U] que se velariza ante consonantes velares: ár;gel ['aU
2. Zona dental. Consideramos dentales a los sonidos articulados xel].
en los dientes, ya sea situando el ápice de la lengua entre los incisivos 6. Zona uvular. Los sonidos uvulares se realizan elevando la
superiores e inferiores, como en las interdentales, ya sea apoyándolo parte posterior de la lengua hacia la úvula, o acercando la úvula hacia
contra la cara interna de los incisivos superiores, como en las dentales el posdorso de la lengua: depende cuál sea en cada caso el órgano
propiamente dichas. Son articulaciones interdentales en español la [9], activo y el órgano pasivo. Son sonidos uvulares típicos las «erres»
interdental fricativa sorda, y [),l, UJ o [p,l cuando se encuentran delante francesas, esto es, la [R] vibrante simple o múltiple que se escucha en
de esta consonante interdental, que les transmite su zona de articula- el francés hablado en París, así como su variante fricativa [11].
ción. Consonantes dentales son, en castellano, la [t], la [d] y la [o]. La 7. Zona faringea. Las consonantes faríngeas se forman juntando
primera es oclusiva y sorda; la segunda, oclusiva sonora; la tercera. o aproximando la raíz de la lengua a la pared faríngea . Así se articula,
fricativa sonora. por ejemplo, la «[» faríngea danesa. Sin embargo, los sonidos faríngeos
3. Zona alveolar. Los alveolos son las protuberancias que mar- más característicos, como son los
can la inserción de los dientes en las mandíbulas. En las llamadas árabes [n) y [ ~ ], suelen articu-
articulaciones alveolares, por tanto, el ápice o el predorso de la lengua larse mediante una contracción Pre palatal
toca o se acerca a los alveolos superiores y así se producen sonidos lateral de la faringe , que puede Alveolar Pala tal
como [s], su variante sonora [z], la en], las vibrantes simple y múltiple ir o no acompañada de una lige-
[r] y [rr], la fricativa [1], y la [1], además de otros sonidos no existentes ra elevación de la laringe .
en español como las consonantes retroflejas [11.1, [~] , [r], etc., que se 8. Zona glotal o laríngea. Bilabial
Uvular
caracterizan por pronunciarse con el ápice de la lengua dirigido hacia En ella se pueden formar una Faríngea
Labio-
el interior de la cavidad oral (recuérdese lo que explicamos sobre las oclusiva como [?] - al cerrar las
dental
vocales retroflejas, véase apartados 5.3 y 5.4). cuerdas vocales fuertemente- o
4. Zona pala tal. En la zona pala tal cabe hacer una distinción en- fricativas como [h] o [fi], sorda Glotal
tre la parte del paladar que linda directamente con los alveolos y que y sonora, respectivamente (véa-
denominaremos zona prepalatal, y la superficie del paladar situada a se lo expuesto en el aparta- Figura 5.8. Las diferentes zonas
continuación de ésta, que se conoce como zona pala tal propiamente tado 2.3.2 sobre la aspiración). de articulación .
dicha . Sonidos prepalatales son, por ejemplo, las consonantes [S] y [3],
que encontramos en la palabra inglesa she o en la francesa genou, 5.6.4. Son muchas las lenguas, especialmente de Africa, en las que
respectivamente, o las consonantes polacas [p] y [~]. A menudo se llama existen sonidos que los fonetistas transcriben como [kp] o [gb]. Son las
a estos sonidos palatoalveolares, porque, según decimos, se pronun- lamadas consonantes con doble articulación. Normalmente se trata de
cian en el limite de las dos zonas. En cuanto a los sonidos palata- oclusivas (aunque también hay fricativas) en las que la oclusión se
les, en español tenemos algunos: la (P] de ñandú, la (íJ] de chal, forma y se deshace de modo simultáneo en dos zonas.
la [d3] de cónyuge, su variante fricativa rI], de mayo, por ejemplo, Este tipo de consonantes no debe confundirse con aquellas otras
y la [A] de llama, todas son consonantes pronunciadas en la zona cor res- que han visto modificada su articulación mediante la adición de alguna
pondiente al paladar duro. Otras lenguas, .como el alemán, poseen característica secundaria. Por ejemplo, si abocinamos los labios para

96 97
pronunciar [k] obtenemos una velar labializada que transcribimos [kW ]. de signos diacríticos añadidos a los símbolos habituales para represen-
Cabría pensar, entonces, que el sonido [kp], citado anteriormente y tar las consonantes no modificadas : [W] para la labialización, l'] o [,] para
que se describe como una labio-velar, y el sonido [kW ] al que nos la palatalización, [ -] para la velarización y la faringalización (véase más
referimos ahora son una misma cosa, pero, sin embargo, en el primer adelante, Capítulo 6).
caso hablamos de doble articulación y, en el segundo, de modificación
secundaria. La razón es que en [kp]las dos articulaciones co-ocurren- 5.6.5. La manera o el modo en que se articulan las consonantes es el
tes presentan el mismo grado de obstáculo a la salida del aire, esto es, último parámetro empleado para clasificarlas. Se trata de describir la
están situadas, por así decirlo, a la misma altura en la escala de abertu- disposición particular que presentan los órganos articulatorios en .Ia
ra de los sonidos : en concreto, las dos son oclusivas porque cierran el zona en que se conforma el sonido. Así, tenemos las slgUlentes poslblh-
paso durante milésimas de segundo al flujo de aire egresivo . En [kW ],
dades:
por el contrario, las dos articulaciones simultáneas no pertenecen al
mismo nivel; mientras que [k] sigue siendo una oclusiva, la articulación 1. Articulaciones oclusivas. Según hemos venido señalando (véa-
secundaria [w] es mucho más abierta, cuasi-vocálica. Aunque no siem- se apartado 2.4.2), en ellas los órganos crean un obstáculo absoluto a la
pre es fácil distinguir la una de la otra, ambas modalidades reciben salida del aire, un cierre completo, que dura milésimas de segundo y
convencionalmente denominaciones distintas. Las dobles articulaciones que suele deshacerse mediante una pequeña explosión . Hay oclusivas
se nombran utilizando los términos correspondientes a las dos zonas labiales, como las españolas [p] y lb]; oclusivas dentales como [t] y [d] ;
implicadas separados por un guión (labial-velar, labial-palatal, etc.), en velares, como [k] y [g]. Aparte de ser sordas o sonoras , como sucede
tanto que las articulaciones secundarias se precisan empleando un ad- en castellano, las oclusivas, especialmente las sordas, son con mucha
jetivo que acompaña a la denominación de la zona de articulación frecuencia aspiradas (véase apartado 2.3.3). Si la aspiración es muy
propia de la consonante (velar labializada, velar palatizada, alveolar fuerte, las aspiradas tienden a convertirse en africadas, grupo del que
velarizada, etc.). hablaremos en seguida. Las oclusivas fuertemente aspiradas se repre-
Según se desprende de lo que acabamos de explicar, las modifica- sentan con una [h] situada a continuación de su propio símbolo; las de
ciones articulatorias secundarias que puede experimentar una conso- aspiración suave, con el apóstrofo ['] pospuesto o una pequeña [h]
nante son varias. Hemos visto ya que la labialización consiste básica- volada .
mente en añadir el sonido original un componente similar a [w] . Pues 2. Articulaciones fricativas . Su propiedad caracterlstica es que
bien, además de labializarse, las consonantes pueden palatalizarse, los órganos empleados en su articulación se aproximan, sin llegar a
velarizarse o faringalizarse . juntarse como ocurrla en el caso de las oclusivas . Las fricativas son, por
La palatalización supone la adición a la articulación base de una regla general, más numerosas que las oclusivas en las diferentes len-
posición de la lengua semejante a la requerida para pronunciar la guas del mundo. En castellano, son fricativas la [s], la [9], la [~], la [5], la
semiconsonante [j]. Las consonantes palatalizadas son muy abundantes [.], la [x], la [1] , la [J] y la [1], pero existen, claro está, muchas más
en ruso y otras lenguas eslavas . realizaciones posibles (véase el Alfabeto Fonético Internacional de la
La velarización entraña una elevación de la parte posterior de la Fig . 6.3).
lengua hacia el paladar blando, algo parecido a lo que ocurre cuando 3. Articulaciones africadas o semioclusi vas. Muchos autores las
pronunciamos la vocal cardinal número 16, es decir , la [w] o [u] sin consideran un tipo especial de oclusivas . En realidad , en ellas se pro-
redondeamiento . La [1] velarizada , [1] , se escucha , por ejemplo , en duce un cierre absoluto del canal en alguna de sus zonas que se
catalán, así como en inglés y en otras muchas lenguas. resuelve en un estrechamiento por el que el flujo de aire sale al exte-
Finalmente, la faringalización implica la superposición a la articula- rior, acompañado de ruido de fricción. Son, pues, consonantes con dos
ción base de un estrechamiento de la cavidad faríngea , conseguido al modos de articulación sucesivos : oclusivo y fricativo. En español hay
retrotraer la raíz de la lengua o al contraer lateralmente la faringe y dos africadas: la «ch», representada (tJ), y la «y» inicial o tras nasal.
subir la laringe . Las consonantes «enfáticas» del árabe son muy a menu- representada [d3].
do faringalizadas . 4. Articulaciones aproximantes . Ya nos referimos a ellas al hablar
Estas no son las únicas modificaciones posibles , pero sí las más de las semiconsonantes y semivocales (véase apartado 5.5.2). Como
frecuentes . Su transcripción fonética se realiza mediante la utilización dijimos entonces, se trata de sonidos pronunciados con una constric-
98 99
ción del canal menor que la que presentan las fricativas, pero mayor 7. Articulaciones nasales. Todas las modalidades de articulación
que la que se da en las vocales. En castellano, muchas de las fricativas vistas hasta ahora poseen un rasgo en común: todas ellas se definen en
intervocálicas se convierten con facilidad en aproximan tes y se repre- función de la cavidad oral, que es el resonador que interviene en todos
sentan con el diacrltico [el suscrito. En realidad , la frontera entre las los casos . Pero, como sabemos, durante la emisión de algunos sonidos,
dos categorías es bastante borrosa y no puede decirse que existan el velo del paladar puede estar caido y dejar por ello el paso a la
lineas divisorias claras. Al margen de la discutible catalogación de las cavidad nasal abierto a la corriente de aire procedente de los pulmo-
semiconsonantes y semivocales como tales , hay varias aproximantes nes. Es entonces cuando se articulan los sonidos nasales, en los que
puramente consonánticas: la labiodental sonora [u], común a muchas actúa una cavidad de resonancia suplementaria, la nasal. En castellano
lenguas de la India, y la [1] aproximante, a la que se le asigna el mismo hay varios sonidos nasales. Todos ellos presentan una oclusión en la
símbolo fonético que a la fricativa, son ejemplos de ello. cavidad oral, situada en distinta zona en cada caso, mientras que la
5. Articulaciones laterales. En las consonantes laterales , el órga- salida a través de las fosas nasales permanece libre de obstáculo.
no articulador activo , habitualmente la lengua, toma contacto con el Tenemos así la [m], la [n], la [Q], etc. (véase Fig. 6.3).
pasivo en alguna zona del canal vocal, pero este contacto sólo tiene Se debe poner especial cuidado en no confundir los sonidos nasales
lugar en la parte central de dicho canal, de modo que el flujo de aire puros con los sonidos oronasales o nasalizados, producto del fenómeno
puede salir libremente por los dos lados del obstáculo . Hay laterales combinatorio de la coarticulación (véase apartado 7.3) Y a los que ya
alveolares - la española [1]- ; dentales - la W dental francesa-; pala- nos referimos en el apartado 5.3.3.
tales - la [A]- y laterales velarizadas (véase, anteriormente , aparta- Las nasales y las liquidas se agrupan con las vocales en el conjunto
do 5.6.4). de sonidos sonantes, esto es, aquellos sonidos que acústicamente com-
6. Articulaciones vibrantes. Las vibrantes se caracterizan porque parten una estructura formántica clara y que funcionalmente pueden
el órgano activo, que generalmente es el ápice de la lengua o la úvula, desempeñar el papel de núcleo silábico o centro de la sílaba.
realiza varias oclusiones apoyándose en el órgano pasivo, es decir, los
alveolos o el dorso posterior de la lengua, respectivamente (aunque
también existen vibrantes bilabiales, en las que un labio golpea contra 5.7. Las consonantes: características acústicas
otro, son poco frecuentes). Entre cada una de estas oclusiones, surgen
elementos de carácter vocálico, de claro reflejo en el espectrograma 5,7.1, Desde el punto de vista acústico, las consonantes son sonidos en
según veremos en e l próximo apartado. los que ha intervenido una fuente de ruido, bien sea transitorio o
La [R] uvular ha sustituido de manera total o parcial a la [r] alveolar turbulento (véase apartado 2.4.2). En ocasiones esta fuente de ruido
en un gran número de lenguas, como el francés, alemán, danés, holan- actúa conjuntamente con la fuente glotal y la consonante resultante se
dés, etc . En la mayor parte de los casos, sin embargo , el significado de denomina sonora; en otros casos, no hay vibración de las cuerdas
las palabras no se ve alterado si se utiliza un tipo de «erre» en lugar de vocales y la consonante se clasifica como sorda. Algunas de ellas, por
otro. Ambos sonidos, además, suelen experimentar en determinados otra parte, presentan una estructura formántica bien definida - las so-
contextos un proceso de debilitamiento que les lleva a convertirse en nantes- y otras, en cambio, no presentan farmantes claros, sino ener-
fricativos, es decir, a pronunciarse sin contacto completo entre el órga- gía acústica distribuida desordenadamente en determinadas frecuen-
no activo y el pasivo. cias - las no sonantes u obstruyentes.
En español , existen dos sonidos vibrantes: el simple , [r] , que apare- Como es natural, la descripción de cada uno de estos tipos debe
ce, por ejemplo, en la palabra pero, y el múltiple , [rr] , que encontra- hacerse de modo distinto. Las sonantes se describirán en función de la
mos en perro. posición de sus formantes en la escala de frecuencias y de la relación
A las consonantes vibrantes se las asocia tradicionalmente con las que dichos formantes guardan entre sí (al igual que hacíamos en e l caso
laterales para constituir el grupo de las liquidas. Es ésta una antigua de las vocales); las no sonantes se describirán a partir de la gama de
denominación reservada para los sonidos consonánticos con caracterís- frecuencias en las que se distribuye su energía, por la presencia o
ticas acústicas similares a los vocálicos, generalmente sonoros y con ausencia de períodos de silencio a lo largo de su duración, o por las
rasgos articulatorios comunes, como puede ser la presencia combinada especiales propiedades de la fase final de su emisión.
de un obstáculo con una abertura simultánea o subsiguiente . Toda esta información ha de extraerse del espectrograma. No siem-

100 101
1" I (8 rácil hacerlo, porque a veces el mismo sonido pronunciado por articulación de ésta, más elevada será la disposición del locus en la
1" Ison S diferentes o en contextos distintos ofrece espectros que difie- escala de frecuencias. Así, ellocus de las consonantes labiales se sitúa
I n uno de otro considerablemente. Los índices que se revelen deci- en torno a los 700 Hz; el de las dentales, entre los 1.000 y los 1. 700 Hz; el
SIVOS para la caracterización acústica de una consonante deben tener de las alveolares, alrededor de los 1.800 Hz; el de las palatales, entre
pues, un cierto margen de variabilidad, al tiempo que han de servir d~ los 2,000 y los 2.500 Hz, Y el de las velares, a 3.000 Hz. En este último
medio para su identificación y descripción. En los próximos apartados, caso, si la vocal es posterior, ellocus desciende mucho, hasta situarse a
enumeraremos los índices acústicos consonánticos más importantes. la altura de 800 Hz, más o menos. (Quede claro que siempre hablamos
de valores aproximados.)
5.7.2. El número de consonantes diferentes que pueden encontrarse
en las diversas lenguas del mundo es enorme . Sin embargo, todas 5.7.3. Cuando la consonante es una oclusiva, presenta en el espectro-
tienen en común el hecho de que su identificación acústica depende, en grama un espacio en blanco, correspondiente al tiempo en que los
gran medida, de las modificaciones o inflexiones que producen en los órganos articulatorios se unen e impiden la salida al exterior del flujo
formantes de las vocales vecinas, Así, mientras toda vocal se asocia con de aire procedente de los pulmones. Si la oclusiva, además, es sonora,
unos índices estables, la manifestación acústica de cualquier consonan- la vibración de las cuerdas vocales se reflejará en el espectrograma
te es sumamente variable y viene determinada por el contexto, como una barra de sonoridad, una franja gruesa similar a un formante
Las inflexiones a las que nos hemos referido se denominan transi- de frecuencia baja y situada inmediatamente encima del eje de abs-
ciones y son el reflejo de los movimientos que efectúan los órga- cisas.
nos artIculatonos para pasar de un sonido a otro, es decir de las va- No todas las consonantes oclusivas resuelven su oclusión mediante
riaciones que experimentan las cavidades de resonancia ~n su forma una ligera explosión, aunque la denominación de explosivas que a
y en su tamaño. Ya explicamos que eran un índice importantísimo veces se les atribuye así parece indicarlo. Lo cierto es que en muchos
para dilucidar si dos vocales sucesivas constituían o no diptongo (véa- contextos esa explosión no se produce. En caso de existir, su represen-
se apartado 5.5.3). Ahora explicaremos en qué sentido son decisivas tación en el espectrograma es una barra perpendicular (llamada barra
para el reconocimiento de las consonantes. de explosión), localizada al final del sonido oclusivo y antes del sonido
Supongamos que obtenemos vocálico siguiente. El punto o la zona de mayor intensidad de dicha
el espectrograma de la secuen- barra , donde la energía está más concentrada, puede estar situado a
cia vaya (,baJa], que esquemati- diferente altura con respecto al eje de ordenadas (=eje de frecuen-
zamos en la Fig. 5.9. Observa- cias), por lo que se convierte también en un indicio valioso para la
mos que los segundos y terceros identificación de la consonante de que se trate.
formantes de las dos vocales [a]
sufren en sus extremos una va- 5.7.4. Si un sonido es producto de una fuente de ruido turbulento, y
riación consistente en una ligera además es sordo, como por ejemplo ocurre con las fricativas castella-
elevación con respecto a la altu- nas [s], [f], [e] o [x], su imagen en el espectrograma se caracteriza por
ra media del cuerpo del forman- el modo desordenado en que aparece distribuida su energía, que
te. Si prolongamos, mediante lí- desciende desde las altas frecuencias hacia las bajas en una banda
neas de puntos, el movimiento vertical de intensidad variable. Cuanto más anterior sea la zona de
ascendente del segundo forman- articulación de la consonante, más alto será el comienzo de las frecuen-
te de las dos vocales, compro- cias.
(b] (á] (jJ (a]
baremos que las dos líneas se Por otra parte, en las fricativas sonoras del tipo [~], [iI] y [.] , en lugar
cruzan en un punto de intersec- Figura 5.9. del espacio en blanco que distingue a las oclusivas correspondientes,
ción virtual que se conoce co- aparecen zonas de resonancia, de configuración parecida a los forman-
mo ¡acuso tes vocálicos, más numerosas cuanto más pequeña sea la constricción
El locus estará situado a diferente altura según se trate de una u otra de los órganos articulatorios y, consecuentemente, más fácil la salida
consonante, de forma tal que cuanto más posterior sea la zona de del aire al exterior.
102 103
De acuerdo con todo lo anterior, la representación de las consonan-
tes africadas, que, como explicamos, combinan estos dos modos de
articulación (véase apartado 5.6.5), se compone de un primer momento
oclusIvo - un blanco en el espectrograma y una barra de explosión no
8000
sIempre presente- y un segundo momento fricativo, con su turbulen-
7500
cIa característica. Por regla general, el periodo de oclusión es mayor
7000
que. el de fncaclón, pero la duración relativa de ambas fases depende,
en ultima mstancia, de factores dialectales o sociales. 6SOO

6000
.,

5.7.5. Veamos ahora cuáles son los índices acústicos característicos de


5OO:J
las consonantes sonantes.
' 500
. La estructura formántica de las líquidas es, según dijimos, muy
.000
SImIlar a la de las vocales, aunque su frecuencia fundamental y su
3500
IntenSIdad son claramente menores que las de los sonidos vocálicos.
3000
Las laterales, en concreto, presentan tres formantes bien definidos cu-
yos valores frecuenciales varían de un idioma a otro y de un contexto a '500

otro. (Para todo lo referente a las laterales castellanas, véase Quilis et 2000
al., 1979). 1500

En cuanto a las vibrantes, es interesante señalar que el espectrogra- 1000


ma refleja las rápidas oclusiones que se suceden en su articulación 500
como brevísimas interrupciones de la corriente de aire, es decir, como
pequeños espacios en blanco. Si la vibrante es múltiple, entre las
InterrUpCIOnes sucesivas suelen aparecer elementos de tipo vocálico,
que se corresponden con los momentos en que el aire sale libremente
al exterior. En español, además, cuando la vibrante va formando grupo
con una consonante oclusiva o fricativa en posición inicial de sílaba
Figura 5.10.
-- a{l.·' FOT. 667
2. 0 For . 1333
.{",O For',1 750
1 .' For 500?

Diferentes índices acústicos (Tomado de Martinez


~om? en brío, traje , frotar, droga, etc.-, sus vibraciones no siguen
Celdrán: 1986, 211).
mmedIatamente a la consonante anterior, sino que entre una y otra se
produce a menudo un pequeño elemento vocálico, de duración varia-
ble y de configuración similar a la de la vocal que constituye el núcleo 5.7.6. Las características acústicas mencionadas en los apartados ante-
SIlábICO, conOCIdo con el nombre de elemento esvarabático (v. Malm- riores sirvieron de base a Jakobson , Fant y Halle , para establecer ,
berg: 1965, 29-49, y Quilis: 1981 , 296-300). como en el caso de las vocales (véase apartado 5.4.3), distintas catego-
Las consonantes nasales suelen presentar en los sonogramas dos o rías fonológicas de sonidos consonánticos. Los índices acústicos señala-
más formantes de menor energía que los vocálicos. Asimismo , al igual dos vienen a ser, pues, el correlato físico de un conjunto establecido de
que sucede en las vocales nasalizadas (véase apartado 5.4.2), en ellas rasgos distintivos, en función de los cuales se definen las oposiciones
apa~ecen formant~s complementarios que reflejan las resonancias pro- que mantienen entre sí los fonemas de una lengua y que los hacen
dUCIdas en la caVIdad nasal y que se denominan, por ello, forman tes capaces de diferenciar significados. Así, hay consonantes que poseen
nasales. El más importante de estos formantes, el FN" se sitúa en torno el rasgo vocálico (todas las que tienen formantes claramente definidos)
a los 250 Hz; los restantes son sumamente débiles y no parecen influir y otras que no lo poseen (todas las obstruyentes o no sonantes). Tanto
de forma decisiva en la percepción de la nasalidad. unas como otras, sin embargo, se clasificarán como [+ consonánticas],
En la Fig. 5.10 pueden observarse, esquematizados, todos los índi- puesto que todas ellas tienen una energía global inferior a la que
ces acústicos a los que nos hemos estado refiriendo. caracteriza a las vocales.
Aparte de estos dos rasgos, vocálico y consonántico, Jakobson, Fant
104
105
y Halle propusieron otros diez, con los cuales podría darse cuenta de Tenso/flojo . Los correlatos acústicos de este rasgo distintivo no
están todavía muy bien estudiados . Ya mencionamos el problema de la
todas las oposiciones que distinguen a los diversos fonemas de las
distintas lenguas del mundo. Algunos de ellos son válidos para las tensión articulatoria de los sonidos en anteriores apartados (véanse
apartados 5.3.4 y 5.6.2). Acústicamente se hace difícil comprobar en el
vocales y las consonantes; otros sólo se aplican al último grupo. Los
enumeraremos rápidamente.
sonograma la diferencia entre los sonidos supuestamente tensos y los
supuestamente flojos o relajados. En Preliminaries to Speech Analysis
Sordo/sonoro . Las consonantes sonoras se caracterizan por la (apartado 2.4 .3), se dice que las realizaciones de los fonemas tensos
superposición de una fuente armónica a la fuente de ruido de las manifiestan un intervalo de sonido más largo y una energía mayor que
sordas. Esta oposición se utiliza con valor distintivo, aplicada a las las de los fonemas relajados . Es decir, los tensos serían sonidos más
consonantes, en la práctica totalidad de las lenguas, mientras que las largos y más intensos que los flojos. Ambas características pueden
vocales son, como sabemos, por lo general sonoras. medIrse en el espectrograma, pero no siempre se obtienen resultados
Denso/difuso. Ya explicamos en el apartado 5.4.3 que en los fone- acordes con los esperados.
mas, tanto vocálicos como consonánticos, caracterizados como densos, Recursivo/infraglotal. Son fonemas recursivos los que no utilizan
la zona central del espectrograma predomina sobre las regiones no en su realización la corriente de aire procedente de los pulmones, esto
centrales, al contrario de lo que ocurre en los sonidos difusos. En es, las consonantes ingresivas y las eyectivas. Por el contrario, los
castellano, por ejemplo, son densas las consonantes pala tales y velares, fonemas infraglotales se articulan siempre empleando el flujo de aire
en tanto que las labiales y dentales son difusas . proviniente de las cavidades infraglóticas . Los primeros presentan dos
Gra ve/agudo. En los sonidos graves , la energía aparece distribui- explosiones en el espectrograma, que se corresponden con las dos
da en la zona baja del espectrograma; en los agudos, en la parte alta. aberturas que se suceden en su articulación: la de la cavidad oral y la
Para las vocales, el índice más característico de este rasgo, como vi- de la glotis o -en el caso de los clics- el velo del paladar.
mos , es la posición del segundo formante en relación con los otros Bemolizado/normal. Según ya explicamos en el apartado 5.4.3, a
formantes . En cambio , para identificar el rasgo de gravedad de una propósito de la aplicación de este rasgo a las vocales, un sonido es
consonante es conveniente observar el segundo Carmante de la vocal bemolizado cuando se produce un descenso de su tono mediante la
adyacente (si la hubiera): en el caso de las consonantes graves, dicho disminución de sus frecuencias más elevadas . La labialización de una
formante suele descender y en las agudas, sin embargo, ascender. En vocal o una consonante origina siempre este efecto, que también puede
español son graves las consonantes labiales y velares; agudas, las den- conseguirse velarizando el sonido, es decir, reduciendo el orificio pos-
tales y palatales. terior de la cavidad oral y agrandándola. En el caso concreto de las
Estridente/mate . Los sonidos estridentes responden a ondas sono- consonantes labializadas o velarizadas, la bajada del tono se refleja en
ras de forma irregular y en el espectrograma están representados por el descenso de la frecuencia de varios o todos los formantes de la vocal
áreas de frecuencias distribuidas desordenadamente. Los mates, por el contigua.
contrario, poseen ondas más regulares y sus zonas de frecuencia for- Sostenido/normal. Las realizaciones de un fonema sostenido pre-
man estrías verticales u horizontales. Las oclusivas suelen ser mates, y, sentan un aumento de la frecuencia con respecto a las realizaciones de
cuando son estridentes , son, en realidad , africadas. Las fricativas en fonemas no sostenidos. Al palatalizar cualquier consonante logramos
cambio , pueden ser tanto estridentes como mates, si bien la fricativa crear este efecto : los forman tes superiores de la vocal adyacente expe-
óptima es estridente . La estridencia se origina por la mayor compleji- rimentan una elevación que se traduce en un agudizamiento del tiem-
dad del obstáculo opuesto a la salida del aire . bre oSi la consonante era grave, al palatalizarla se hará menos grave; si
Inte rrupto/continuo. En las consonantes interruptas , el espectro- e ra aguda, se hará más aguda .
grama presenta un periodo de completo silencio seguido o no de una Nasal/oral. El rasgo de nasalidad se manifiesta acústicamente, co-
barra de explosión . Son interruptas , pues , las oclusivas, las africadas y mo ya dijimos. con una reducción en la intensidad del FI , en el caso de
las vibrantes . En los fonemas continuos, sin embargo , no se produce las vocales, y con la aparición de formantes nasales a frecuencias deter-
ningún blanco en el sonograma, puesto que el flujo de aire no deja de minadas, en el de las consonantes. Los fonemas orales no presentan,
salir al exterior en ningún momento. Las fricativas y las laterales serán, claro está, ninguna de estas características.
pues, continuas.

106 107
(~t
Los alfabetos
fonéticos

6.1. La transcripción fonética

6.1.1. Transcribir significa, según el Diccionario de la Real Academia


Española de la Lengua, «representar elementos fonéticos, fonológicos,
léxicos o morfológicos de una lengua o dialecto mediante un sistema de
escritura» (edición de 1984, pág. 1330,3.· acepción). Así pues, la transo
cripción fonética, en particular, es la representación escrita de los
sonidos que pronunciamos, concebida de forma tal que puedan quedar
bien reflejados en ella todos los matices que diferencian a estos sonidos
entre sí.
La transcripción fonética puede ser más o menos detallada y , por
ello, los fonetistas hablan de transcripciones estrechas frente a trans-
cripciones anchas o amplias. En las primeras, se intenta recoger la
mayor cantidad posible de información fonética mediante el empleo de
nuevos símbolos o de signos diacríticos especiales. En las segundas,
sin embargo, sólo se anotan los rasgos fónicos que contribuyen a distin-
guir los elementos significativos de la lengua, es decir , los que tienen
valor diferenciativo (en este sentido, la transcripción fonética amplia es
bastante similar a la fonológica: véase la Presentación de esta obra) .
La elección de uno u otro tipo de transcripción dependerá en gran
medida de para qué o para quién se está transcribiendo . En un curso
de fonética, por ejemplo, no parece recomendable optar siempre por
la variedad ancha , porque esto impediría al alumno familiarizarse con
los símbolos y los hábitos articulatorios que ellos representan. Para

109
informar. en cambio. sobre la estructura general de un idioma , bastará
con señalar las peculiaridades más sobresalientes en una transcripción Vocales
amplia (véase Martinet: 1971, 161-166). Es importante tener presente , Grado de Acción de
con todo, que, por muy estrecha y detallada que sea una transcripción, 51mboJo Localización
constricción los labios
nunca representará exhaustivamente la realidad, sino que será tan sólo
i Anterior Cerrada No redondeada
una aproximación imperfecta al complejo conjunto de movimientos arti- Anterior Abierta
i No redondeada
culatorios y fenómenos acústicos que constituyen el habla. e Anterior Media No redondeada
~ Anterior Abierta No redondeada
a Central Abierta No redondeada
;¡ Velar Abierta No redondeada
6.2. Los alfabetos fonéticos o Posterior Media Redondeada
~ Posterior Abierta Redondeada
6.2.1 . Muchas de las personas que se inician en el estudio de los u Posterior Cerrada Redondeada
sonidos del lenguaje tienden a considerar la transcripción como la meta ~ Posterior Abierta Redondeada
de su esfuerzo, suponiendo que aprender fonética es, en realidad,
aprender a transcribir. Sin embargo, la transcripción no es más que un Consonantes
instrumento del que se sirve el fonetista para efectuar su trabajo , es Acción de las
51mboJo cuerdas Localización Modo de Ejemplo
decir , para describir y estudiar la capacidad fónica del ser humano . En articulación
vocales
consecuencia, al ser la transcripción un método práctico , establecido
por convención y de uso generalizado con diversos propósitos, ha de b Sonoro Bilabial Oclusivo [báta]
estar basada en un conjunto de símbolos conocidos por lodos los espe- !i Sonoro Bilabial Fricativo [káDo]
p Sordo Bilabial Oclusivo [páta]
cialistas. Estos símbolos conforman lo que se conoce con el nombre de m Sonoro Bilabial Nasal [mamá]
alfabeto fonético. f Sordo Labiodental Fricativo [fwérOa]
Con la ayuda que supone el empleo de un alfabeto fonético compar- Ijl Sonoro Labiodental Nasal [áglfora]
O Sordo Interdental Fricativo [káOo]
lido, se facilita la enseñanza y el aprendizaje de idiomas extranjeros, la ~ Sonoro lnterdental Fricativo [~e]
investigación lingúística en muchas de sus facetas - historia de la len- Q Sonoro lnterdental Nasal (óQOe]
l Sonoro lnterdental Lateral [álOo]
gua, dialectología, etc .- e, incluso, la aplicación de los logros en esta d Sonoro Dental Oclusivo [dós]
materia a otras áreas de conocimiento, como la informática o la medici- a Sonoro Dental Fricativo [Ma]
na (véase Capítulo 9). t Sordo Dental Oclusivo [tóCIo]
l Sonoro Dental Lateral [ájto]
A lo largo de la historia se han propuesto varios alfabetos fonéticos
~ Sordo Dental Fricativo [~ta]
diferentes. En los apartados siguientes nos ocuparemos de aquéllos de n Sonoro Dental Nasal [.¡riila]
empleo más extendido. s Sordo Alveolar Fricativo [iól]
z Sonoro Alveolar Fricativo [ázma]
l Sonoro Alveolar Lateral [lúO]
6.2.2. Durante muchos años, en todos los países de habla española se n Sonoro Alveolar Nasal [ná!ie]
r Sonoro Alveolar Vibrante simple [áro]
ha venido utilizando el llamado «Alfabeto de la Revista de Filología r Sonoro Alveolar Vibrante múltiple [rósa]
Española (RFE)>>. Este alfabeto fue, en efecto, propuesto por la RFE en e Sordo Palatal Africado [káco]
1915, basándose fundamentalmente en el alfabeto empleado de forma y Sordo Palatal Fricativo [áya]
? Sonoro Palatal Africado [kón?uxe]
general por los filólogos romanistas europeos. Con este alfabeto se han U Sonoro Palatal Nasal [espáua]
escrito, por tanto, obras tan clásicas dentro de la tradición lingüística j Sonoro Palatal Lateral [kwéjo]
hispana como el Manual de Pronunciación Española, de Tomás Navarro 9 Sonoro Velar Oclusivo [gáto]
ge Sonoro Velar Fricativo [Iágeo]
Tomás (1918), o los Elementos de Fonética General, de Samuel Gili k Sordo Velar Oclusivo [kápa]
Gaya (1961). x Sordo Velar Fricativo [áxo]
Q Sonoro Velar Nasal [áuxel)
En la Fig. 6.1 lo reproducimos íntegramente y presentamos algunos
ejemplos de cada realización. Figura 6.1. Alfabeto Fonético de la RFE.

110
111
6.2.3. La Asociación Fonética Internacional (AFI), fundada en 1886 por
NO SONANTES
un grupo de renombrados fonetistas (Sweet, Passy, Jespersen, etc.),
Den/al
propuso, en 1889, un alfabeto que , a partir de entonces, se conoce con Oclusi ya. BilabIal Den/al Velar Uvular Glolal

el nombre de Alfabeto Fonético lnternacional . Los principios que guia- Sordas p I


retroflejd

l k q ,
ron su elaboración se recogen en el ya clásico librito Principles of the Sonoras b d <t 9 G
lnternational Phonetic Association, publicado por la propia AFI en 1949.
Como es lógico, este sistema de escritura fonética ha sufrido, con el Denlo- A/veolar
- ,-
Labio- Pa/alo- Alveolo-
Fricath"•• Bilabial inler- Alveolar retro- Palatal
COrrer de los años, gran cantidad de modificaciones basadas en las dental
dental fleja
alveolar palatal

observaciones realizadas por los especialistas de todo el mundo, ten- , ¡



dentes a perfeccionarlo y hacerlo válido para la transcripción de cual-
Sordas
Sonoras
<t>
p
I
v
9
6 , z.. ,J •
<
l
quier lengua (v. al respecto, Albright: 1958). ~

Los símbolos utilizados son, en su mayor parte , grafías latinas , si


bien ocasionalmente se emplean letras griegas, en particular cuando se
~'" Velar Farlngea Glotal
Afric.daa Labial Alveolar Palatoalveolar
íj
'"ü Sordas pI
"
d,
pretende diferenciar dos sonidos muy próximos acústicamente y empa- "'I:J x
,
X h
,
h Sonoras bv d,
rentados entre sí. En otros casos, se reCurre al uso de signos diacríticos ...z a ñ

para evitar introducir nuevos símbolos o para representar los matices


fónicos más sutiles. 'o"
Z
~
SONANTES
Z Alveolar
En la actualidad, el Alfabeto Foné tico Internacional se generaliza O Bilabial Labiodental Alveolar Pala/al Velar Uvular

paulatinamente entre toda la comunidad científica, de modo que son ya


U N .....e .
m n ,
retrofleja
p
" N
pocos los investigadores que , aun siendo hispanohablantes, siguen uti- '"
lizando el Alfabeto de la RFE en sus trabajos. El fenómeno se compren- Laterales Aproxhnantea centrales Vibr.nte.

de fácilmente si pensamos que este último alfabeto resulta muy valioso 1 Alveolar aproximante
" Labiodental
, Alveolar múltiple

para transcribir propiedades específicas del español -en todos sus


¡ Alveolar frical. sorda ,
Post-alveolar r Alveolar fricativa
,
dialectos- o incluso de algunas lenguas con él vinculadas, pero se
demuestra poco menos que inservible si pretendemos llevar a cabo un

,
Alveolar fricat . sonora
l Alveolar retrofleja
{ Alveolar retrofleja
j Palatal
Alveolar simple
( Alveolar simp retrof.

Pala tal aproximante Ul Velar R Uvular simp y múlt


estudio comparativo con otros idiomas más diferenciados desde el Q Labia l-palatal
punto de vista fonético. En las Figs. 6.2 y 6.3, reproducimos los símbo- w Labial-velar

Vocales
no
redondeadas
w

A
Vocales
redondeadas

u

o
~

'"
>
¡;j
'"Ü
¡s
r-
6
ó
9
ou
Bilabial
Alveolar
Velar

SIGNOS DIACRíTICOS
Cllca
0 Bilabial cel)tral
1 Dental o alveolar central
e, Postalveolar, retrofleja o palatal
Alveolar o postalveolar lateral

"'
p' Bilabial
t' Alveolar
k' Velar

o o
é<> Articulación simultánea C: Consonante murmurada
Signos cUacriticoa C' Consonante palatalizada C': Consonante con oclusión laríngea
v-: Realización retrotraída . C ... : Realización adelantada Ch: Consonante aspirada
T
V + , Realización adelantada, V : Realización más abierta C-' Realización retrotraída y. Consonante ensordecida
Vl.: Realización más cerrada.
V: Realización centralizada.
y: Realización ensordecida.
y:
V:
V::
Realización
Realización
Vocal larga.
munnurada.
arenasal o nasalizada.
c;,:
y.
C: :
Realización dental
Realización silábica
Consonante larga
...y Fricativa muy abierta (aproximante)
Consonante velarizada o faringalizada
Cw : Consonante labializada
V: Elemento débil en un diptongo. V': Vocal semilarga,
C' : Consonante semilarga <;:. Consonante sonorizada

rig.6.2. Alfabeto Fonetico Internacional (Vocales). Figura 6.3. Alfabeto Fonético InternaCIonal (Consonantes).

112 113
los que el Alfabeto Internacional ofrece para representar las vocales y mediante el símbolo ('-') suscrito . Este mismo s igno nos sirve para
las consonantes. señalar los grupos de vocales que han de pronunciarse en una sola
sílaba.

6.3. Ejemplos de transcripción 6.3.2. Presentamos a continuación la transcripción del mismo texto en el
Alfabeto de la Revista de Filología Española. En ella, la barra triple (j / j)
6.3.1. En la Fig. 6.4 hemos transcrito, con el Alfabeto de la Asociación señala una pausa no inferior al segundo, dos barras (j j) representan
Fonética Internacional y en transcripción estrecha un fragmento de una pausa de unas cincuenta centésimas de segundo, y una sola barra ,
Crónica de una muerte anunciada, de Gabriel García Márquez (Bruge- una pausa inferior a las veinticinco centésimas de segundo (v. Navarro
ra, 1981). En todo momento se ha intentado representar el tipo de Tomás : 1971,276).
lectura que efectuaría una persona culta, castellana de procedencia.

«El día en que lo iban a matar, Santiago Nasar se levantó a las 5.30 de la
«El día en que lo iban a matar, Santiago Nasar se levantó a las 5.30 de la mañana para esperar el buque en que llegaba el obispo. Había soñado
mañana para esperar el buque en que llegaba el obispo. Había soñado que atravesaba un bosque de higuerones donde caía una llovizna tierna,
que atravesaba un bosque de higuerones donde caía una llovizna tierna, y por un instante fue feliz en el sueño, pero al despertar se sintió por
y por un instante fue feliz en el sueño, pero al despertar se sintió por completo salpicado de cagada de pájaros» (pág. 9).
completo salpicado de cagada de pájaros» (pág. 9).
[e,l:.dla eQ.ke lo 'ipan &..;na'talj, san'tjayo na 'sal se lef3an'to vas '9il)ko [el día elJ..ke lo iDan a matálll sa~tjág:o nasál se leóa~t6 ajas 9iUko tréj~ta
'tlejAta ~e la mapana T pali.espe'r;' el '~uke eqj<e l.e'y~~ eLo'~ispoL. de la m¡¡IJ~na TI para esperál el óúke elJ..-ke !eg:áóa eLoóispo!ll aóia
a'pla sO'J1a~o ke. . atlat3e'sapa 'tlIl\Jboske ~e....jye'rones 30nde ka'ia 'una sOIJác!o k~atraóesáóa llII\P6ske dejg:er6ne~ 30~de kaia una !oói~na
1.0'~i9n? 'tjemal, i po'run ¡n~'taAte 'fwe fe'liO en~et-sweJlO.l, pe1vl tjérnall i por~unJn~táJ¡te fwé feliO e'V'l swéIJo.l1 pero a).J:lespertál se
despel'tal se sin'tjo pOl kom'pleto salpj'kapo pe ka 'yaoa pe 'paxarosl .] si~tj6 por kompléto salpikaclo de kag:Ma de páxarosLIIIl

F1!J1ll'a 6.4. FI!J1ll'a 6.5.

Las flechas añadidas al final de determinadas porciones del texto


- las cuales, según veremos, se d enominan unidades melódicas- re-
presentan las variaciones tonales que tales unidades experimentan en
su parte última, en su terminación . Aunque lo explicaremos con mayor
detenimiento en el Capítulo 8, adelantamos ahora que una flecha ascen-
dente supone una elevaciÓn en el tono y una descendente , un descenso .
Los símbolos T y .1 transcriben contrastes tonales menos marcados; son
valores intermedios.
Un apóstrofo antepuesto a una sílaba indica que ésta es acentuada.
Son palabras habitualmente inacentuadas en español los pronombres
relativos, los adjetivos posesivos , el artículo determinado, las conjun-
ciones y las preposiciones . Por ello, ninguna de esas partes de la
oración aparece en el texto precedida por al apóstrofo a que nos
referimos.
Por último , los grupos de sílabas que se pronuncian como si forma-
ran una sola palabra, aunque de hecho no sea así, aparecen unidos

114 1I5
La combinación
de los sonidos

7.1. La sílaba

7.1.1. En repetidas ocasiones, a lo largo de este libro , hemos afirmado


que los sonidos del lenguaje se presentan unidos en la cadena hablada,
de forma que a menudo resulta dificil precisar, desde el punto de vista
articulatorio o acústico, dónde acaba un sonido y comienza otro . La
segmentación es, por tanto, una tarea complicada que no siempre ofre-
ce garantías de fiabilidad (véase Capitulo 5, apartado 5.1 l. No obstante,
es un hecho comprobado en todas las lenguas del mundo que los
sonidos tienden a agruparse, dentro de la cadena, en unidades mayo-
res, dotadas de una entidad propia y más fácilmente aislables que los
propios segmentos: son las silabas.

7.1.2. La definición y la naturaleza de la sílaba han sido, y son aún hoy,


aspectos muy debatidos de la investigación fonética, hasta el punto de
que es problemático encontrar puntos de vista coincidentes al res-
pecto .
Paradójicamente, la existencia de la sílaba, avalada por un conside-
rable número de pruebas, parece fuera de toda duda en la actualidad.
Entre los argumentos aducidos en su favor destacamos el que hace
referencia a la capacidad demostrada por individuos sin conocimientos
lingülsticos para silabear las palabras, o aquel otro que resalta el hecho
de que los hablantes afectados por afasia motriz subcortical realizan
tantos movimientos espiratorios como sílabas contiene el mensaje que

117
intentan expresar, pero podrían mencionarse muchos más indicios de difícil será diferenciar en él dos variantes. La [a], por tanto, no presenta
su realidad fonética (Hála: 1973, 4). implosión ni explosión porque su máxima abertura característica hace
El problema surge cuando se pretende definir la sílaba, lo que inapreciable cualquier matiz de este tipo. Sin embargo, sí podemos
presupone el conocimiento previo de su auténtica naturaleza . Han exis- hablar de una [p] implosiva en apto y de una [p] explOSiva en pata .
tido, desde la antigüedad clásica hasta nuestro días, muchos y variados Pues bien, toda sílaba estará constituida, según Saussure, por la
intentos de definición, que se han elaborado desde todos los enfoques suma de las dos fases, la fase de explosión, en primer lugar, y, en
posibles - fisiológico , articulado, auditivo o acústico-- sin que ninguno segundo, la de implosión. Ello implica que la secuencia de un sonido
de ellos haya alcanzado el respaldo unánime de los fonetistas . En los implosivo y otro explosivo (como la [p] y la [t] de apto, respectiva-
próximos apartados haremos un breve repaso de los más importantes. mente) conlleva la existencia de limite silábico entre ellos. De Igual
modo, el llamado núcleo silábico, es decir, el centro SilábiCO, se corres-
7,1.3. La concepción de la sílaba como una unidad espiratoria, defen- pondería siempre con el sonido con el que comienza la fase de cierre o
dida por muchos autores (Henry Sweet entre otros) y según la cual cada implosiva: las [e] de en, pe o pez, por ejemplo. .
sílaba está formada por una sola espiración, fue puesta en tela de juicio Este análisis no siempre concuerda con los datos que proporcIOnan
al comprobarse que en un único movimiento espiratorio pueden pro- las diferentes lenguas . Las sílabas inglesas skel y pants, por ejemplo,
nunciarse varias sílabas, dependiendo su número, en última instancia, no presentan la secuencia de aberturas crecientes, la primera, o decre-
de la capacidad pulmonar del hablante , entre otros factores. Así pues , cientes, la segunda, que deberían constituir sus fases de .exploslón e
no puede hablarse de sílaba espiratoria, si bien es cierto que en una implosión, respectivamente , de acuerdo con la argumentación de Saus-
misma espiración se producen pequeños impulsos coincidentes con sure. M. Grarnrnont (1965) introdujo en ella vanas modifICaCIOnes, . la
cada una de las sílabas pronunciadas y particularmente intensos en el más importante de las cuales fue el cambio de la abertura por la tensIón
caso de las acentuadas. muscular como parámetros en torno a los que se estructura la sílaba,
Tampoco la teo ría desarrollada por el psicólogo americano R. H. pero las objeciones presentadas a la nueva formulación fueron también
Stetson, en su obra Motor Phonetics, de 1925, se ha visto confirmada por numerosas. Ciertamente, es difícil medir con exactitud y dar expresión
investigaciones posteriores. Stetson concebía la sílaba como el resulta- numérica a la tensión de los diferentes sonidos (véase apartado 5.3.4),
do del impulso originado por el movimiento periódico de los músculos y, por tanto, el planteamiento de Grammont no resuelve la cuestión.
proyectores intercostales, de modo que podría definirse como cada
«soplo» de aire proveniente de la caja torácica . Aunque este plantea- 7.1.5. O. }espersen propuso una teoría de la sílaba basada en el gra~o
miento supuso un avance con respecto a las anteriores explicaciones de de «sonoridad» poseído por los distintos sonidos de la lengua. Segun
carácter fisiológico, estudios más recientes han demostrado que no este fonetista, el nivel más alto de esta propiedad lo poseerían las
existe una relación constante y simple entre la actividad muscular y la vocales abiertas seguidas en la escala por las vocales cerradas, las
descomposición silábica de la cadena hablada. Ninguna teoría fisioló- consonantes liquidas y nasales, las consonantes fricativas sonoras, las
gica de las que se han formulado hasta el momento se ha visto, en oclusivas sonoras, las fricativas sordas y, en el último lugar, las OclUSI-
realidad , definitivamente ratificada por medios instrumentales, por lo vas sordas. En cualquier sucesión de sonidos, «el oyente siente que hay
que no parece que la clave para comprender la naturaleza de la sílaba tantas sílabas como aumentos apreciables de sonoridad, en relación
deba buscarse tan sólo en estos términos. con los sonidos adyacentes menos sonoros. El sonido comparativa-
mente más sonoro es el "centro" silábico y se le considera, por consI-
7.1.4. En su Curso de Lingüística General, Ferdinand de Saussure guiente, "silábico", en oposición a los sonidos, que le rodean, "no
definió la sílaba desde el punto de vista articulatorio, basándose en una silábicos"» Uespersen: 1954, 452-453) . La ]erarqUla de los somdos en la
previa difere nciación de los sonidos en explosivos o implosivos, esto sílaba según su grado de sonoridad determina, pues, su ordenamiento
es, abrientes o cerrantes, en función de su posición en la cadena habla- en torno al <<núcleo», de forma que antes de él se produzca un aumento
da (Saussure: 1971 , 109). En principio , cualquier sonido puede ocupar gradual de dicha sonoridad y, después de él. un descenso hasta los
un lugar en el que los movimientos articulatorios requeridos para su valores mínimos. Un buen ejemplo de ello serían las sílabas de las
emisión sean de cierre o de abertura, pero es evidente que cuanto palabras españolas [kor-'Oon] o ['pa¡¡-da], en las que la cima silábica
mayor sea el grado de abertura propio del sonido en cuestión, más está ocupada por las vocales [o] y [a] , respectivamente .

lIS 119
Se ha señalado repetidas veces (v., por ejemplo, Hála: 1973, !O; las dos vocales presente las transiciones . La sílaba sería, entonces, una
BlOsnahan y Malmberg: 1970, 142) que el término de sonoridad, em- unidad acústica determinada por el grado de fusión y de influencia que
pleado en este contexto, resulta un tanto impreciso y confuso, por ejercieran entre sí vocales y consonantes.
cuanto admlte dos mterpretaclOnes diferentes. Puede referise como Esta idea , que en los experimentos con sintetizadores se ve clara-
cabría deducir a partir de la mención al oyente, al nivel de perc~ptibili­ mente confirmada, no siempre resulta evidente cuando se trata de
dad o audIbllIdad (capacidad de ser oído o percibido a cierta distancia) espectrogramas realizados sobre enunciados reales en los que las alte-
que presentan los dlversos elementos fónicos , y puede entenderse en raciones de los formantes vocálicos pueden variar en mayor medida.
el senhdo en que lo hemos venido haciendo hasta ahora, es decir, como Ciertamente, el trabajo de Malmberg supone el hallazgo, por vez pri-
presencIa/ausencia de voz laringea y su resonancia complementaria en mera, de un fundamento físico para la noción de sílaba, pero serán
el tracto vocal. Tanto si damos preferencia a esta última interpretación necesarios muchos más estudios y comprobaciones experimentales pa-
sobre la que parece estar realmente basada la escala de ]espersen ra que esta primera aproximación se vea definitivamente revalidada.
(plénsese que el sonido [s], caracterizado por su gran perceptibilidad,
ocupa en ella el penúltimo lugar, junto con las restantes fricativas sor- 7.1.7. De todo lo expuesto en los apartados anteriores se desprende
das), como si optamos por la primera (Ladefoged: 1975, 219-221), en- que ninguna de las formulaciones concebidas por los diferentes fonetis-
contraremos un buen número de contraejemplos entre las distintas tas ha conseguido esclarecer la naturaleza de la sílaba de forma irrefu-
estructuras silábicas de las diversas lenguas. table, según adelantábamos al principio (véase apartado 7.1.2). Como
En efecto, sílabas como spa del inglés, scha del alemán, o rty del hemos visto, cada autor ha tomado en consideración un aspecto deter-
checo, entre otras muchas mencionables de diferentes idiomas, no pre- minado del fenómeno -sea éste la abertura, la perceptibilidad, la
sentan en su mtenor el ordenamiento de sonidos que la teoría de tensión muscular o cualquier otro- sin valorar el papel desempeñado
]espersen hacia prever. A este respecto, Hála escribe: «No esperemos por los restantes, lo que conduce inevitablemente a explicaciones par-
encontrar, sm mnguna excepción y con una precisión perfecta, en ciales y a simplificaciones inexactas en mayor o menor media. Por ello,
todos los casos, una sucesión regular de los fonemas, según los princi- la definición más completa que puede darse de sílaba es la resultante
plOS enunclados ( ... ). Exigir con rigor una sucesión absolutamente re- de unificar toda la pluralidad de enfoques que se le han dado en una
gular es condenarse a complicar demasiado el problema de la sílaba» única formulación de validez general. En palabras de G. de Granda,
(Hála:.1973, 32-33). Así pues, tampoco el criterio de la perceptibilidad o «[la definición de sílaba] debe abarcar la totalidad de los caracteres
sonondad nos abre el camino definitivo hacia la comprensión de la que la constituyen como tal (aspecto psicológico de la tendencia al
sílaba. Como señalan Brosnahan y Malmberg (1970, 142), la teoría des- ritmo , fuerza motriz proporcionada por los músculos intercostales, ten-
cnbe blen un cierto modelo de sílaba «ideah>, quizá aquél al que sión articulatoria, fuerza espiratoria, presión muscular, sonoridad, per-
henden todas las lenguas, pero que es inevitablemente cuestionado por ceptibilidad y abertura vocálica) , tanto en su aspecto articulatorio como
los hechos fonéticos reales . en el auditivo» (De Granda: 1966, 40) . Diremos, entonces, con ].
Chlumsky (1935), que la sílaba es una articulación o grupo de articula-
7.1.6: Si bien es cierto que el análisis espectrográfico, especialmente a ciones de tensión fisiológica creciente al principio y decreciente al
parhr de los trabajos de Bertil Malmberg en síntesis del lenguaje, ha final, que responde a un solo impulso de energía muscular, y cuyo
proporclOnado algunos datos valiosos para el entendimiento del pro- centro, formado por uno o más sonidos, posee mayor intensidad espira-
blema de la sílaba, no puede afirmarse que los estudios realizados toria, mayor abertura, mayor perceptibilidad y mayor tensión muscular
hasta el momento en este campo lo hayan resuelto. Afirma Malmberg que el resto de los sonidos que la integran . Así pues, la sílaba es a la
(1955) que las transiciones de una vocal (véase el Capítulo 5, apartado vez una unidad de tipo articulatorio, acústico, auditivo y psicológico.
5. 7) vl~nen determinadas siempre por la consonante con la que consti-
tuye sllaba. En otras palabras, si una vocal es adyacente a una conso- 7.1.8. En la sílaba podemos diferenciar dos tipos de elementos: el
nante pero entre. ellas no existen transiciones, se interpretarán como núcleo, cima o centro silábico, y los márgenes anterior y posterior.
somdos perteneclentes a sílabas distintas. Así, si combinamos dos voca- El núcleo, cuya presencia es imprescindible para que pueda hablar-
les con una consonante oclusiva, interpuesta entre ellas , por ejemplo, se de sílaba, está integrado por uno O varios sonidos. En el primer caso
en [aka], los oyentes perciblrán [a-ka] o [ak-a] dependiendo de cuál de se denomina núcleo simple y, en el segundo, núcleo complejo o com-
120 121
puesto. En la forma verbal bailo, por ejemplo, la primera sílaba bai 7.1.9. La fijación de los limites silábicos, es decir, de los puntos exac-
tiene una cima compleja formada por el diptongo [aj] y la segunda, lo, tos en que han de situarse las fronteras entre las distintas sílabas,
una simple constituida por la vocal [o]. En español, los núcleos com- presenta algunos problemas. En lo que respecta al español -cada
puestos están constituidos por diptongos o triptongos, en los cuales, idioma se comporta en este punto de modo diferente- , podemos seña-
,"amo sabemos (véase apartado 5.5), una de las vocales es realmente lar una serie de reglas básicas, que ya enumeró Navarro Tomás (1971,
silábica y la otra u otras son semiconsonantes o semivocales. No obstan- 172-173) Y que siguen vigentes en la actualidad:
te, a veces pueden unirse en una sola sílaba dos o más vocales conti-
guas pertenecientes a palabras distintas, en el fenómeno conocido co- a) Una consonante entre dos vocales siempre forma sílaba con la
mo sinalefa, yeso permite que el número de vocales que constituyen el vocal que le sigue: a-m o; sa-Ia .
núcleo se vea aumentado. Tenemos un ejemplo en la secuencia necio b) Los grupos pr, br, tr, dr, cr, gr, pi, bI, el, gl, IJ Y fr forman sílaba
ausente, en donde cuatro vocales se asocian en una única sílaba. con la vocal que les sigue. No hay frontera, por tanto, entre la
La pronunciación del español, especialmente en el habla rápida y consonante oclusiva o fricativa y la líquida: IJar, ca-bra, a-cla-
poco esmerada, tiende a asociar en un grupo monosílabo cualquier mar, etc.
sucesión de vocales. Por ello, además de producirse sinalefas como la e) En cualquier otra combinación de dos consonantes, la primera
anterior, es frecuente que los hiatos se conviertan en diptongos, en un forma sílaba con la vocal anterior y la segunda con la vocal
claro ejemplo de sinéresis, esto es, de reducción silábica dentro de la siguiente . Si hay tres, las dos primeras forman coda y la tercera
misma palabra. Es el caso de los vocablos baúl o poeta que se pronun- ataque silábico, excepto si las dos últimas constituyen uno de
cian indistintamente con y sin hiato. Por esta razón , en ciertas ocasiones, los grupos mencionados en b), en cuyo caso se unen a la vocal
no resulta sencillo saber si dos o más vocales han de considerarse siguiente: al-ma, as-no, cons-pi-rar, pers-pi-caz, com-ple-to ...
como pertenecientes o no a la misma silaba . La etimología o la analogía d) Dos o más vocales contiguas pueden o no formar sílaba según
con otras palabras relacionadas pueden ayudar a decidir, en estos que exista diptongo o hiato , sinalefa o sinéresis, como explica-
casos, entre la interpretación de una secuencia de vocales como dip- mos anteriormente .
tongo o como hiato. Etimológicamente, es preferible, por ejemplo, Cabe añadir algunas observaciones complementarias que constitu-
hablar de hiato en palabras como veintiocho o piano; la analogía con yen , hasta cierto punto, excepciones a las normas generales.
otros términos así lo aconseja también en diario (véase día) o riada En primer lugar , hay que apuntar la tendencia de los hablantes
(véase rlo) . cultos, especialmente en la pronunciación enfática, a marcar y separar ,
Por lo que se refiere a los márgenes, el margen silábico anterior, por influencia de la etimología, los prefijos que conservan su significa-
también denominado ataque, puede ser simple o compuesto, o puede do original: sub-ra -yar, des-ar- /Í-cu-Iar, in-o-pe-ran-te, etc., lo que, en
no existir. En la sílaba ma, es simple - la consonante [m]- ; en pro, es efecto, va en contra de alguna de las reglas anteriormente apuntadas y
compuesto - las consonantes [p] y [r]- ; en el, no existe. Lo mismo e n contra del llamado principio de delimitación silábica , formulado por
sucede con respecto al margen posterior o coda silábica: en in, es Salvador Fernández Ramírez (1986,49), según el cual toda sílaba traba-
simple; en ins, es compuesto, y en ta, no existe . Una sílaba con los da supone comienzo consonántico de la silaba siguiente, siendo la
dos márgenes simples es, por ejemplo , mar; una sílaba con los dos enunciación recíproca falsa . De este principio se deduce que toda
márgenes compuestos es trans, y finalmente , una silaba sin márge- sílaba que comience con vocal implica una silaba anterior abierta . No
nes es a. es menos cierto, sin embargo , que en la pronunciación más relajada , se
Las sílabas que no presentan coda , se conocen como sílabas abier- prescinde de consideraciones etimológicas y se respetan las normas
tas o libres . Las tres silabas de cabeza son, por tanto, abiertas. En e stablecidas.
cambio, las sílabas que sí poseen el margen posterior se denominan En segundo lugar, cuando dos consonante s contiguas son iguales,
cerradas o trabadas . Las dos sílabas de saltar son, así, cerradas . Cuan- no se aplica la regla e) , sino que se pronuncian como si se tratara de
do dos sonidos pertenecen a la misma sílaba se dice que son tautosilá- una única consonante , un poco más larga de lo normal, sin que a
bicos; cuando forman parte de dos sílabas diferentes, se les llama menudo sea posible distinguir entre ellas una frontera silábica: las-
heterosilábicos. En la palabra pato , la [p] y la [a] son tautosilábicos; la semanas; diez-zapatos , etc.
[a] y la [t], heterosilábicos. En tercer y último lugar, si dos vocales contiguas son iguales y no
122 123
van acentuadas, se reducen también a una sola vocal, que en algunos 7.2. Otras agrupaciones de sonidos en la cadena
casos se alarga un poco. El fenómeno, que se produce igualmente si al
menos una de ellas lleva acento, es habitual en el habla relajada y 7.2.1. Dentro de la cadena hablada podemos diferenciar unidades ma-
conversacional. En una pronunciación esmerada y lenta, en cambio, las yores que las sílabas, porque éstas no aparecen aisladas, sino reunidas
dos vocales pueden llegar a sonar en dos sílabas distintas, como suce- en conjuntos compuestos por un número variable de ellas. El primero
de, por ejemplo, en las palabras cre-encia, acre-edores, o aza-har. de estos grupos es el que se conoce tradicionalmente con el nombre de
palabra. El concepto, sobre el que se ha escrito y se ha discutido
7,1,10. En el castellano actual, el tipo de sílaba que predomina es la mucho (en González Calvo: 1982, puede encontrarse una exposición de
formada por consonante más vocal (CV), es decir, una sflaba libre con las principales aproximaciones a la cuestión), no es especialmente rele-
ataque pero sin coda. Le siguen en frecuencia de aparición las agrupa- vante desde el punto de vista fonético, ya que en el habla no respeta-
ciones CVC, CCV y V. Pueden encontrarse fácilmente en la bibliograffa mos sus limites y, en el análisis, sólo resulta útil como punto de referen-
diversos recuentos estadísticos sobre esta cuestión (v. Navarro Tomás: cia para establecer la distribución de los diferentes segmentos fónicos.
1966; Delattre y Olsen: 1969; Guirao y Borzone: 1972; Monroy Casas: Mucho más interesante es la división inmediata superior de la cade-
1980, entre otros), por lo que no le dedicaremos aquí más espacio. Es na en grupos acentuales.
interesante, sin embargo, señalar que la estructura CV parece ser la El grupo acentual (también llamado grupo de intensidad, aunque
más corriente en gran número de lenguas, además de ser la primera esta denominación no parece recomendable por las razones que expli-
que aparece en el habla de los niños y la última que desaparece en los caremos al hablar del acento en el próximo capítulo) está constituido
procesos de pérdida de la capacidad lingüística. La sflaba abierta viene por un conjunto de sflabas, de tres a cinco por regla general, subordi-
a ser, entonces, un tipo «primitivo» de sílaba, presente, en mayor o nadas todas ellas a un mismo acento principal. Veamos un ejemplo. En
menor proporción, en todos los idiomas. la secuencia Ernesto come mucha carne al día, podemos aislar varios
El hecho concreto de que en español el grupo CV aventaje tanto a grupos acentuales: Ernésto / cóme / mucha cárne / al día. Los dos
las otras posibles combinaciones, a diferencia de lo que ocurre en otras primeros grupos abarcan una única palabra; los otros, dos cada uno.
lenguas, explica algunos fenómenos fonéticos a los que hemos aludido Las sflabas que reciben el acento principal se denominan tónicas, las
o aludiremos en próximos apartados. La aparición del elemento esvara- restantes se llaman átonas. A veces, algunas sílabas tónicas se supedi-
bático (véase Capítulo 5, apartado 5.7.5), por ejemplo, puede explicar- tan a otra que conlleva el acento dominante , por lo que puede hablarse
se a partir de esta tendencia a la sflaba CV. Del mismo modo, la de acentos secundarios frente a acento principal. La frase Yo quiero
pérdida o e l debilitamiento de consonantes en coda silábica (setiembre tenerlo se divide en dos grupos acentuales, YÓ quiéro / tenérlo , el
por septiembre), las confusiones o trueques que en esa situación se primero de los cuales presenta un acento principal en quiéro y otro
producen (arma por alma), la vocalización de ciertas consonantes a final secundario en el pronombre yó. De todos modos, el análisis de las
de sílaba (preceuto por precepto), la simplificación de grupos conso- secuencias habladas en grupos acentuales es más complejo de lo que
nánticos en coda (ispirar por inspirar), etc., todos son procesos que puede parecer a la vista de estos ejemplos. Volveremos sobre la cues-
resultan más comprensibles si tenemos en cuenta la circunstancia de tión cuando tratemos el acento.
que en español toda sflaba tiende, por principio, a realizarse como CV
(v. Malmberg: 1965). 7.2.2. Los fragmentos del discurso delimitados por dos pausas sucesi-
Anotemos, finalmente, que en castellano predominan las palabras vas se denominan grupos fónicos. El grupo fónico está dotado, pues, de
bisflabas sobre las trisflabas y monosílabas. No obstante, la tendencia un contenido significativo propio que ha de relacionarse con el sentido
se invierte cuando se trata de vocablos de nueva creación o de présta- general de la secuencia a la que pertenece. Puede abarcar uno o varios
mos de otras lenguas. En estos casos, se favorecen, como regla gene- grupos acentuales, una o varias palabras, y de una a quince sílabas
ral, las voces de tres o cuatro silabas (v. Alcina y Blecua: 1975,266-267). (aunque lo más frecuente es que conste de siete u ocho). Las pausas
que lo condicionan pueden ser grandes -si coinciden con el final de
una frase, por ejemplo--, más pequeñas o mínimas e, incluso, pueden
no llegar a realizarse convirtiéndose así en pausas virtuales. En gene-
ral, se deben a dos causas fundamentales : o bien la necesidad fisiológi-

124 125
ca de respirar que tiene el hablante, o bien razones de tipo lingüístico, presenta y cuál su manifestación acústica, para después comparar am-
como señalar el fin de un enunciado completo (pausa final absoluta), bas observaciones con las que se obtienen si lo pronunciamos en el
separar los miembros de una enumeración (pausa enumerativa), variar contexto que nos interese. El hecho de que exista coarticulación se
el significado de la emisión (pausa significativa), etc. Canellada y Kuhl- explica por la tendencia de los órganos articuladores a permanecer en
mann (1987) ofrecen el análisis de una gran cantidad de grupos fónicos una posición dada, una vez que han llegado a ella, durante un cierto
extraídos de textos literarios. Señalan , no obstante, la falta de acuerdo periodo de tiempo. Es, por así decirlo, una cuestión de inercia o de
que a menudo existe entre los estudiosos, o los hablantes en general, acomodación de unos sonidos a otros.
para fijar los limites de los grupos fónicos de un texto cualquiera. En el La nasalización vocálica, por la influencia de una nasal adyacente, o
mismo sentido se manifiestan Alcina y Blecua (1975) cuando escriben: el abocinamiento de algunas consonantes, por la de una vocal redon-
"Para las diferentes divisiones confluyen causas de tipo muy diverso: deada vecina, son buenos ejemplos de coarticulación. Estas dos modifi-
puede tratarse de elementos de tipo psicológico o emocional; otros son caciones son, además, muy habituales, en parte porque conllevan movi-
de carácter lógico; en algunas ocasiones, el hablante puede intentar mientos menos complejos y en mayor medida prolongables que los
realzar determinados elementos de significación dentro del mensaje, de la lengua, y en parte porque guardan un alto grado de indepen-
lo que suele producir un aumento de unidades; en otros momentos, dencia con respecto a otras articulaciones, esto es, los músculos que
depende del énfasis o del cuidado que se ponga en la dicción .. .» intervienen en la formación de unas y otras difícilmente coinciden
(pág. 456). (v. Kent, 1983).
El grupo fónico posee una relevancia especial en fonética por dos
razones. En primer lugar, determina algunas modificaciones articulato- 7.3.2. Existen varios fenomenos combinatorios (algunos autores los
rias y acústicas de los sonidos: cuando se habla de posición inicial denominan fonosintácticos puesto que la fonosintaxis se ocupa de estu-
absoluta o posición final absoluta, el punto de referencia es el grupo diar las modificaciones de los sonidos en la secuencia) relacionados
fónico. En segundo lugar, coincide - al menos en español- con la con el de la coarticulación. El más importante, sin duda, es la asimila-
unidad melódica , de la que hablaremos en el próximo capítulo y que, ción.
como veremos, es la unidad sobre la que se basa todo el estudio de la En la asimilación, un sonido modifica o altera alguna de sus caracte-
entonación. rísticas para identificarse con otro contiguo O próximo. Afecta tanto a
vocales como a consonantes y puede ser de varios tipos.
En primer lugar, cabe distinguir una asimilación por contacto de
7.3. La coarticulación y otros fenómenos una a distancia.
combinatorios En la asimilación por contacto, los sonidos son adyacentes, no así en
la que se produce a distancia, que, en general, es menos frecuente. Por
7.3.1. Cuando nos referimos al problema de la segmentación en el ejemplo, cuando en castellano pr.onunciamos una [s) delante de una
Capítulo 5, señalábamos que llevarla a cabo entrañaba una gran dificul- [rr), como en el caso de la [s) final y la [rr) inicial de las palabras Ríos
tad debido a la imposibilidad de establecer límites articulatorios o Rosas, la primera pierde todos sus rasgos peculiares para convertirse
acústicos claros entre los sonidos en la secuencia, Mientras pronuncia- en una [1) fricativa, según señaló Navarro Tomás (197 1, 108). Hablamos
mos la [p) de la palabra par, por ejemplo , nuestra cavidad oral ya está aquí de una asimilación por contacto completa, pero también existen
disponiéndose para producir la vocal [a) siguiente. Las transiciones de - yen mayor número-- asimilaciones por contacto parciales: una [n)
los formantes de dicha vocal , que, como también explicamos en el alveolar situada delante de una [t) se dentaliza, esto es, cambia única-
Capítulo 5, contribuyen decisivamente al reconocimiento de la conso- mente su zona de articulación. Dentro del grupo de asimilaciones por
nante , son otras muestras más de que los sonidos «se superponen» unos contacto parciales, como esta última citada, las hay regresivas. progre-
a otros en el decurso hablado. sivas, reciprocas y dobles. Veamos en qué consiste cada una de ellas.
Pues bien , en fonética , este fenómeno se denomina coarticulación. En la asimilación por contacto, parcial, regresiva, un sonido adopta
El grado de coarticulación que un sonido puede presentar al emitirse alguna de las características articulatorias del sonido que le sigue. Es lo
en la cadena se mide articulándolo primeramente por separado de que ocurría en el ejemplo anterior de la [n) dentalizada. En la asimila-
modo que se aprecie bien cuál es la configuración del tracto vocal que ción por contacto, parcial, progresiva , un~sonido adquiere alguno de

126 127
los rasgos del sonido que le precede: en castellano la dental [t] suele
hacerse interdental cuando sigue a una interdental [e]. La asimilación
por contacto, parcial, reciproca supone que dos sonidos contiguos se
transfieran recíprocamente alguna de sus propiedades: en el grupo
[p,d], la [n] se dentaliza por la influencia de la [d] y la [d] se mantiene
como oclusiva por la de la nasal. Finalmente, en la asimilación por
contacto, parcial, doble, un sonido situado entre otros dos adopta ca-
racterísticas de ambos: la [e] nasalizada de mente, por ejemplo, toma su
nasalidad de la [m] y la [n] que la flanquean.
La asimilación a distancia es, según declamas, menos habitual. En ~D
ciertas lenguas, como el turco, húngaro, mongol, finés y algunas africa-
nas, la vocal de una de las sílabas -normalmente la primera o la
acentuada- de una palabra determina total o parcialmente el timbre
Los rasgos
de las otras vocales de esa misma palabra, en lo que se conoce con el prosódicos
nombre de armonia vocálica, metatonia o umlaut. El español no es una
lengua que sistemáticamente presente armonía vocálica, pero se ha
señalado repetidas veces que el modo peculiar de formar el plural que
exhibe el andaluz oriental (v. Navarro Tomás: 1939; Alonso, Zamora y
Canellada: 1950; Salvador: 1977, entre otros), esto es, aspirando la [s] ,
abriendo la última vocal y, con ella, todas las restantes de la palabra
8.1 . El acento
en cuestión ([p::>/lE'r::>s::>h] para poderosos, por ejemplo) es una mani-
festación de este tipo de asimilación a distancia. Brosnahan y Malmberg
(1970, 134), por otra parte, citan como ejemplo de armonia consonán- 8.1 .1. En capítulos anteriores hemos hablado acerca de cómo se pro-
tica , el nombre español Pepe, formado a partir de Josepe por asimi- ducen los diversos sonidos del lenguaje , de sus atributos particulares
lación a distancia con la consonante final. y del modo en que se combinan en la cadena hablada . Nos referiremos
ahora a la naturaleza fonética de algunas propiedades que caracterizan,
7.3.3. La disimilación es el fenómeno contrario a la asimilación. En este en dicha cadena, determinados fragmentos de extensión variable (síla-
caso, un sonido tiende a diferenciarse en lo posible de otro sonido bas, morfemas, palabras, frases o párrafos). Tales propiedades se co-
adyacente o próximo . Las vocales y las consonantes sonantes (nasales y nocen con el nombre de rasgos prosódicos o suprasegmentales. Todos
líquidas) son las que más fácilmente se prestan a la disimilación. En ellos tienen en común el hecho de que deben describirse siempre
español, este proceso se produce, sobre todo, en el habla vulgar o en poniendo en relación varios elementos del enunciado estudiado, de
ciertas hablas dialectales. Así, puede escucharse medecina por medici- modo que lo que resulta interesante para el fonetista es el valor relati-
na, con disimilación de la vocal [i]; almario por armario, con disimila- vo, y no el absoluto, de los rasgos prosódicos en una parte concreta de
ción de la primera [r], etc. la emisión, con referencia a otras partes del mismo enunciado. Además,
Finalmente , un tercer fenómeno de carácter fonosintáctico es el que todos son irreductibles al análisis en segmentos, como indica el mismo
se denomina metátesis. La metátesis entraña un cambio de orden de los término de suprasegmentales.
sonidos en la cadena hablada . Si ese cambio se da entre e lementos La primera propiedad prosódica que vamos a considerar es el
contiguos , en lugar de metátesis suele hablarse de interversión. Tam- acento.
bién las consonantes sonantes, en particular las líquidas, son las que
con mayor frecuencia sufren los efectos de la metátesis o la inter- 8.1.2.El acento tiene como objeto poner de relieve una sílaba, forma-
versión : cocreta en lugar de croqueta; Grabiel por Gabriel, etc. da por uno o más sonidos, con respecto a las restantes sílabas de una
palabra o de un grupo acentual (véase apartado 7.2. 1). Este propósito
puede conseguirse utilizando tres diferentes recursos fonético, que

128 129
constituyen, por ello, la base de la distinción tradicional en tres tipos 8.1 .3. Muchas son las opiniones acerca de cuál pueda ser el índice más
de acento: importante para la percepción del acento. Es evidente que la primacía
de uno sobre otro varía en función de la lengua de que se trate en cada
a) Acento de intensidad, de sonoridad, dinámico, espiratorio o
caso si bien la modificación en la frecuencia fundamental , con la subsi-
articulatorio. Como se desprende de todas las denominaciones que guie~te alteración del tono , se perfila pocoa poco , en la mayoría de los
recibe, esta modalidad de acento se obtiene produciendo un aumento idiomas estudiados, como el factor deCISIvo para la percepcIón del
de la intensidad -de la fuerza espiratoria- en la unidad acentuada, lo
acento (v. Quilis: 1981, 320-326).
que se manifiesta acústicamente como un aumento de la amplitud de la Por lo que se refiere más concretamente al español, los puntos de
onda. vista de los especialistas han sido divergentes al respecto: El Ilustre
b) Acento tónico, musical, de altura, cromático o melódico. Se lo- fonetista Tomás Navarro Tomás defendió siempre la pnondad de la
gra introduciendo una variación (generalmente un aumento) en el tono intensidad como índice principal, en tanto que otros investigadores ,
de la unidad que lo recibe . como D. Bolinger o H. Contreras mantuvieron posturas contra nas a la
c) Acento de cantidad o cuantitativo. Supone una mayor duración de Navarro y asignaron a la frecuencia fundamental el papel preponde-
relativa de la sílaba acentuada frenta a las no acentuadas. rante (véase la polémica recogida en Bolinger: 1961. 33-48; Contreras:
Esta división, durante mucho tiempo insalvable, resulta hoy inexacta 1963, 223-237; Navarro: 1964, 231-235; Contreras: 1964, 237-239, Y las
por cuanto las investigaciones más recientes han demostrado que el últimas aportaciones a la cuestión en Quilis: 1971 , 53-72 Y Momoy Ca-
fenómeno del acento se materializa en muchas ocasiones mediante la sas: 1980, 133-140). Los resultados de los más recientes trabajos sobre
combinación de dos o tres de los parámetros indicados. Unas veces el castellano coinciden en líneas generales con los realizados sobre
prevalecerá uno de ellos; otras, en cambio, será el propio efecto de la otras lenguas, en el sentido de que apuntan a la fre~uencia d~1 tono
combinación el que nos hará sentir que la silaba está acentuada. fundamental, Y seguidamente a la duracIón, como los mdIces acustIcoS
Sucede que, según explicamos en su momento (véase apartado 2.4), más destacados de las sílabas acentuadas.
la alteración de la intensidad con que se pronuncia un sonido conlleva
una modificación concomitante, leve pero apreciable, de su tono. En 8.1 .4. De acuerdo con el tipo de sistema de acentuación que presen-
efecto, el aumento de esfuerzo muscular supone una elevación en el ten, las lenguas se dividen en lenguas de acento fijo y lenguas <:le
volumen total del aire espirado que, a su vez, ejerce mayor presión acento libre. En las primeras, el acento ocupa siempre una pOSIcIón fIJa
sobre las cuerdas vocales, tensándolas (es decir, creando lo que los en la palabra; en las segundas, admite dos o tres posiciones posibles
fisiólogos denominan tensión pasiva) y obligándolas a vibrar a mayor dentro de este mismo ámbito de la palabra. El francés, por ejemplo, es
velocidad durante más tiempo . Así pues, la tensión pasiva de las cuer- un idioma con acento fijo , puesto que el acento recae siempre sobre la
das, responsable directa de la elevación de la frecuencia fundamental última sílaba; el españolo el italiano, por el contrario, son lenguas de
y del alargamiento del sonido, es consecuencia de la energía espirato- acento libre: en castellano, puede ir acentuada la última sílaba, la pe-
ria y ello explica el entrelazamiento de los tres índice (v. Gili Gaya: núltima, la antepenúltima ... (v. Garde: 1968, 5-12).. ..
1961, 52-53). En las lenguas de acento libre, los vocablos reCIben tradICIOnal-
Por el contrario, la llamada tensión activa de las cuerdas se debe a mente diferentes denominaciones en virtud del lugar que ocupa en
la contracción de los músculos insertos en los cartilagos de la laringe y ellos el acento. Así, son palabras oxltonas o agudas las que reciben el
no depende directamente de la presión del flujo aéreo. De hecho, la acento en su última silaba (cantó, salón, por ejemplo); son paroxílonas,
tensión pasiva puede verse modificada por el aumento de la presión sin gra ves o llanas, las que lo presentan en la penúltima sílaba (cár~el,
que esto afecte a la tensión activa. Por tanto , sólo cabe hablar de acento fácil); son proparoxltonas o esdrújulas las acentuadas en la antepenullI-
tónico o musical, como modalidad acentual bien diferenciada, cuando ma sílaba (lipico, cántaro) y, finalmente, superproparoxltonas o so-
sea esta tensión activa de las cuerdas vocales la que haya actuado para breesdrújulas son las palabras -en español, por lo general compues-
modificar el tono resultante de la silaba acentuada. En los demás casos, tas- acentuadas en sílabas anteriores a la antepenúltima (repásatelo,
parece más conveniente hablar de acento en general, teniendo siem- piénsatelo).
pre presente que su manifestación es una mezcla de fenómenos físicos Todas las voces, consideradas aisladamente, poseen un acento, el
interrelacionados. llamado acento léxico en terminología de Momoy Casas. Sin embargo,

130 131
algunas de esas palabras, cuando se integran en la cadena hablada, No obstante. todas las lenguas presentan. además, otra clase de
Plerden su acento y se convierten, por ello, en elementos átonos. Por 10 cambios tonales que conllevan diferencias de significado y es a este
común, son términos con valor nexivo que se supeditan al acento prin- grupo al que nos referimos cuando hablamos de rasgos prosódicos de
clpal del grupo acentual (v. Capítulo 7, apartado 7.2.1). El criterio para tono. Cuando las variaciones de la frecuencia fundamental contienen
r~conocer una palabra átona es su incapacidad para llegar a ser el información léxica o morfológica. esto es, se dan en el ámbito de la
nucleo central de este grupo (salvo en casos de dislocación acentual palabra y poseen valor distintivo, se llaman tonos y las lenguas que
muy forzada). Como decimos, aparecen subordinadas al acento domi- presentan esta posibilidad. tonales. Cuando. por otra parte, las varia-
nante al que preceden o siguen, por 10 que se conocen como elementos ciones de frecuencia se producen en la oración y aportan, por tanto,
procllticos o encllticos respectivamente. En castellano, son palabras información sintáctica, se habla de entonación.
habitualmente inacentuadas o átonas la mayor parte de las preposicio- En los siguientes apartados explicamos con más detenimiento las
nes Y cOn)UnClOnes, el artículo determinado, los pronombres átonos y el características de estas dos propiedades prosódicas basadas en la mo-
ref1exlvo se, los adjetivos posesivos, las fórmulas de tratamiento, los dificación del tono.
pronombres relativos, etc. (v. Alcina y Blecua: 1975, 44 1-445).
8.2.2. Las lenguas tonales son muy numerosas. Se distribuyen princi-
8.1.5. Salvo algunas excepciones como pueden ser los adverbios es- palmente en tres grandes áreas lingüísticas: 1) ciertos grupos de len-
pañoles terminados en -mente, las palabras sólo poseen un acento. Sin guas amerindias; 2) la mayor parte de las lenguas africanas, y 3) casi
embargo. en ocasiones, para dar énfasis a una voz determinada se todas las lenguas de la familia chinotibetana. junto con otras muchas del
coloca un segundo acento en una de las sílabas habitualmente inacen- Sudeste asiático . Las lenguas de este último conjunto difieren de las de
tuadas de esa palabra o del grupo acentua1. Por ejemplo: No es una los dos anteriores en que usan los tonos con valor casi exclusivamente
película más, es lá película, o es su résponsabiJidad. Cuando este léxico (no morfológico ni sintáctico) y en que presentan un paradigma
procedimiento se repite en exceso confiere al discurso un ritmo espe- mucho más complejo que puede llegar a estar compuesto hasta de 10
cial que resulta un tanto afectado al oído. tonos diferentes con valor distintivo .
Puede ocurrir también que la sílaba destacada coincida con la acen- Pike (1948) dividió a las lenguas tonales en lenguas de registro tonal
tuada, es decir. que se produzca un refuerzo mayor de la intensidad en y lenguas de contorno tonal. El yoruba. por ejemplo, es una lengua
esa posición: Él hizo eso, no tú pasaría a ser ÉL hizo eso, no tú, si hablada en el suroeste de Nigeria que posee sólo tres tonos diferentes.
queremos dar relieve al primer pronombre frente al segundo. Estos tonos tienen. asimismo, la particularidad de ser discretos y esta-
Estos dos mecanismos acentuales para subrayar determinadas par- bles, identificables con puntos definidos de la gama tona1. El yoruba es,
tes de la cadena son manifestaciones del llamado acento de insistencia por ello. como la mayor parte de las lenguas africanas, una lengua de
o enfático y se utilizan en un gran número de lenguas , si bien unas registro tona1. En chino mandarín, en cambio , cada uno de los cuatro
muestran preferencia por el primer procedimiento y otras por el se- tonos distintivos existentes debe describirse en términos de movimien-
gundo. tos transitorios que se deslizan de un punto a otro de la escala de tona-
lidades. Por consiguiente, el chino mandarín, al igual que muchos idio-
mas del sur de Asia, es una lengua de contorno tona1.
8.2. Los rasgos prosódicos de tono La forma más simple de transcribir los distintos tonos es utilizado un
acento agudo para indicar el tono alto, uno grave para representar el
8.2.1. Por cuanto hasta ahora hemos explicado con respecto a la pri- bajo. y ninguno para señalar el tono medio. Este sistema resultará
mera de las propiedades prosódicas tratadas, el acento , comprobamos válido en casos como el del yoruba u otras lenguas de registro -en las
que los correlatos fisiológicos y físicos de todos estos fenómenos supra- que. si hubiera más niveles tonales, se emplearían signos adicionales,
segmentales están inextricablemente ligados. Así, veíamos que , tanto como una barra horizontal superpuesta a la vocal o la consonante de
en el tipo de acento que se conoce como tonal como en el tradicional- que se trate. por ejemplo-, pero no sirve cuando se trata de lenguas
mente denominado de intensidad, se producen variaciones en el tono de contorno. En la Fig. 8.1 se muestran algunos contrastes tonales
de la sílaba acentuada , motivadas independientemente en el primer existentes en yoruba y en chino. con las formas respectivas de repre-
caso o concomitantes con otras alteraciones físicas en el segundo. sentarlos .
132 133
Yoraba (Registro tonal)

Represen. Transcrip--
lación ción Slgmficado
Tono
número
Chino (Contorno tonal)

DescripCIón Represen·
lación Ejemplo Slgmficado
el fundamental se aprecie clara-
mente, o bien se miden las varia-
ciones experimentadas por cual-
quiera de los armónicos superio-
.....-
.
!i.~

.~ J_
",_

I [6 wá] él viene I alto


res (por lo general se elige el -..."..-
f- l m.' madre
décimo) que resultan más visi-
It- ¡
[ó wa) él miró 2 alto·ascendente 1 m.' cáilamo "-
f- [6 wa) él eXIstió 3

4
bajo-descendente
ascendente • m.' caballo
bles y que son siempre múltiplos
del fundamental y, por consi-
alto.-descendente ~ m.' rei'llr guiente, reflejan sus cambios de
frecuencia. En la Fig. 8.2, se re- Figura 8,2, Espectrograma de banda
Figura 8.1. produce un espectrograma de estrecha de «¿Ouieres comer manzanas?»
banda estrecha obtenido para (Tomado de Martlnez Ce1drán 1986.)
analizar la entonación.
Como se aprecia en la Fig. 8.1, cada uno de los símbolos usados Los distintos fonetistas que han abordado el problema de la entona-
para los tonos del chino consta de una línea de referencia situada a la ción no coinciden sobre cuál deba ser la magnitud del cambio en la
derecha, que abarca los cinco niveles establecidos en la gama tonal frecuencia para que se perciba como un cambio en la entonación. Así,
-bajo, medio-bajo, medio, medio-alto y alto- y que va precedida de algunos establecen una variación mínima de 6 Hz, en tanto que otros
otra línea indicativa del movimiento concreto del tono. Así, por ejem- sitúan el límite mínimo en 40 Hz. Parece, con todo, probado que, a este
plo, el tono 3 comienza con un descenso de la frecuencia desde un nivel respecto, es decisivo el contexto en que se produzca la modificación
medio-bajo hasta el nivel más bajo posible, para luego ascender hasta (v. Quilis: 1981, 359).
el nivel medio-alto; mientras que el tono número 1 se conforma por una Las modificaciones de la frecuencia fundamental no son el único
frecuencia alta que no varía. índice en el reconocimiento de la entonación, sino que en él inter-
La diferenciación entre lenguas tonales y lenguas con entonación vienen otros factores, tales como la duración y la intensidad. Tras la
no es absoluta. Muchas lenguas tonales no entonativas presentan alte- medición de todos estos parámetros y antes de extraer ninguna conse-
raciones del tono condicionadas por factores sintácticos y capaces de cuencia, hay que tener en cuenta, sin embargo, cuál sea la línea de
modificar el significado de las oraciones, y, del mismo modo, algunas modulación -el nivel de entonación- propio de cada individuo, deter-
lenguas no tonales y entonativas poseen palabras dotadas de tonos minado por el equilibrio entre los músculos tensores y distensores de
propios.
sus órganos del habla.
8,2.3, La entonación es la línea o curva melódica con que se pronuncia 8.2.4. La unidad melódica, es decir, la parte mínima del enunciado
un enunciado. De todas las propiedades suprasegmentales es, sin du- dotada de una forma entonativa determinada y de un significado dife-
da, la más compleja (tanto sustancial como formal y funCionalmente) y, renciado, constituye la unidad de análisis de la entonación.
en relación con las demás, es también la menos estudiada en la mayor En español, la unidad melódica coincide con el grupo fónico, del
parte de las lenguas (v. Meier, 1984). A continuación trataremos de que ya hablamos en su momento (e!. § 7.2). Como ya dijimos entonces,
explicar en qué consiste esta complejidad sustancial y formal a que los grupos fónicos o unidades melódicas están separados generalmente
nos refenmos. El aspecto funcional o distintivo de la entonación queda, por pausas, su extensión es variable y depende en gran manera del
como es lógICo, fuera del ámbito de este trabajo. idioma de que se trate en cada caso. Así, en castellano los grupos
El índice acústico de mayor relevancia para la percepción de la suelen ser más largos que en francés , pero más breves que en italiano
entonación es el concerniente a las variaciones de frecuencia del funda- y ello confiere ritmos distintos a cada una de estas tres lenguas.
mental, dependientes, como sabemos, de la vibración de las cuerdas No existen reglas explícitas que nos marquen por dónde hemos de
vocales. Estas alteraciones se pueden observar y medir en un sonogra- efectuar la separación entre una unidad y otra, si bien algunas divisio-
ma de banda estrecha (véase apartado 3.2.6) con relativa facilidad. Para nes quedan automáticamente descartadas por antinaturales o absurdas.
ello se procede a ampliar la gama inferior de frecuencias de modo que Por ejemplo, en Una vez terminado el trabajo hubo de ser enmendado,
134
135
son posibles dos análisis alternativos: uno separaría los grupos fónicos: dencia (.L) es una terminación descendente , menos grave que la caden-
Una vez terminado / el trabajo hubo de ser enmendado, y otro dividiria:
cia -según se desprende de su misma denominación- que se emplea
Una vez terminado el trabajo / hubo de ser enmendado. En ningún en la afirmación insegura . La semianticadencia (T) es un final ascenden-
caso, sin embargo, sería aceptable el análisis Una vez terminado el te, en menor grado que la anticadencia, que señala contrastes secunda-
trabajo hubo / de ser enmendado. rios y se corresponde con unidades de carácter continuativo. Final-
Los investigadores no se han puesto hasta el momento de acuerdo mente , la suspensión (-+), con idéntico nivel tonal que el cuerpo del
sobre el tratamiento que cabe dar a estar unidades, una vez estableci- grupo, se presenta en las unidades de sentido incompleto .
das. Algunos consideran que cada una de ellas está integrada por un La unidad «El muchacho jugaba con la pelota en el parque)) podría
cuepo melódico no susceptible de mayores divisiones y por un final en dividirse , según lo expuesto anteriormente, en
el que se localiza toda la información y la capacidad distintiva de la
entonación . Otros, en cambio, piensan que a lo largo de cualquier El muchacho jugaba con la pelota en el parque!
contorno entonativo pueden marcarse puntos relevantes de carácter ~~-----~-----~~-
tonal coincidentes con ascensos o descensos determinados. Así pues, rama inicial cuerpo rama final
para el primer grupo de especialistas, lo realmente importante es la
configuración general de la curva melódica , en tanto que para el se- en tanto que ¿Tú no sabes nada> se analizará en
gundo grupo son significativos los distintos niveles tonales que puedan
localizarse en ella. Finalmente, un tercer sector de fonetistas se inclina Tú no sabes nada i
por un punto de vista ecléctico que concede validez a ambos aspectos ,~

-configuración y niveles- como facetas complementarias en el estu- cuerpo rama final


dio general de la entonación.
Las características generales de la unidad melódica varían, como es
8.2.5. De acuerdo con Navarro Tomás (1944), la unidad melódica pue- lógico, de una lengua a otra, no sólo, como ya dijimos , en lo que se
de dividirse en tres partes: refiere a su tamaño, sino también en lo que respecta a los patrones
l. La rama inicial, formada por todas las sílabas hasta el primer entonativos que predominan en los distintos idiomas. En general, pue-
acento fuerte. En español, todas ellas se pronuncian con tono más grave de afirmarse, por ejemplo , que el grupo melódico francés es más
que el que presenta la primera sílaba acentuada . breve que el español y tiende a la elevación; la unidad melódica del
2. El cuerpo de la unidad, constituido por la sílaba fuerte inicial inglés es , por el contrario, más larga y presenta a menudo una direc-
más todas las otras sílabas hasta la sílaba anterior al último acento fuerte ción descendente .
(incluida). A lo largo del cuerpo entonativo , el tono apenas experimen-
ta modificaciones importantes, de modo que se mantiene la altura tonal
alcanzada en la primera sílaba acentuada.
3. La rama final, integrada por la última sílaba fuerte y las siguien-
tes sílabas, si las hubiera. Ésta es la parte normalmente más breve y
más significativa de la unidad melódica. En todas las lenguas presenta
formas diferentes en función de la naturaleza sintáctica de la unidad en
que se halle. En castellano, concretamente, se distinguen cinco tipos de
inflexión final: cadencia , anticadencia , semicadencia , semianticadencia
y suspensión.
La unidad El muchacho jugaba con la pelota en el parque podría
enunciativa. La anticadencia (i) es una terminación alta que caracteriza
a las oraciones inacabadas y marca el contraste máximo con la caden-
cia. Aparece con frecuencia en las oraciones interrogativas. La semica-

136 131
®o
Aplicaciones
de la fonética

9.1. La enseñanza de segundas lenguas

9.1.1. Desgraciadamente, aún en la actualidad el aspecto fonético es el


más descuidado de todos los que implica la enseñanza de una lengua
extranjera a hablantes no nativos. En principio, se suele prestar más
atención a la adquisición por parte del alumno del vocabulario y de las
estructuras morfosintácticas características de la lengua en cuestión,
entendiendo que la buena o mala pronunciación es un factor secunda-
rio y de difícil tratamiento.
Es evidente , sin embargo , que con buenos materiales técnicos de
apoyo (grabaciones , vídeos , etc.), con un cierto conocimiento de los
conceptos fonéticos básicos y con una considerable dosis de paciencia
se pueden obtener resultados brillantes, equiparables en ocasiones a
los alcanzados tras la estancia prolongada del alumno entre hablantes
nativos . La fonética tiene, por tanto , una primera aplicación dentro del
campo de la llamada «lingüística aplicada» .

9.1.2. El estudiante de una lengua extranjera debe , ante todo , apren-


der a dominar una nueva base articulatoria. Con este término se conoce
el conjuntos de hábitos articulatorios que caracterizan una lengua dada .
No se tratará, pues , de empezar a pronunciar algunos sonidos nuevos
que la lengua materna no posee , sino de ser capaz de apreciar y
reproducir las diferencias generales que existen entre los distintos
idiomas en cuanto a la tensión de los articuladores, energía articulato-

139
ria, utilización de los labios, etc. Malmberg (1976, 82 y ss.) enumera con juicios subjetivos, y a menudo fiables, emitidos por otra u otras perso-
detenimiento algunos de los rasgos que oponen las bases articulatorias nas familiarizadas con la forma de hablar del individuo en cuestión .
del inglés, del francés y del español, concluyendo que las de las dos Hasta muy recientemente este procedimiento de identificación auditiva
primeras lenguas son completamente opuestas, en tanto que el español no se ha visto completado y, en su caso, revalidado por estudios o
ocupa una situación intermedia. Así, mientras que en francés, por ejem- experimentos en laboratorio. Después de la Segunda Guerra Mundial,
plo, abundan las articulaciones anteriores, las labiales y las nasalizadas, sin embargo, con el desarrollo y la mejora de medios técnicos como el
en inglés --€n particular, en inglés británico-- no son frecuentes ningu- espectrógrafo, la grabadora y los ordenadores, han surgido nuevos
no de estos tres tipos articulatorios. El español comparte algunas pro- mecanismos de identificación al tiempo que se ha abierto un nuevo
piedades con cada uno de los dos idiomas anteriores. campo de estudio y se ha acrecentado el interés y el número de los
Una vez que el alumno llega a adquirir una nueva base articulatoria especialistas que a él se acercan. En la actualidad, los juicios emitidos
(que, no lo olvidemos, incluye también nuevos hábitos entonativos y por estos expertos son ya admitidos como pruebas en los procesos
acentuales), el segundo paso consistirá en el conocimiento del sistema legales celebrados en muchos países (v. Tasi: 1979).
fonológico de la segunda lengua. En otras palabras, no es suficiente con
saber distinguir entre dos sonidos diferentes, sino que se hace preciso 9.2.2. El método de identificación de la voz consiste en la comparación
conocer el valor que ellos poseen en el idioma estudiado. Para un auditiva y visual de una o más voces conocidas con una voz desconoci-
hispanohablante, por ejemplo, no resulta difícil la distinción entre una da. Para la evaluación de tipo auditivo , se escuchan las grabaciones de
[d) oclusiva y una [ó) fricativa, puesto que ambos sonidos se dan en todas las voces y se intenta determinar las diferencias y similitudes
castellano (pensemos en las palabras ('daóo) o [sordaóo), entre otras existentes entre ellas; la evaluación visual, en cambio, se realiza cote-
muchísimas mencionables). Lo que sí le ocasionará algunos problemas jando los patrones acústicos de los distintos hablantes, extraídos de
será el valor funcional de que están dotadas estas dos realizaciones, espectrogramas.
por ejemplo en inglés, que las convierte en dos fonemas distintos con El examinador de sonogramas sólo debe comparar las realizaciones
capacidad para diferenciar significados. Por todo ello, un buen profe- espectrográficas de elementos fonéticos iguales o similares y ha de fijar
sor de idiomas debe tener un amplísimo conocimiento de la fonética y su atención, en particular, sobre los siguientes índices o rasgos: fre-
de la fonología de su propia lengua y de la lengua extranjera que cuencia media de los formantes vocálicos, ancho de banda de los for-
enseñe. mantes, silencios, estrías verticales, duración , contorno e intensidad de
los formantes, energía inter-formántica y transiciones entre sonidos .
9.1.3. Destaquemos, por último, el papel importante que los sistemas Las características espectrales especialmente peculiares localizadas en
de transcripción fonética han desempeñado en la enseñanza de segun- sonogramas de voces presuntamente diferentes constituyen claves im-
das lenguas. Está repetidamente comprobado que las personas que portantísimas para su identificación o equiparación. Por ejemplo, es
dominan uno de estos sistemas cuentan con enormes ventajas cuando poco probable que dos personas distintas produzcan un aumento de
se enfrentan a la pronunciación de un idioma ajeno al suyo. Cada energía igual en la misma situación dentro de una palabra . (Para una
símbolo se asocia, en efecto, con unas propiedades acústicas y articula- exposición más detallada , puede verse el Informe de The National
torias conocidas de antemano y que la ortografía al uso no puede de Research Council, On /he Theory and Pracuce of Voice Identification ,
ningún modo sugerir. Igualmente, el dominio de la técnica descriptiva publicado en los Estados Unidos en 1979).
basada en las Vocales Cardinales (véase Capítulo 5) constituye una Como paso previo a este minucioso análisis , el experto tiene que
ayuda insustituible para la adquisición de sistemas vocálicos nuevos, no realizar una grabación muy cuidadosa de las voces objeto de estudio y
importa cuán diferentes puedan ser del que posea la lengua materna. transcribir fonéticamente el texto en cuestión.

9.2.3. La idea que subyace en todos los procedimientos de identifica-


9.2. El reconocimiento de la voz y la
ción, sean éstos subjetivos --€s decir, basados en juicios emitidos por
Identificación del hablante oyentes- u objetivos --€sto es , llevados a cabo con medios electróni-
9.2.1. Durante toda la historia de la humanidad, el método para la cos o mecánicos- es la de que las diferencias que existen entre el
identificación de una persona a partir de su voz ha estado basado en los habla de distintos hablantes (o diferencias inter-habIantes) son siempre

140 141
mayores que las que se encuentran en las sucesivas emisiones de un segmentales contribuirá en gran medida a la aclaración del diagnósti-
mismo hablante (diferencias intra-hablantes) . En consecuencia, los in- co.
vestigadores en este campo se han esforzado en intentar descubrir el La mayoría de los sordos congénitos, por otra parte, tienen gran
conjunto de parámetros acústicos que conlleven en cualquier ocasión la dificultad en aprenden a hablar, lo que motiva el apelativo de «sordo-
menor variabilidad intra-hablante y la mayor variabilidad inter-hablan- mudos» que habitualmente reciben. Para ayudarles a superar este pro-
te posible y que aparezcan tanto en el habla normal como en el habla blema se han experimentado diversos métodos. Ya explicamos en su
deformada o imitada. momento (véase Capítulo 3) que el espectrógrafo de sonido fue creado
Son muchos los experimentos realizados en este sentido, pero, sin y desarrollado con esta finalidad . Se pensaba que sería posible entre-
embargo, hasta el momento no se ha llegado a conclusiones definitivas. nar al paciente de modo que fuera capaz de comparar los sonogramas
Ello es explicable si consideramos que en el proceso de identificación de sus propias emisiones - naturalmente defectuosas- con los de las
es preciso tomar en cuenta un alto número de variables (las introduci- del profesor , y así se dispondría de un mecanismo de autocontrol, si no
das por los propios hablantes, las que dependen de los examinadores auditivo, al menos visual. Como dijimos, enseguida se comprobó que
o de las máquinas empleadas, etc.), lo que, como es obvio, complica interpretar los espectrogramas no era tarea fácil y que las expectativas
extraordinariamente toda la cuestión. En todo caso, y dada la actualidad iniciales no se veían confirmadas en la práctica diaria.
y el interés suscitado por estas investigaciones, son esperables avances Con posterioridad se han realizado muchas investigaciones sobre el
rápidos y decisivos a corto y medio plazo . habla de los niños sordos congénitos. De todas ellas se deduce que este
tipo de pacientes manifiesta una clara tendencia a desarrollar un siste-
ma fonético diferente del que posee el oyente normal. Las vocales, por
9.3. la patología del habla ejemplo, suelen ser centralizadas y poco diferenciadas entre sí. lo que
también influye en la inteligibilidad de las consonantes, en cuanto que ,
9,3.1, Los diferentes tipos de conducta lingüística anormal suelen como vimos (véase Capítulo 5) , éstas se perciben dependiendo en gran
agruparse en dos grandes apartados con las denominaciones generales medida de sus transiciones con las vocales adyacentes.
de trastornos de la recepción y trastornos de la producción, si bien es Los estudios sobre la cuestión prosiguen. Sin duda, el conocimiento
cierto que unos y otros están, en numerosas ocasiones, claramente profundo de las características fonéticas del habla de los sordos es el
interrelacionados. En el diagnóstico y tratamiento de muchos de ellos la estadio previo para lograr avances en el proceso de su curación.
labor del fonetista y del fonólogo es determinante, de forma que, para
cualquier equipo clínico dedicado a la terapia del habla, su colabora- 9.3.3. Los sindromes afásicos constituyen un objeto de investigación
ción o su asesoramiento resultan insustituibles. En los siguientes aparta- especialmente adecuado para aplicar en él las técnicas de la fonética o
dos enumeraremos algunas de las dificultades lingüísticas para cuyo la fonología.
tratamiento es especialmente útil la aplicación de los hallazgos teóricos La afasia, en todas sus múltiples variantes, es, en efecto, un trastorno
o metodológicos de la fonética o de la fonología. de la comunicación provocado por una lesión cerebral, que conlleva el
deterioro en la comprensión y el empleo del lenguaje , además de otras
9,3,2. El más importante trastorno de la recepción se conoce con el deficiencias en memoria , razonamiento lógico, etc. Puede afectar prin-
nombre de sordera. Como es sabido, la sordera puede ser congénita, cipalmente a la recepción del habla o a la producción. En el primer
es decir, presente en el nacimiento, o adquirida, esto es, resultado de caso, se conoce como afasia receptiva y, en el segundo, como afasia
una enfermedad o trauma acaecido durante la infancia o la vida adulta expresiva . Esta última es interesante desde el punto de vista fonético
(v. Crystal: 1983, 173 Y ss.) . puesto que suele caracterizarse por el uso indebido de la entonación y
Es difícil averiguar si un niño está afectado por sordera congénita o de las pausas, además de por una fuerte tendencia a sustituir o traspo-
no . De los estudios realizados hasta el momento parece desprenderse ner los sonidos.
que en el balbuceo de los niños sordos de alrededor de un año se Relacionada con la afasia expresiva, la apraxia articulatoria o dis-
pueden apreciar notables diferencias con respecto al de los niños con praxia afecta a la capacidad del enfermo para controlar la posición de
capacidad auditiva intacta, en particular por lo que se refiere a la los músculos para hablar y la secuencia de movimientos que éstos
entonación. Por consiguiente, el análisis fonético de los rasgos supra- deben efectuar. La diferencia con la afasia radica en que en esta última

142 143
el sistema fonológico se ha visto afectado, porque el paciente no em- por ejemplo, el fonema Ibl siempre como [p], está en realidad confun-
plea determinados fonemas o confunde las reglas que gobiernan su diendo fonemas, y el problema es más grave, puesto que afecta al
aparición, mientras que en la dispraxia el sistema fonológico queda significado de las palabras. Aquí la labor del fonólogo o del fonetista es
intacto y falla el control que el enfermo debe deter sobre él. Con todo, fundamental: no se podrá recomendar ni iniciar terapia alguna hasta no
a menudo resulta difícil distinguir claramente ambos síndromes. haber establecido con claridad qué constrastes fonológicos ha perdido
el paciente, cuál es la distribución del error o errores cometidos, si son
9.3.4. Los trastornos de la producción que más conciernen al fonetista sistemáticos o no, etc. Este es, por tanto, el apartado en el que el
y al fonó logo son los referidos a la fonación, a la resonancia o a la patólogo del habla más necesita del fonetista o del fonólogo .
articulación. Los primeros surgen cuando por alguna razón el funciona-
miento de la laringe no es normal y, en lugar de los sonidos esperados,
se producen distorsiones de muy diverso tipo. Los trastornos de la
resonancia se deben a interferencias creadas en las distintas cavidades
resonadoras, que dan lugar a alteraciones del timbre de los sonidos .
Finalmente , los trastornos de la articulación son todos aquellos que
entrañan una mala pronunciación de algunos o de todos los sonidos que
constituyen la cadena hablada .
Entre los efectos que puede ocasionar un mal funcionamiento de la
laringe podemos destacar la afonJa o disfonJa, consistente en la emisión
de un susurro sin vibración de las cuerdas, o bien en la emisión de una
voz ronca debida con frecuencia a un crecimiento anómalo del tejido
de las cuerdas vocales. Otra situación distinta es la generada por el
empleo de alguna fuente de fonación diferente de la laringe. Como es
sabido, cuando las cuerdas vocales se ven afectadas por una neoplasia
maligna (carcinoma de laringe) se hace preciso, en muchas ocasiones,
proceder a la extirpación de la laringe, esto es, a una laringotomía. Los
enfermos que la sufren pierden las cuerdas vocales y con ellas la
posibilidad de emitir voz normal, por lo que deben acostumbrarse a
utilizar otros medios para expresarse. Normalmente en estos casos se
puede optar por emplear una laringe artificial o vibrador especial que
supla a las cuerdas, o por usar la parte superior del esófago en la que
se produce la vibración del esfínter que lo cierra.
Los principales trastornos de la resonancia, por otra parte, son los
relacionados con el aumento o la disminución de la nasalidad como
cualidad característica de la voz. Así , se distinguen voces hipernasales
de voces hiponasales , motivados ambos tipos por el estado en que se
encuentre la cavidad nasal.
Finalmente , los trastornos de articulación puede ser de carácter
fonético o de carácter fonológico . Es muy frecuente , por ejemplo, escu-
char pronunciaciones defectuosas del sonido [r] o del sonido [s] . Sin
embargo, lo más probable es que los hablantes a los que se los hemos
oido no confundan nunca estas dos consonantes con ninguna otra del
sistema fonológico . Se trata, por consiguiente, de un trastorno pura-
mente fonético . Si, por el contrario, la persona estudiada pronuncia,

144 145
Closario
A continuación presentamos una breve explicación de algunos términos
técnicos utilizados en este libro. No se trata, pues, de definiciones en el más
estricto sentido de la palabra, sino de aclaraciones de conceptos que pueden
ser útiles a los lectores no familiarizados con ellos .

.Am.plitud: En la distancia existente desde el punto de reposo al punto de


máximo alejamiento de una partícula en vibración. Se corresponde, por
tanto, con el aumento o el descenso máximos de la presión aérea durante el
ciclo vibratorio de un determinado sonido.
AIrlcado: Sonido consonántico compuesto por una fase inicial oclusiva y una
fase final fricativa, ambas homorgánicas, esto es, producidas en la misma
zona de articulación.
bcho de banda: Es la gama de frecuencias a las que responde con efectivi-
dad un resonador o un filtro, es decir, el margen de frecuencias dentro del
cual cada componente presenta una amplitud equivalente al menos al 70.7
por 100 de la que presenta el componente con mayor amplitud.
Aproxim.aDte: Sonido pronunciado con una constricción del canal oral menor
que la que se produce en los sonidos fricativos, pero mayor que la que se
da en las vocales. Los sonidos aproximan tes no producen ruido de fricción .
Armónico: También denominado hipertono, un armónico es una frecuencia
componente de la onda sonora compleja que es múltiplo de la frecuencia
fundamental. Así, si una onda tiene una frecuencia fundamental de 200 Hz,
los componentes de 200 y 600 Hz se conocen como segundo y tercer armóni-
cos .
.Articulación: Conjunto de movimientos realizados por los órganos articula-
dores para interrumpir o modificar la salida de la corriente de aire al
exterior durante la emisión de cada sonido. También suele denominarse
articulación la posición adoptada conjuntamente por los órganos en el mo-
mento de la producción del sonido.

149
Articulador: Cada órgano o parte del canal vocal que desempeña un papel Frecuencia: Número de ciclos realizados en la unidad de tiempo, convencio-
específico en la producción de un sonido. Los articuladores pueden ser nalmente el segundo. La frecuencia se mide en Hertzios o ciclos por segun-
activos, como la lengua, o pasivos, como el paladar. do.
Aspirado: Sonido consonántico ---generalmente oclusivo sordo- a cuya arti-
Frecuencia fundamental: Es la frecuencia de repetición de la onda compleja
culación sucede un breve escape de aire que retrasa el comienzo de la y el máximo común divisor de todas sus frecuencias componentes.
subsiguiente vibración de las cuerdas vocales.
Filtro acústico: Resonador con capacidad selectiva respecto a las frecuen-
Cardinal (vocal): Vocal teórica establecida como punto de referencia para la
cias, empleado para transmitir o pasar un sonido.
articulación y descripción de cualquier eventual realización vocálica. El
sistema de vocales cardinales se compone de dos series, las cardinales Fonación: Proceso de producción de una onda sonora mediante la acción de
primarias y las cardinales secundarias, con posiciones de la lengua iguales una fuente de sonido. Esta fuente puede ser glotal, como en el caso de los
y disposición opuesta de los labios. sonidos sonoros, o de ruido, como sucede en los sordos.
Ciclo: Vibración completa de una partícula, integrada por las fases de com- Glotis : Espacio existente entre las cuerdas vocales, a través del cual pasa la
presión y rarefacción . Así. un ciclo es la porción de la onda sonora que se corriente de aire procedente de los pulmones,
extiende desde cualquier punto hasta el siguiente punto en el que la presión Ingresivo: Sonido producido con un fluj o de aire proveniente del exterior
aérea comience a sufrir idénticos cambios. del tracto oral.
CHe: Consonante ingresiva en la que existe una doble oclusión: en el velo del Intensidad: Potencia acústica transmitida a través de una onda, medida en
paladar y en la zona anterior de la boca. El enrarecimiento del aire acumula- una superficie de un centímetro cuadrado perpendicular a la dirección de
do en la cavidad asi formada se consigue haciendo descender el cuerpo de propagación de dicha onda. La intensidad es proporcional al cuadrado de la
la lengua, lo que provoca, al deshacerse la oclusión situada en la parte amplitud de l a onda.
anterior del tracto, la succión del aire exterior.
Inyectivo: Sonido consonántico ingresivo en el que existe una doble oclu-
Compresión: Fase del ciclo vibratorio de la onda sonora durante la que se
sión: en la glotis y en la boca. El enrarecimiento del volumen de aire
produce el aumento de la presión aérea ,
contenido en la cavidad as! formada se logra mediante el descenso de la
Egresivo: Cualquier sonido producido con el flujo de aire que, procedente laringe y el aumento del tamaño de la cavidad, con la consiguiente entrada
de los pulmones, se dirige al exterior. de aire del exterior.
Elongación: Separación de la partíCUla vibrante con respecto a su posición Lateral: Sonido consonántico cuyo canal vocal se forma a los lados de la
de reposo en un momento dado. La elongación máxima es la amplitud . lengua, que constituye una obstrucción central a la salida del aire.
Envolvente: También denominada curva de resonancia , la envolvente indica Liquida: Término utilizado para designar a los sonidos laterales y vibrantes.
cuáles son las amplitudes relativas de las vibraciones que e?Cperimentaría Nasal: Consonante articulada con el paso a la cavidad nasal abierto -merced
un cuerpo en respuesta a distintas frecuencias incidentes. al descenso de la úvula- y una oclusión en alguna zona de la cavidad oral.
Espectro del sonido: Diagrama que muestra las amplitudes relativas de las El aire, por tanto, sale al exterior a través de las fosas nasales.
diferentes frecuencias componentes de un sonido. Los espectros pueden Nasalizado u oronasa1: Sonido en el que el flujo de aire sale al exterior
ser de linea o continuos, dependiendo del tipo de onda -periódica o libremente a través de la cavidad oral y de la cavidad nasal (a la que puede
aperiódica respectivamente- que representen.
acceder por hallarse la úvula bajada).
Eyectivo: Sonido consonántico producido con el aire almacenado en la cavi- Oclusivo: Sonido consonántico en cuya articulación se establece un contacto
dad formada por una oclusión glotal y otra oclusión en la cavidad oraL El completo entre los articuladores activo y pasivo, que de esta forma cierran
aire sale al exterior al verse constreñido por la elevación de la laringe y momentáneamente el canal vocal. Una vez deshecha esta oclusión, el aire se
deshacerse, al tiempo, la oclusión oral.
precipita al exterior con una breve explosión.
Fase: Situación del ciclo de vibración en un momento dado.
Oncla aperiódica: Onda en la que no se repite el mismo perfil de un ciclo a lo
Formante: Zona de la escala de frecuencias en la que un sonido presenta una largo del tiempo. En las ondas aperiódicas existen componentes de todas
mayor concentración de energía. También puede definirse como cada una las frecuen cias.
de las resonancias del conducto vocal.
Onda compleja: Onda resultante de la adición de un número determinado de
Fricativo: Sonido consonántico en cuya producción los articuladores se apro- onda. SImple• .
ximan y dan lugar a un estrechamiento del canal oral que genera una Oada pel16dJca: Onda que repite el perfil de un ciclo a intervalos regulares
fricción audible.
de tiempo
150
151
Onda sonora: Propagación de una pertubación a través de un medio material
como es el aire, en forma de una serie de compresiones y rarefacciones
alternas que afectan a cada una de las partículas componentes de ese me-
dio.
Onda slDusoidal o slDusoide: Movimiento oscilatorio sumamente simple que
se corresponde con tonos puros.
Rarefacción: Fase del ciclo vibratorio durante la cual se produce un descen-
so en la presión aérea.
ResoDaDda: Fenómeno por el cual un cuerpo, denominado resonador y que
posee una tendencia natural a vibrar a determinada frecuencia , experimen-
tará vibraciones de mayor amplitud cuando es puesto en movimiento por
Referencias
otro cuerpo vibrante a una frecuencia similar. bibliográficas
RetroOejo: Sonido para cuya articulación el ápice de la lengua se eleva y se
vuelve hacia e l paladar.
Ruido: En fonética acústica, se conoce como ruido la sensación perceptiva Abercrombie, D. (1967): Elements of General Phonetics, Edinburgh University
originada por ondas sonoras complejas apriódicas. Press, Edimburgo.
Sonoro: Sonido que presenta vibración de las cuerdas vocales. Abercrombie, D. (1985): "Daniel Jone's Teaching» , Phonetics Linguistics. Essays
in honor of Peter Ladefoged, Academic Press, Nueva York, págs. 15-25.
Sordo: Sonido producido sin vibración de las cuerdas vocales.
Alarcos, E. (1964): Fono/ogla española, Gredas , Madrid.
Timbre: Cualidad acústica propia de cada sonido y dependiente de la confi- Albright, R. W. (1958): The International Ph onetic Alphabet. Its Backgrounds
guración general de su espectro. and Deve/opment, Waverly Press, Baltimore.
Tono: Impresión auditiva de la frecuencia fundamental de una onda sonora. Alcaraz, E., y Bryn Moody (1984): Fonética inglesa para españoles, B. Moody,
Tono lmugeo: Vibración producida en la g lotis mediante la abertura y cierre Alicante.
sucesivos y continuados de las cuerdas vocales. Alcina, J. , y Blecua, J. M. (1975): Gramática española, Arie!, Barcelona.
Alonso, D.; Zamora Vicente, A., y Canellada, M. J. (1950): "Vocales andaluzas.
Tracto vocal: Conjunto formado por las cavidades infraglóticas, glótica y Contribución al estudio de la fonología peninsulan), Nueva Revista de FiJo/o-
supraglóticas. gla Hispánica , IV, págs. 209-230.
Vib:nmte: Articulación producida mediante la vibración de un órgano activo Bolinger, D. (1961): «Acento melódico, acento de intensidad)), Bolean de FiJoJo-
elástico (la lengua, por ejemplo), que obstruye y abre el paso al flujo de aire gla de la Universidad de Chile, XlIl, págs . 33-48.
rápidamente . Borzone de Manrique , A. M. (1980): Manual de fonética acústica, Hachette ,
Buenos Aires.
Brosnaham, L. F .. Y Malmberg B. (1970): Introduction to Phonetics, Cambridge
University Press, Londres.
Canellada, M.' J., Y Kuhlmann, J. (1987): Pronunciación del español, Castalia,
Madrid.
Catlord , J. C. (1977): Fundamental Problems in Phonetics, Edinburgh University
Press, Edimburgo.
Cornmitee on Evaluation of Sound Spectrograms Assembly o( Behavioral and
Social 5ciences, (1979): On /he Theory and Practice of Voice Identifícation,
National Acaderny of Sciences, Washington.
Contreras, H. (1963): "Sobre el acento en españob), Bo/etln de Filologla de la
Universidad de Chile , XV, págs. 223-237.
Contreras, H. (1964): «¿Tiene el español un acento de intensidad?»), BoleUn de
Fllologlo de 18 Umversidad de Chile, XVI, págs. 237-239.
Crystal , DaVId (1983): Pato/ogla del lenguaje, Cátedra, Madrid.

153
152
ChlurnskY. J. (1935): «Analyse du Traité de Phonétique de M. Grammonh>. Malmberg, B. (1965): Estudios de fonética hispánica, CSIC, Madrid.
Archive Néerlandais de Phonétique Expérimentale. XI. págs. 73-106. Malmberg, B. (ed.) (1968): Manual of Phonetics, North-Holland, Amsterdam.
Delattre, P. (1964): «Change as a correlate of the vowel consonant distinctioll»), Malmberg, B. (1971): Les domaines de la phonétique, Presses Universitaires de
Studia Linguistica. XVIII. págs. 12-25. France, París.
Delattre, P. (1967): «Acoustic ar articulatory invariance?», Glossa, J, págs. 3-25. Malmberg, B. (1976): La fonética, EUDEBA, Buenos Aires.
Delattre. P. y 0lsen. C. (1969): «Syllabic Features and Phonic Impression in Martinet. A. (1971): «Saber por qué y para quién se transcribe», La lingülstica
English. German. French and Spanish». Lingua. XXII. págs. 160-175. sincrónica. Gredos, Madrid, págs. 161-166.
Denes. P. y Pinson. E. (1963): The Speech Chain. The Physics and Biology of Martínez Celdrán, E. (1 984a): «¿Hasta qué punto es importante la sonoridad en
Spoken Language. Waverly Press. Baltimore. la discriminación auditiva de las obstruyentes del castellano?», Estudios de
Fant. G. (1960): Acoustic Theory of Speech Production. Mouton. La Haya. Fonética Experimental. I. págs. 243-291.
Fant. G. (1973): Speech Sounds and Features. MlT Press . Cambridge. Mass. Martínez Celdrán. E. (1984b): «Cantidad e intensidad en los sonidos obstruyen-
Fernández Ramírez. S. (1986): Gramática española. 11. Los sonidos, Arco/Libros. tes del castellano: Hacia una caracterización acústica de los sonidos aproxi-
Madrid. mantes», Estudios de Fonética Experimental, 1, págs. 73-129.
Fischer-Nrgensen, E. (1985): «Sorne basic vowel features, their articulatory Martínez Celdrán. E. (1986): Fonética, Teide. Barcelona.
correlates, and their explanatory power in phonology», Phonetics Linguis- Matras, j. j . (1986): El sonido, Orbis. Barcelona.
tieso Essays in honor al Peter Ladefoged, Academic Press, Nueva York. Meier. Rolf (1984): Bibliographie zur lntonation, Max Niemeyer, Tubinga.
Fry, D. B. (ed.) (1976): Acoustic Phonetics, Cambridge University Press, Lon- Monroy Casas, R. (1980): Aspectos fonéticos de las vocales españolas, SGEL,
dres. Madrid .
Fry, D. B. (1979): The Physics of Speech, Cambridge University Press, Londres. Navarro Tomás, T. (1939): «Desdoblamiento de fonemas vocálicos», Revista de
Garde, P. (1972): El acento. EUDEBA. Buenos Aires. Filologla Hispánica. n.
págs. 165-167.
Gili Gaya, S. (1961): Elementos de fonética general. Gredos. Madrid. Navarro Tomás, T. (1964): «La medida de la intensidad», Boletln de Filologla de
González Calvo, J. M. (1982): «Consideraciones sobre la palabra como unidad la Universidad de Chile, XVI, págs. 231-235.
lingüística». Revista Española de Lingülstica, 12, 2, págs. 375-410. Navarro Tomás. T. (1966): Estudios de fonologla española, Las Américas, Nueva
Grarnmont, M. (1965): Traité de phonétique, L. Delagrave, París. York.
De Granda, G. (1966): La estructura silábica, CSIC, Madrid. Navarro Tomás. T. (1971): Manual de pronunciación española, CSIC, Madrid.
Guirao, M., y Borzone de Mamique, A. M. (1972): «Fonemas. silabas y palabras Navarro Tomás, T . (1974): Manual de entonación española, Guadarrama, Ma-
del español de Buenos Aires». Filologla. XVI. págs. 135-165. drid.
Hala. B. (1973): La s11aba. CSIC. Madrid. Nolan, F. (1982): The Phonetic Bases ofSpeaker Recognition, Cambridge Univer-
Hardcastle, W. (1985): «Instrumental articulatory phonetics», Linguistic Abs- sity Press, Londres.
tracts. 1.3. págs. 111 -123. O·Connor. j. D. (1973): Phonetics, Penguin Books, Londres.
jakobson, R.; Fant, G .. y Halle, M. (1951): Preliminaries to Speech Analysis, MlT Pike. K. L. (1943): Phonetics, Ann Arbor, Michigan.
Press. Cambridge, Mass . Pike. K. L. (1948): Tone Languages, Ann Arbor, Michigan.
jespersen. O. (1954): A modern English Grammar. 1. Sounds and Spe11ings, PuIlurn, G. K., Y Ladusaw, W. A. (1986): Phonetic Symbol Guide. The University
Ejnar Munksgaard, Copenhague. of Chicago Press, Chicago.
Kent, R. D. (1983): «The segmental organization of speech», en P. MacNeilage Quilis, A. (1971): «Caracterización fonética del acento en español», Travaux de
(ed.). 1983, págs. 57-89. Linguistique et Littérature, IX. págs. 53-72.
Ladefoged. P. (1962): Elements of Acoustic Phonetics. The University ofChicago Quilis, A. (1981): Fonética acústica de la lengua española. Gredos. Madrid.
Press, Chicago. Quilis. A. (1983): Lengua española, 1, UNED, Madrid.
Ladefoged, P. (1971): Preliminaries to Linguistic Phonetics. The University of Quilis. A. (1984): Bibliografla de fonética y fonologla españolas, CSIC, Ma-
Chicago Press, Chicago. drid.
Ladefoged, P. (1975): A Course in Phonetics, Harcourt. Brace and jovanovich. Quilis. A.; Esgueva. M.; Gutiérrez. M. L .. Y Cantarero, M. (1979): «Cacracterísti-
Nueva York. cas acústicas de las consonantes laterales españolas», Lingüfstica Española
Lass. R. (1976): English Phonology and Phonological Theory. Cambridge Uni- Actual. 1-2. págs. 233-343.
versity Press, Londres. Salvador, G. (1977): «Unidades fonol6gicas vocálicas en el andaluz orientah>.
MacNeilage. P. (ed.) (1983): The Production of Speech, Springer. Nueva York. Revista Española de Lingülstica, 7, págs. 1-23.
Malmberg. B. (1955): «The phonetic basis for syllable divisionl> . Studia Linguisti- De Saussure , F. (1971): Curso de lingülstica general. Losada. Buenos Aires.
ca, 9, págs. 80-87. Straka, G. (1963): «La division des sons du langage en voyelles et consonnes

154 155
peut-elle etre justifiée?», Travaux de Linguistique el Littéralure, 1, págs. 17-
74.
Thomas, J. M. C.; Bouquiaux, L., y Cloaree-Heiss, F. (1986): Iniciación a la
fonética, Gredos, Madrid. LINGüíSTICA
Torreblanca, M. (1976): «La aplicación de la fonología transformacional a la
lengua española: la Spanish Phonology de J. Harris)), Revista de Filología
Española, LVIII, págs. 133-200. Director
Tosi, O. (1979): Voice Identification. Theory and Legal Applications, University Francisco Marcos Marín
Park Press, Baltimore.

1. Introducción a la lingüíst ica: historia y modelos


Marcos Marí'l, Francisco

2. Lógica y lingüística
Garrido Medina, Joaquín

3. Los sonidos del lenguaje


Gil Femández, Juana

4. Fundamentos de sintaxis general


Moreno Cabrera, Juan Carlos

5. Fundamentos de morfología
Vareta Ortega, So/edad

6. Fonética experime ntal: teoría y práctica


MartÍnez Ce/lIrán, Eugenio

7. Teoría si ntáctica: de las estructuras a la rección


Demonte Barrero, Violeta
8. Fundamentos críticos de la gramática de dependencias
Báez San José, Va/erio
9. Análisis Contrastivo. Análisis de Errores e Interlcngua
Santos Gargallo, Isabel
10. Las estructuras gramaticales desde el punto de vista histórico
Rillruejo Alonso, Emilio
11. Las ca tego rías gramaticales
Bosque Mwioz, 19,wcio
12. La semiología
Bobes Naves, M." Carmen
13. Sociolingtiística
Rotaetxe Amusateg/li, Karmele

156

También podría gustarte