Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. INTRODUCCIN
La percepcin del habla se puede definir como el proceso en virtud del cual un
patrn de variacin de energa acstica , que incide en los rganos receptores de
la audicin, se transforma en una representacin mental de la configuracin estimular
(los fonemas o sonidos) que produce esa variacin de energa. Desde el punto de vista
fsico, el habla se define como una onda sonora con propiedades acsticas
(frecuencia y amplitud) y temporales (duracin). Estas propiedades de la onda sonora
psicologia.isipedia.com 1
son producto de cambios o variaciones en la presin que se difunden en el espacio. La
tarea de nuestro sistema perceptivo es extraer de estas variaciones unas
constancias perceptivas que, en el caso del habla, corresponden a las unidades
lingsticas que llamamos fonemas .
Las claves acsticas presentes en la seal de habla deben estar temporalmente
ordenadas. La tarea de percibir habla podra definirse, a primera vista, como la
sucesiva transformacin, de uno en uno, de segmentos de la onda sonora del habla en
fonemas individuales. Se tratara por tanto de una tarea de reconocimiento de
patrones. Pero esto no es as.
La percepcin del habla es una actividad bastante compleja. Para entender la
percepcin del habla es necesario examinar antes las propiedades fsicas de los
sonidos del habla. Mediante el procedimiento conocido como espectografa de
sonidos es posible obtener una representacin visual del habla o espectrograma ,
que recoge la composicin de frecuencias de la voz en unidades de tiempo.
Algunas secuencias de sonidos de habla se descomponen en unas bandas de
frecuencia expresada en hercios (Hz), denominadas formantes , que se numeran a
partir de los valores ms bajos de frecuencia. Cada formante consta de dos partes:
una parte curva o transicin del formante en la que el valor de la frecuencia va
modificndose progresivamente y una parte recta o parte estable del formante.
La percepcin no es un proceso de traduccin directa de propiedades
o claves acsticas a representaciones fonmicas, es decir, cada fonema de la lengua
no corresponde siempre al mismo conjunto de unidades acsticas. Esta falta de
correspondencia acstico-fonmica se manifiesta en dos problemas distintos . Uno
es el problema de la segmentacin , relacionado con que la seal del habla es
continua, mientras que los sonidos del habla se perciben como discretos o
discontinuos. Al separar de manera artificial el fragmento del espectro que
corresponde a la consonante de una slaba del que corresponde a la vocal de la misma
slaba y al presentar nicamente la parte de la consonante, los oyentes eran capaces
de adivinar qu vocal segua a dicha consonante: cada fragmento de habla retiene
informacin acstica del fragmento contiguo, es decir, las claves acsticas transmiten
informacin en paralelo sobre segmentos fonmicos sucesivos.
El otro es el problema de la ausencia de invarianza , que se define como
la falta de correspondencia biunvoca entre fragmentos de la seal acstica y fonemas
discretos. Los segmentos de habla carecen en su mayora de propiedades invariantes,
ya que a causa de la naturaleza continua del estmulo de habla, se ven influidos por el
contexto acstico en que se encuentran. Pese a ello, los oyentes somos capaces de
descubrir constancias perceptivas y con ello identificar eficazmente sonidos de habla.
P. ej, nuestro sistema perceptivo identifica el mismo fonema (/n/) an cuando ste se
encuentre en contextos acsticos sustancialmente diferentes como sucede en las
palabras co(n)trario, co(n)ato, o co(n)vocatoria
Los problemas de segmentacin y de ausencia de invarianza tienen un mismo
origen: las demandas co-articulatorias del habla. Cuando pronunciamos una
secuencia de fonemas, no articulamos cada fonema por separado, sino que ajustamos
la posicin de nuestros rganos articulatorios (lengua, labios) a las configuraciones
psicologia.isipedia.com 2
que stos han de adoptar para producir los fonemas inmediatamente anterior y
posterior. As, al articular el fonema /n/, la posicin de la lengua es ms extendida y
plana en co/n/trario, algo ms retrada y en contacto con los alvolos en co(n)ato,
y se halla en reposo en co/n/vocatoria.
En suma, los movimientos articulatorios efectuados en fonemas sucesivos se
solapan en el tiempo, lo que origina diferencias acsticas en un mismo fonema en
funcin del contexto acstico-articulatorio en que ste se localiza. Estas demandas co-
articulatorias son tambin responsables de que el habla humana se emita a
considerable velocidad, hasta el punto de que la tasa normal de emisin de fonemas
por unidad de tiempo (que oscila entre 10 y 15 fonemas por segundo, y que puede
alcanzar de 25 a 30), superara el poder de resolucin del odo humano si cada
fonema estuviese realmente asociado a un conjunto de claves discretas y especficas.
psicologia.isipedia.com 3
duracin (memoria ecoica). De ste anlisis se obtienen unas claves acsticas o
propiedades que se combinan para dar lugar a los fonemas. Las claves acsticas que
nos permiten identificar propiedades fonticas son en su mayora dependientes del
contexto acstico. Pero algunas claves s parecen estar relacionadas con rasgos
fonticos especficos.
psicologia.isipedia.com 4
del problema de la ausencia de invarianza hasta un nivel superior de procesamiento,
es decir, hasta los procesos de acceso al lxico.
Como han observado Pisoni y Luce, si se elimina el nivel fontico tampoco
habr razones para postular un nivel fonolgico de procesamiento, dado que en tal
caso careceramos de la representacin de entrada a este nivel. Es preciso recordar
que las representaciones fonmicas no estn presentes en la seal de habla,
sino que son suministradas por el propio perceptor a partir de informacin de que
dispone en su memoria. As, aunque los procesos de transformacin acstico-fontica
estn dirigidos inicialmente por propiedades de la seal, es decir, que sean procesos
de abajo-arriba, tambin dependen del uso de informacin superior, es decir,
transmitida de arriba-abajo.
Existen pruebas comnmente aducidas a favor de la existencia de procesos de
transformacin acstico fontica donde cabe resaltar la investigacin sobre la
percepcin categorial de segmentos fnicos y sobre los mecanismos de deteccin de
rasgos.
psicologia.isipedia.com 5
lnea base de respuesta se proceda a presentar otro estmulo, que poda caer dentro
o fuera de la categora fonmica del estmulo previo. Los resultados mostraron que
los bebs slo respondan a modificaciones introducidas en el TEV cuando estas
modificaciones suponan un cambio de categora fonmica. La interpretacin de estos
resultados, dado que a tan corta edad los bebs apenas han podido disponer de la
experiencia lingstica suficiente para fijar el valor crtico de discriminacin de
fonemas, es que esta habilidad debe considerarse innata , es decir, el valor de
TEV necesario para discriminar entre consonantes sonoras y sordas se halla
genticamente programado.
En otros estudios se ha comprobado que los bebs muestran una sensibilidad
muy temprana no slo hacia los estmulos del habla, sino tambin hacia los que
corresponden a la lengua que se habla en su comunidad. Estos datos constituyen un
apoyo indudable a las hiptesis innatistas del desarrollo del lenguaje, aunque dejan
abierta la posibilidad de un influjo precoz de la experiencia prenatal .
psicologia.isipedia.com 6
3.5. Especificidad de la percepcin categorial
psicologia.isipedia.com 7
informacin de la seal (anlisis ) y por otro, procesos de generacin "interna de
sonidos a partir de claves acsticas analizadas y del conocimiento de las propiedades
articulatorias de los sonidos del habla (sntesis).
Esto permite explicar cmo se resuelven problemas tan complejos como el de la
variabilidad de la seal fsica del habla y el del procesamiento de propiedades globales
del habla pertenecientes a niveles superiores de representacin. La variabilidad se
resuelve por medio de la integracin de claves acsticas con representaciones
articulatorias, una integracin que no se produce estrictamente de abajo-arriba, sino
de forma interactiva, acoplando conjuntos de claves acsticas a representaciones
fonmicas discretas.
El mecanismo de anlisis por sntesis permite tambin incorporar a los procesos
de percepcin del habla propiedades ms globales o de orden superior de las
emisiones lingsticas como la estructura suprasegmental (acento y entonacin) y
mtrica (silabificacin) dado que estas propiedades pueden influir sobre los procesos
de integracin acstico-fontica.
Las pruebas empricas ms destacables a favor de la teora motora son de tres
tipos. Primero, hay evidencia de que los juicios perceptivos de los oyentes
varan sustancialmente en funcin de informacin previa sobre las
caractersticas de la voz del hablante . El sistema perceptivo ajusta sus
parmetros a las caractersticas acsticas de la fuente de emisin, modelando los
gestos articulatorios de dicha fuente.
Una segunda prueba a favor es el fenmeno denominado percepcin
duplex. Como ya se indic, las transiciones de los formantes o variaciones en las
bandas de frecuencia de los sonidos sirven para discriminar entre categoras fonticas
diferentes. Liberman dise un experimento en el que aisl de forma artificial el 3
formante del espectrograma de una slaba, separndolo del resto de la configuracin
espectral, presentando cada parte por separado a cada odo (presentacin dictica).
Los oyentes informaban de 2 perceptos diferenciados.
As pues, una nica clave acstica (la transicin del formante) daba lugar a 2
perceptos independientes y simultneos: cuando la clave acstica aislada era
integrada por otras claves acsticas, se formaba un percepto unitario (la slaba /da/o
/ga/); cuando no lo era, se perciba como un estimulo de no habla. Liberman lo
interpret como un mecanismo de filtrado de la seal acstica, que inspecciona la
seal para extraer de ella propiedades que puedan ser integradas en la estructura
fontica. Cuando la transicin del formante es percibida en el modo de habla, es
aprovechada para identificar fonemas; cuando no lo es, es objeto de un anlisis
acstico en el sistema auditivo general.
La tercera prueba a favor de la teora motora procede de estudios sobre
integracin de informacin visual y auditiva en la percepcin de sonidos de habla. Si la
teora es correcta, cualquier informacin sobre las propiedades articulatorias
del habla que pueda ser empleada en la identificacin de sonidos ser
utilizada por los oyentes y, por tanto, influir en los juicios y respuestas
perceptivas de los sujetos. Cuando a bebs de pocos meses se les presentan
estmulos de habla (vocales) emparejados con imgenes de un hablante efectuando
psicologia.isipedia.com 8
los gestos articulatorios correspondientes, los bebs muestran un mayor inters por la
estimulacin visual cuando sta coincide con el estmulo percibido auditivamente.
Esto sugiere que los bebs poseen un conocimiento tcito de la relacin entre las
consecuencias auditivas y visuales de la articulacin de fonemas.
Otra prueba concluyente en este sentido es el efecto McGurk. Hallaron que
cuando a un sujeto perceptor se le presentan estmulos auditivos y visuales
contradictorios en cuanto a sus consecuencias fonticas, los sujetos adoptan de forma
inconsciente una solucin de compromiso entre ambas fuentes de estimulacin. P. ej,
si el estmulo auditivo es una consonante con un punto de articulacin anterior (la
consonante bilabial /ba/), y el estmulo visual muestra a un hablante articulando una
consonante posterior (ejemplo, consonante velar /ga/), el percepto resultante es una
consonante dental /da/, cuyo punto de articulacin se encuentra a medio camino entre
los de las consonantes percibidas por cada modalidad sesorial. As, se origina un
percepto que no es ni puramente visual ni auditivo, sino fontico-articulatorio.
psicologia.isipedia.com 9
difonos) y comparando estas representaciones con las que tiene almacenadas en la
memoria (plantillas espectrales).
La caracterstica fundamental de las plantillas y de los difonos es que contienen
informacin sensible al contexto acstico en el que se producen, esto es, que son
dependientes del contexto. Sin embargo, estas representaciones no corresponden
a unidades fonmicas discretas, sino que del nivel acstico se accede directamente al
nivel lxico. Por ello, al modelo de KLATT de reconocimiento de palabras, basado en
un acoplamiento macroestructural, se le conoce como acceso al lxico a partir de
espectros .
psicologia.isipedia.com 10
sustituye estmulos de habla errneos (serveza) por las formas correctas
(cerveza). Este efecto se registra consistentemente con la tarea de seguimiento,
en la que el oyente recibe un mensaje verbal por va auditiva y tiene que repetirlo en
voz alta de forma simultnea a su recepcin, y a la mayor brevedad posible.
3. Fenmeno de escucha selectiva: cuando se somete a un oyente a una
tarea de escucha dictica instruyndole a que efecte un seguimiento de uno de los
canales, se registran una serie de efectos originados por el material presentado por el
canal no atendido. En determinadas circunstancias, el mensaje no atendido puede
provocar interferencias en la tarea de seguimiento cuando comparte ciertas
caractersticas con el mensaje atendido. Estos hallazgos ponen de relieve que la
informacin lingstica de orden superior se halla disponible desde las primeras etapas
del reconocimiento y puede influir sobre los procesos de percepcin del habla
continua.
Los procesos de reconocimiento del habla estn abiertos a influencias de
niveles superiores de procesamiento, es decir, que la informacin suprasegmental
(prosdica y mtrica), lxica, sintctica y semntica impone restricciones sobre los
procesos de percepcin del habla continua, y que estas restricciones operan de forma
automtica e inconsciente. No obstante, no se puede concluir que la percepcin del
habla continua sea un proceso completamente distinto de la percepcin de sonidos
aislados. Ms bien se debe subrayar que la percepcin del habla es un proceso sujeto
a dos tipos de determinantes: restricciones impuestas por las propiedades fsicas de la
seal y restricciones impuestas por las representaciones lingsticas que se recuperan
en niveles superiores de procesamiento.
Ambas clases de informacin convergen e interactan en algn punto. Lo difcil
es establecer a partir de qu momento del procesamiento de la seal comienzan a
ejercer sus efectos los procesos de identificacin de unidades lingsticas de carcter
superior (ej. palabras y oraciones). Los procesos de reconocimiento de palabras
podran ser un terreno adecuado para ello.
psicologia.isipedia.com 11