Está en la página 1de 9

Tema 3: Procesamiento oral de Palabras

PERCEPCIÓN DEL HABLA

Fonética acústica

El sonido es cualquier fenómeno que involucre la propagación en forma de ondas elásticas generalmente a través de
un fluido (u otro medio elástico) que está generando e movimiento vibratorio de un cuerpo.

Propiedades del sonido

- Frecuencia: representa en nº de veces que la onda se desplaza una distancia igual a su longitud de onda en
un segundo. La unidad utilizada es el Herzio. Los fonemas se diferencian por la frecuencia. La frecuencia es el
rasgo que codifica la mayor cantidad de información lingüística

- Ondas complejas (C,E es el resultado de la superposición de un conjunto de


ondas simples (A.B,D). La transformación de Fouier permite obtener el conjunto
de ondas simples que componen una onda compleja. Se distinguen las ondas
periódicas (que tienen un patrón de repetición) y las aperiódicas. En el lenguaje
existen ambos tipos:
o Las periódicas se corresponden con sonidos vocálicos y consonantes
sonoras
o Las aperiódicas se corresponden con sonidos sordos

- Longitud de onda (λ): es la distancia mínima recorrida en el espacio hasta que la


función de onda se repite. Se corresponde con la distancia entre dos crestas o
dos valles consecutivos.

- Amplitud de onda (A): es la variación máxima del desplazamiento de la onda


respecto a la línea de reposo. Está relacionada con la intensidad percibida del
sonido. Se mide en decibelios (dB) [0 dB= umbral de audición, 140 dB= umbral del dolor, 40-60 dB:
conversación normal]

- Periodo (T): es el tiempo en el que la onda se mueve una distancia igual a una longitud de onda (λ).

El espectrograma de un sonido (sonograma) es una representación gráfica de dicho sonido que muestra los diferentes
armónicos (frecuencias) que lo componen y su variación a lo largo del tiempo. Una voz en un varón tendrá más energía
en la parte baja es decir en los sonidos graves y la de una mujer en la zona alta que es la correspondencia con los
sonidos más agudos. Cada conjunto de armónicos que quedan realzados recibe el nombre de formante. Los formantes
constituyen bandas de frecuencia que define cada sonido. Para denominar cada uno de los formantes se utiliza un nº
del 0 en adelante contando desde las frecuencias más bajas. Con la información de los tres primeros formantes (f1, f2,
f3) se puede reconocer la información lingüística de un enunciado.

La frecuencia fundamental es el componente de frecuencia más bajo de la voz de un individuo (f0) se denomina
frecuencia fundamental de su voz. Esta frecuencia es un rasgo característico de la voz que permite la identificación
personal del emisor.

- Varones: 70-170 Hz
- Mujeres: 130-270 Hz

La entonación prosódica de una frase se realiza aumentando y disminuyendo la frecuencia fundamental.Además, uega
un papel en la organización de los procesos perceptivos en situaciones en las que hay varios emisores simultáneos
(cocktail-party).Si eliminamos o distorsionamos la FF de una expresión puede entenderse pero no es posible identificar
al emisor.

La articulación del sonido comienza con una vibración en las cuerdas vocales. La vibración de las cuerdas vocales es
como si tocaras las 6 cuerdas de la guitarra y la articulación se encarga de que unos sonidos se anulen y otros no.
La disposición de la cavidad bucal y la del resto de órganos articulatorios refuerza ciertas frecuencias y debilita o anula
otras. El sonido resultante es una onda compleja compuesta por un gran número de ondas simples.

Características del sistema encargado de la percepción del habla

Rapidez: es el nº de sonidos individuales que pueden discriminarse en una unidad de tiempo (resolución acústica) es
muy limitada en el ser humano: 7-9 por segundo. En el habla se perciben de 20-30 segmentos fonéticos diferenciados
en un segundo. Esta característica le confiere al habla el rango de mejor sistema de codificación de información
acústica. (ejemplo de la fibra óptica).

Robustez: nuestra capacidad de identificar los sonidos del habla es asombrosamente robusta. Podemos mantener
conversaciones en las condiciones de ruido más adversas; es posible someter la onda a increíbles alteraciones y
mutilaciones y aun así continuar entendiendo el mensaje. La capacidad humana para identificar correctamente
segmentos fonéticos en condiciones adversas es asombrosa. Podemos identificar un mensaje en condiciones de
mutilación, ruido, interferencias, etc. (Fenómeno «fiesta de cóctel»).

Compleja: no disponemos de mecanismo que puedan simular realmente la percepción humana del habla. Los sistemas
actuales se basan en una gran capacidad de cálculo, que suele tener problemas cuando hay varios interlocutores.

Automática: la mayor parte de los procesos perceptivos del habla son inconscientes y automáticos, no requieren
esfuerzo y no consume recursos atencionales.

Diferente: la percepción acústica general es distinta a la percepción del habla, presenta más resolución temporal y
discriminación e identificación.

Ausencia de invarianza: la percepción del lenguaje oral o del habla puede definirse como un proceso complejo por el
que una señal acústica continua y altamente variable activa representaciones mentales directas y estables de los
fonemas de una lengua. Nuestra voz y nuestra forma de pronunciar pueden cambiar asombrosamente de unas
situaciones a otras, tanto involuntaria como deliberadamente. A esto se añade el hecho de que la señal es muy
dependiente del contexto fonético: un mismo fonema puede tener ondas muy distintas por la influencia de los fonemas
anteriores y posteriores, aunque no seamos conscientes. Por lo que hay muchísimas formas de decir la “a”, ya sea en
voces agudas, graves, infantiles, masculinas, pero todas ellas tienen algo en común, ya que somos capaces de
reconocerlas por encima de esas variaciones.

Esquema general de la percepción del habla

Los mecanismos perceptivos nos permiten con la


experiencia pasada, mejorar o simplemente conocer la
futura.

En un inicio los ordenadores se crearon con el objetivo de


conseguir que las máquinas se comunicaran. La teoría
general de la percepción nos sirve para conocer como se
convierten los sonidos del habla en fonemas, pero hay
invariantes perceptivos. Por lo que hay letras que se
parecen más entre sí que la misma letra en 2 palabras
diferentes.

Las transacciones formánticas, la consonante se percibe a partir de la variación en la transición del formante, entra
“ba”, “da” y “ga” se encuentra en el segundo formante. No existe un rango común en la transición que pueda hacerse
corresponder con la percepción de la consonante “d”. La diferencia entre vocales se debe a

El problema de la ausencia invarianza, o ausencia de constancia, este problema existe por la coarticulación, que es la
razón por la que existe una ausencia de invarianza en señal acústica. La información acústica que corresponde a cada
uno de los segmentos fonéticos se distribuye superpuesta a lo largo de la señal. Esto se debe a una propiedad del
sistema articulatorio que debe ejecutar esos movimientos de tal forma que en la ejecución de un determinado gesto
articulatorio debe prepararse la ejecución del anterior, de forma que cada ejecución se ve afectada por los fonemas
anterior y posterior.
La coarticulación, es la influencia mutua entre sonidos, ya que los órganos de la producción del habla se mueven de
un modo continuo, pasando gradualmente de la posición propia a la siguiente. Este fenómeno se da un solapamiento
de los acontecimientos motores necesario para producir una secuencia de sonidos. Esto tiene como consecuencia que
a veces no se llegue a alcanzar el objetivo articulatorio (target) deseado.

¿Cómo se convierten los sonidos del habla en fonemas?, aun no sabemos la respuesta, y habrá que elaborar una teoría
especial. La percepción de los fonemas es totalmente diferente a como percibimos la información visual u oro tipo de
información.

La percepción categorial es la percepción de categorías, pero lo que percibimos son objetos y la categorización es
posterior. Un arbusto es una categoría intermedia se encuentra entre un árbol y hierba, y podríamos crear otra
categoría entre árbol y arbusto que sería “arbolusto”. El espacio perceptivo es continuo y somos nosotros lo que
establecemos categorías con respecto a nuestras referencias y nuestras necesidades cognitivas. (ejemplo de los tipos
de naranjas, quien conoce el campo a lo mejor conoces todos los tipos de naranjas pero si eres de unidad a lo mejor
solo conoces las de zumo y las “normales”).

En el lenguaje, también se puede categorizar mediante la percepción auditiva, mediante sonidos parecidos. No somos
capaces de percibir una categoría intermedia entre BAD y BAT, es posible hacerlo pero no percibiremos el intermedio
y por lo que no podremos incluir nuevas categorías y por ello percibimos objetos y no categorías.

La zona azul es la zona de confusión donde no se discrimina lo


que se ha escuchado, y entonces eligen una de los dos sonidos
al azar. En la zona amarilla, ese cambio no se percibe cuando
se encuentra en los extremos, cuando en realidad no es el
mismo sonido. El cambio del 8 al 9 si que se percibe ese cambio,
por lo que no es un problema perceptivo.

En la tarea de identificación se presenta un único estímulo y se


pide al sujeto que lo identifica. Contrariamente a lo que suele
ocurrir en la percepción, con los sonidos del lenguaje es más
sencilla la identificación que la discriminación. Para saber como
realmente una persona escucha y no sabe expresarlo o simplemente no escucha.

Hay 2 tipos de tareas de discriminación:

- AX: igual/diferente (A primer sonido X segundo sonido) hay que elegir si es A o si es diferente al primer sonido
- ABX: se muestran 2 sonidos A y B, y hay que identificar si el tercer sonidos es igual a A o a B.

Efecto imán

Se trata de una consecuencia del fenómeno de percepción categorial. Afecta a nuestra percepción de fonemas de
lenguas diferentes de la materna: cuando un contraste entre dos fonemas parecidos no existe en nuestra lengua
materna no somos capaces de diferenciar entre ellos. Cada idioma tiene sus propias categorías perceptivas auditivas,
como por ejemplo nosotros en español no tenemos las categorías de los diferentes sonidos de las vocales del francés.
Es como lo que le ocurre a los japoneses que no son capaces de percibir las diferencias entre cala y cara, y lo perciben
todo como “cala”, ya que ese fonema no está en sus categorías perceptivas auditivas, ya que estas están establecidas
según cada idioma.

Teoría motora de la percepción del habla (TMPH)

La ausencia de invarianza es acústica pero no articulatoria: existen invariantes articulatorios que permiten identificar
de forma fiable todos los fonemas. Un invariante perceptivo sería decir “PEZ” sin juntar los labios, y este es igual que
“VEZ”, aunque haya otras diferencias.

Esta teoría dice que el verdadero input al sistema de reconocimiento son los gestos articulatorios. La inferencia de los
gestos articulatorios apuntan a la “acústica de tubos”, por la cual las resonancias (refuerzo de ciertas frecuencias y
debilitamiento de otras) puede informar de las características de la forma del “tubo” (cavidad vocal9 por el que ha
transitado. Con un input visual has inferido en un programa motor, es decir, un conjunto de movimientos coordinados.
Es como la situación de la bailarina que hace un movimiento complejo y tu eres capaz de reproducir unos movimientos
parecidos que nunca habías hecho. Este modelo dice eso mismo, que conocemos todos lo procesos que hace nuestro
aparato fonador, lengua y labios entre otros, simplemente con observar a otra persona producir ese sonido. Por lo que
no se basa en el sonido sino en como se produce ese sonido.

Si conociésemos y pudiéramos ver todo lo que hace el sistema articulatorio (gestos articulatorios) cuando
pronunciamos y producimos sonidos, no habría problema con el modelo general. Esto implica la existencia de un
mecanismo especializado en el reconocimiento fonético:

- Percepción dúplex: este experimento es dúplex y consiste en una escucha dicótica, porque los sonidos de cada
oído son diferentes. Nos presentan 2 sílabas que se parecen mucho “ra” (r simple) y “la”, la conciencia fonatoria
es la que nos ayuda a conocer como producir un sonido. En el oído A se presenta la parte común de las
“ra”/”la” y en el oído B “chirp”(sonido débil perceptible y que es parecido al ruido de sintonizar una radio) la
zona en la que se diferencia. El evento presentado el en oído B se presenta 2 veces. Esto es solo posible si
existen 2 sistemas perceptivos independientes.

En la integración perceptiva auditiva es el conjunto de la


audición de un oído y otro.
Que el mismo sonido aparezca 2 veces está en contra de
la teoría de la percepción (que dice que solo hay un
sistema acústico) ya que cuando integras ese sonido no
puede procesarla otra vez por el otro.
Esta se explica porque se dice que una oreja es lingüística
y otra es la general, y por ello se escucha el sonido 2 veces,
en la primer integrada y en la segunda es general.

- Efecto McGurk, explica que la producción auditiva se produce una


conversión e lo acústico a lo articulatorio. Va más allá porque hay
2 sistemas de procesamiento auditivo, hay uno que compartimos
con el resto de mamíferos que nos permite conocer el origen de
cada sonido GENERAL, el segundo sistema de procesamiento se
activaría a partir de ciertos códigos que nos permite tener lenguaje,
nos permite percibir las categorías fonológicas.
Por un oído se presenta el sonido “BA” y mientras en el vídeo ves
como alguien está pronunciando “GA”, en el primer caso la
articulación es externa y en el segundo es interna. Lo que ocurre en
esta situación es que percibe un sonido que en ningún momento ha
aparecido, que se encuentra entre ambos sonidos.
Ya que el sonido presentado auditivamente es oclusiva sonora bilabial
y la del vídeo es oclusiva sonora velar y el punto medio de ambas es oclusiva sonora alveolar el sonido “DA”.
El sistema cuando tiene información visual (articulatoria), utiliza esa información en sus percepciones.
(Ejemplo del prueba con los ojos cerrados o sin volumen)
BODEGA
PETAKA

Otras teorías

- Teoría realista directa: Propuesta por Fowler 1980, es una alternativa a la TMPH, comparte con esta teoría
que el input al sistema es articulatorio pero no acústico. Porque no cree que hay un mecanismo especializado,
tampoco está de acuerdo en el acceso directo a los mecanismo de producción por lo que no se basa en la
imitación. Acepta la postura Gibsoniana: la estructura está en el estímulo, el objeto distal está codificado en
la estructura del estímulo proximal. La información articulatoria procede directamente del objeto emisor del
sonido, no necesita un procesamiento especial.
- Teoría Auditiva General: se han encontrado efectos de percepción categórica en animales (Kuhl y Miler, 1975,
1978). Propone que la percepción del habla se realiza por los mismos mecanismos generales de la percepción
acústica. No es preciso proponer mecanismos especiales para la percepción de objetos que pertenecen a una
misma categoría aunque carecen de invariantes perceptivos (i.e. Wittgenstein, 1921).
El oyente puede utilizar un conjunto múltiple de rasgos o pistas para mantener la constancia perceptiva. Por
ejemplo la palabra juego no tiene una característica discriminatoria. Los pájaros pueden ser entrenados a
responder a sílabas que comienzan por el fonema /d/ y discriminarlos de los que comienzan por /g/ o /b/
que son los pares mínimos (Kluender, Diehl y Killeen, 1987). La hipótesis de la potenciación auditiva propone
que los sonidos de cada lengua han evolucionado para resultar fácilmente discriminables por el sistema
auditivo humano.
Para someter a un animal a una percepción categórica, se haría mediante un condicionamiento y viendo si
responde correctamente.

Efectos del contexto (Restauración de fonemas)

La tarea que propone Warren sobre los procesamientos de restauración, consiste en escuchar frases completas en las
que una palabra (i.e.: «legislatura») ha sido modificada de forma que un sonido (ej.: /s/) ha sido reemplazado por un
«buzz» o un «click». Los participantes perciben la palabra completa, algunos ignoran el sonido no lingüístico, el efecto
se mantiene en la repetición y tras informar a los sujetos de la manipulación. Por el contrario el efecto no se produce
con pseudopalabras («gelistalura»), y no se produce con silencios: es preciso un input al sistema. Por lo que están
implicados los procesos bottom-up y top-down.

El contexto influye en el reconocimiento de palabras esto influye más auditivamente que visualmente. Según Samuel
(1990) los efectos intraléxicos son preceptivos y el efecto de la frase es post-secuencial (después de la percepción), es
decir, cuando tu eres consciente de los procesos perceptivos podría haber un reprocesamiento de la señal.

RECONOCIMIENTO DE PALABRAS

El procesamiento oral de palabras

La percepción, sirve para la escritura y par la articulación, es una formalización abstracta del sonido, representación
abstracta.

- La fonética acústica
- La percepción del habla, fenomenología
- Las teorías sobre la percepción del habla
- Los efectos del contexto

El reconocimiento

- La estructura del léxico


- Los aspectos metodológicos
- La fenomenología experimental
- Los modelos de reconocimiento oral

Organización del léxico

La fenomenología del acceso al léxico: un adulto conoce entre 40 y 80 mil palabras, una palabra puede ser primitiva o
si procede de una será derivativa. Los morfemas libres son los lexemas y los ligados son los derivativos y flexivos.
Cuando se activa una palabra, se activa a su vez su significado, fonología, ortografía y morfosintaxis. Activamos todas
estas propiedades a un ritmo de 2 o 3segundos, es un mecanismo altamente eficiente y rápido que actúa sobre una
señal que se desvanece rápidamente.

Los procesos generativos permiten la formación de expresiones sin necesidad de pensarlas, lo que sería la morfología
que estaría establecida por un sistema de reglas. Por lo que solo deberíamos saber la raíz (lexema) de las palabras.
Cabe la posibilidad de que lo único que hay en el léxico es la raíz verbal y la morfología verbal.

Según el DRAE el español


dispone de 93.11 lemas. Las
clases abiertas son las
palabras con un contenido
semántico, su número varía
constantemente, y se crean
nuevas palabras por
derivación, préstamo u
onomatopeya (como por
ejemplo antes hablabas de te estabas comiendo la cabeza y ahora de estás rayado o almanaque, alcancía, palabras
que ya no se utilizan), son verbos, sustantivos, adjetivos y adverbios. Sin embargo, las clases cerradas tienen una
función principalmente sintáctica, para estructurar los enunciados. Su número permanece durante largos periodos de
la historia, son preposiciones, artículos, conjunciones, auxiliares y son menos numerosas cuyo uso es muy frecuente.

Los contenidos del léxico son la fonología, ortografía, morfología, sintáctica, semántica y relaciones asociados.
Comprender una palabra implica comparar y acoplar un estímulo externo (escrito o hablado) con estructuras de
información previamente representadas en la memoria del oyente. (el diccionario mental)

Hipótesis del listado exhaustivo, cada posible palabra tiene un representación propia (comida, comedor, come..)

Hipótesis del listado parcial o segmentación obligatoria, el léxico = lexemas + morfemas. Las pseudopalabras
compuestas por morfemas reales, como, por ejemplo, «panaderista», tienen tiempos de reacción mayores porque
cuesta más decidir que no son palabras reales.

Hipótesis mixta o dual, el listado exhaustivo para palabras monomorfémicas, irregulares y de alta frecuencia. Las
palabras con morfología compleja están formadas por raíz y afijos, y también es útil pala las palabras de baja frecuencia
porque no hace falta conocer sus formas derivadas para saber que significa.

Transparencia fonológica, si una palabra compleja no es transparente con respecto a sus componentes, se representará
como otra palabra a parte, por ejemplo “camaleón” no es transparente con respecto a sus componentes “cama “ y
“león”. Hay dos niveles, en el nivel 1 se produce un variación de la raíz (sueño/soñar) y en el nivel 2 no se altera la raiz
(comer/comedor).

La distinción entre periférico o profundo entre acceso y reconocimiento respectivamente. El código de acceso se
refiere a la parte de la palabra que se utiliza para la búsqueda, no usamos toda la palabra para buscarla sino solo una
parte de la palabra. Un proceso de activación en los modelos conexionistas y de logogen, que producen más activación
y los de competición consisten en la inhibición como en la prueba de struck (prueba palabra color y debes decir de
que color está esta palabra)

Técnicas experimentales

Gating (apertura sucesiva)

La palabra se representa a intervalos regulares (gates de 15 ms, 30 ms, 45ms), el sujeto está instruido para que pulse
una tecla cuando crea haber identificado la palabra. La palabra puede ir precedida de un contexto (frase), la variable
dependiente es la duración mínima del estímulo que permite su identificación. Con esta técnica se demuestra que no
hace falta escuchar la palabra entra.
Monitoring (detección)

Se presenta un target (objetivo) que es el estímulo que debe detectarse,


la tarea del sujeto es pulsar rápidamente una tecla cuando detecte el
target(por ejemplo pulsa la tecla si una palabra contienen /pa/ y luego
se les pide /pal/). Se supone que la integración perceptiva está
controlada por un conjunto de factores que puede acelerar o decelerar
la detección del target.

Cuando se le dice que pulse cuando aparezca una palabra la sílaba PA,
reconoce antes la palabra palo que palma, pero cuando le dices que
pulse cuando aparezca una palabra la sílaba PAL, reconoce más tarde la
palabra palo que palma.

Sirve para demostrar que utilizamos la sílaba como unidad de pronunciación en las lenguas romance, por eso en inglés
esto no sirve, por lo que su estructura fonológica no se basa en sílabas.

Tarea de decisión léxica auditiva (TDL)

Las instrucciones que se dan para esta prueba son que debes escuchas los sonidos que se presentan por los auriculares
e indicar si son o no palabras conocidas de su idioma. Debe pulsar un botón si es una palabra y otro si es una
pseudopalabra. Los materiales son las palabras y las pseudopalabras, además hay una contaminación consciente.

Otros métodos

- Categorización semántica: consiste en indicar por ejemplo si las palabras presentadas son peces o mamíferos,
sirve para estudiar los procesos semánticos.

- Decisión de género: consiste en indicar si los sustantivos presentados son masculinos o femeninos, y sirve para
el proceso de lo procesos morfosintácticos.

- Localización de palabras (“wordspotting”), consiste en localizar las palabras que hay en una secuencia de
sonidos/palabras sin sentido.

Puede haber problemas con la interpretación de los resultados de las pruebas, ya que estas no son puras, se encargan
de la toma consciente de decisiones y de la replicación con tareas diferentes.

Fenomenología experimental

El punto de unicidad (se busca en el diccionario y es objetivo porque es igual para todos) consiste en el momento en
el que ya no hay otras palabras con esas letras. En un análisis de izquierda a derecha, es el punto en el que una palabra
se convierte en un única para un léxico dado. El punto de reconocimiento es el momento en el que tu reconoces la
palabra, y es subjetivo, normalmente coincide con el punto de unicidad y si tu le presentas a un niño y a un universitario
una palabra, el punto de reconocimiento será menor o más corto en el niño porque tendrá menos léxico.

La frecuencia léxica, es la característica de las palabras más usadas que se identifican con mayor facilidad y rapidez
que las menos usadas. Para medirlo se utiliza el corpus de frecuencias y la frecuencia es objetiva pero la familiaridad
es subjetiva. “Locus” del efecto de frecuencia, es una explicación estándar, que se trata de una propiedad de la entrada
léxica. Balota y Chumbley dicen que en realidad es un efecto lateral de la fase de la decisión léxica del TDL, y por ello
no se observa en la tarea de categorización. Actualmente no existe un acuerdo, ya que las diferentes tareas se ven
influidas por una multitud de factores que hacen difícil aislar el efecto de la frecuencia.

La edad de adquisición (AoA), es la edad a la que se aprende una palabra, y el orden (OdA) es la posición serial en la
que se adquiere una información. Las palabras tempranas son las más fáciles, por lo que conllevan menos error, y por
lo tanto son más rápidas de procesar que las tardías. Algunos efectos que se atribuyen a la frecuencia en realidad
corresponden a la AoA, ya que existe una alta correlación entre ambas, aunque tienen efectos independientes F—
TDL; AoA---Categorización. Hay problemas para evaluar la edad de adquisición ya que los índices pueden ser tanto
objetivos como subjetivos.
La lexicalidad es el tiempo de respuesta en una TDL que generalmente es menor para las palabras que para las no-
palabras. Las pseudopalabras tardan más en rechazarse si son muy similares otra palabra o incluyen una palabra en su
interior.

La vecindad fonológica consiste en todas aquellas palabras que e obtienen sustituyendo un único fonema de una
expresión oral por un fonema distinto. La mayor parte de los estudios encuentran que un efecto inhibitorio es que las
palabras con mayor N se reconocen más tarde. La frecuencia de los vecinos es el factor determinante, ya que el nº de
vecinos con una frecuencia mayor es el factor que mejor predice la inhibición.

El priming en un contexto, es que las palabras de una oración pueden ctuar como prime y target, como por ejemplo
“Se sentó en la mesa de la biblioteca y se puso a leer un libro”. Mesa actuará como prime de biblioteca y esta a su vez
como priming de leer.

Otros efectos pueden ser:

- Imaginabilidad, que consiste en la facilidad para formar una representación interna de una palabra. Fenómenos
que suelen ocurrir es que las palabras concretas se recuerdan mejor que las abstractas, y que las palabras
concretas con una baja frecuencia producen tiempos de respuestas menores que las palabras abstractas con
una alta frecuencia. Además, los índices de evaluación son subjetivos, y el problema es la contaminación con
otras variables.

- Polisemia, consiste en el número de significados, las palabras de baja frecuencia con más significados se
reconocen antes. (Polisemia vs Homografía)

- Morfología, consiste en la frecuencia de la palabra (listado exhaustivo) vs frecuencia de raíz (segmentación


obligatoria), cuya hipótesis es mixta.

- Contenido emocional, que consiste en las palabras con alta carga emocional se procesan más rápido que las
palabras tabú.

MODELOS DE RECONOCIMIENTO ORAL

Modelo de Búsqueda Serial

El efecto de la lexicalidad (MUSICA/MACISU/MSAICU)

Búsqueda en 2 etapas:

- El acceso a los archivos periféricos se lleva a cabo mediante la ordenación de los códigos de acceso y bins
cuya búsqueda es serial. En el reconocimiento del archivo central, se presenta un puntero y puede haber
referencias cruzadas.
- Algunas críticas y reformulaciones son la introducción del concepto de activación y las pseudopalabras.

Modelo de cohorte

Consiste en una secuencia ordenada de etapas, pero en ellas se activan


paralela y simultáneamente varios elementos léxicos. Se trata de un
modelo que solo sirve para las palabras habladas. Los estímulos
auditivos necesitan desplegarse en el tiempo y no se presentan todos a
la vez, los sonidos iniciales son los candidatos al 1er cohorte. A medida
que el sonido va ingresando en nuestro sistema de percepción, la
cohorte inicial se va reduciendo hasta que solo quede una palabra en el
último cohorte, si no encontrásemos ninguna es que será una
pseudopalabra. Las palabras se reconocen antes de terminar de
escucharlas. Está relacionado con la coarticulación, el punto de
unicidad.

Cada letra de cada palabra indica un cohorte, C O C O D R I L O


La prueba de Shadowing, consiste en grabar una parte de un texto y ponérselo a otra persona diciéndole que repita lo
que escucha los más rápido que pueda. Aquí si sobre ponemos el audio de la persona con el texto y se verá que repite
antes de terminar de escuchar las palabras. Esto no sería suficiente, ya que tendríamos que introducir errores y los dice
sin cometerlo (decimos polimonio y el dice polinomio) eso significaría que está habiendo un reconocimiento.

Algunas críticas son la recuperación de errores en el primer fonema (tolinomio), porque según el modelo de cohorte
no se podría reconocer, ya que habría que buscar en palabras que empiecen por (to). Los cambios al inicio de la
palabra son más relevantes que si son en la mitad o final de la palabra, todo esto se produce porque si se encuentra
después del punto de unicidad ya apenas se nota porque ya has reconocido la palabra. Otro problemas es que la
frecuencia no tiene relevancia en este modelo.

Priming inter-modal

Priming semántico, la manipulación especial es el momento en el que aparece el target. Se escuchan palabras/frases
por los auriculares al tiempo que se realiza una TDL visual en la pantalla de un ordenado. Se varía la relación entre el
habla y las palabras de la TDL y su desfase temporal.

Si mostramos el sonido /kap/, se activa tanto captain como capital / y a su vez se activa el target ship y money

Si por el cambio mostramos /kapt/, se activa solo captain y se inhibe capital/ y a su vez se activa el target ship y se
inhibe money.

El contexto no muestra un efecto en la selección pero puede acelerar el proceso de activación.

Modelo Logogen

Es un modelo de acceso directo que ha influido mucho sobre el resto, el logogén es dispositivo que acumula evidencia
en favor de una palabra. Cuando la evidencia acumulada sobrepasa un valor umbral se produce una respuesta de
detección. La evidencia se suministra en paralelo y no se distingue entre la información visual, acústica o semántica.

Las tres fuentes distintas de información son la ortográfica, obtenida del análisis visual, auditiva de las palabras
habladas y las semánticas procedentes del sistema cognitivo. Las dos primeras son fuentes externas, y la semántica es
interna y es la que utilizamos en la producción del lenguaje. Aunque el sistema de logogenes no hace distinción entre
las fuentes y para él son funcionalmente independientes. Los logogenes contienen más información de la denominada
información de arriba/abajo (del sistema cognitivo) y necesitará menos información de abajo/arriba para la
identificación de las palabras.

Modelo TRACE

Es el heredero del modelo IA y del modelo de cohorte.


Funciona con principios muy parecidos y presenta 3 nieles
de procesamiento el input fonológico, fonemas y palabras.
En el nivel de rasgos está relacionado con la coarticulación,
hay que representar el tiempo y por ello es más complejo, ya
que la información se desvanece a lo largo del tiempo. El
nivel fonológico se corresponde con el ortográfico
(fonemas), en este se muestra las veces que se han mostrado
en el tiempo.

Un fonema dura más que un rasgo, y por lo tanto una cajita


del léxico es más largo que de un fonema y un rasgo.
Funciona exactamente igual que en el reconocimiento
escrito. No hay aferencias del nivel fonológico al nivel de
rasgos, y en este no hay efectos top-down.

También podría gustarte