Está en la página 1de 8

PSICOLOGIA DE LA PERCEPCIN

TEMA VIII: RECONOCIMIENTO VISUAL


INTRODUCCIN
Uttal define el reconocimiento como la accin de clasificar, categorizar o
conceptuar un determinado estmulo como miembro de una clase de estmulos.
El proceso de reconocimiento es ms complejo que los de deteccin o
discriminacin:

El nico requisito en la deteccin, es advertir la presencia de un estmulo.

En la discriminacin, para poder percibir las semejanzas y diferencias entre


estmulos, se aada un requisito de memoria (una vez atendido el primer estmulo es
necesario recordarlo para poder realizar la comparacin con el segundo estmulo).

El reconocimiento requiere el recuerdo de una o varias clases de estmulos y


adems requiere la asignacin de significado al objeto, ya que la accin de clasificar,
categorizar o conceptuar depende ms del significado que se asigna al objeto que de las
caractersticas fsicas del mismo, que son prioritarias en la deteccin y la discriminacin.
I)
RECONOCIMIENTO DE OBJETOS.
La mayora de las teoras sobre el reconocimiento visual de objetos acepta que el
mecanismo bsico consiste en la comparacin de la imagen de un objeto con una
representacin del objeto almacenada en la memoria.
Para comprender cmo se lleva a cabo la comparacin, habr que conocer: qu tipo
de procesos permiten derivar una descripcin adecuada de la imagen, cmo se
almacenan esas descripciones y cmo se realiza la comparacin. Es decir habr
que conocer la relacin entre los procesos visuales de descripcin de la imagen y los
procesos cognitivos que permiten realizar la comparacin.
A) COMPARACIN DE PLANTILLAS.
Las primeras investigaciones sobre reconocimiento visual, se centraron en el
reconocimiento de patrones bidimensionales relativamente simples: letras y
nmeros. Una de las propuestas iniciales sobre el modo en que se reconocen estos
patrones consista en suponer que para cada carcter alfanumrico debera haber una
plantilla almacenada en la memoria con la cual se comparaba el patrn.
El procedimiento de comparacin de plantilla:

Sera til para el reconocimiento de patrones cuya forma bsica es


relativamente constante, es decir, cuando no presenta demasiadas variaciones

No sera til para reconocer patrones complejos u objetos naturales, debido a


la complejidad y variaciones que stos presentan.
Los problemas que presenta este procedimiento estn fundamentalmente
relacionados con su falta de economa. Si tuviramos que comparar con una plantilla la
forma de la letra P, el proceso sera interminable, debido a la gran variedad de formas
bsicas que pueden existir sobre la letra p; el reconocimiento no sera posible cuando los
patrones cambiasen de orientacin, tamao o posicin, o cuando existiera alguna
deformacin en los mismos.
Una posible solucin a este problema requerira que las imgenes de los objetos
fueran sometidas previamente a un proceso de normalizacin, por medio del cual se
ajustaran al tamao, orientacin, etc. y, una vez normalizados, se compararan con las
plantillas almacenadas.
B) ANLISIS DE CARACTERSTICAS.
Una postura terica diferente, contempla la posibilidad de que el sistema visual
disponga de detectores especficos de caractersticas geomtricas simples como
lneas verticales, horizontales y oblicuas; ngulos, curvas, etc. En este caso, el
reconocimiento se obtendra mediante la deteccin de las caractersticas definitorias de
un patrn determinado. Por ejemplo, la presencia de una lnea horizontal situada en la

parte superior y otra horizontal unida a la anterior en su centro, determinara el


reconocimiento de la letra T.
El primer modelo de reconocimiento basado en las caractersticas, denominado
pandemnium, desarrollado por Selfridge.
Modelo pandemnium

En este modelo, cada nmero o letra se representa internamente por una lista de
caractersticas locales que definen su forma (lneas verticales, horizontales y oblicuas,
ngulos rectos, curvas, etc.). Por ejemplo, las caractersticas locales de una H, seran dos
lneas verticales, una horizontal y cuatro ngulos rectos.
Cuando se presenta un patrn nuevo se hace una lista de sus caractersticas y se
compara en paralelo (todas a la vez) con las listas de caractersticas de patrones
conocidos almacenadas en la memoria. Si el patrn nuevo se ajusta a alguna de las
caractersticas se reconoce y se clasifica como perteneciente a una determinada
categora.
El sistema consta de una serie de mecanismos o demonios, cada uno de los
cuales realiza una funcin especfica:

Los demonios de la imagen cumplen la funcin de formar una


representacin interna del patrn estimular.

Los demonios de las caractersticas analizan la imagen y responden


nicamente cuanto est presente la caracterstica a la que son sensibles (unos
responden ante lneas verticales, otras ante ngulos, etc.).

Los demonios cognitivos, son responsables del reconocimiento de patrones


especficos, por ejemplo una letra o un nmero determinados: en recogen las respuestas
anteriores y buscar combinaciones de caractersticas que definen el patrn de cuyo
reconocimiento son responsables. Si las encuentran envan su informacin al demonio
de la decisin que tiene como funcin proporcionar la respuesta final sobre el
reconocimiento.
Sin embargo el mecanismo de reconocimiento propuesto por el modelo del
pandemnium no es aplicable en muchos casos,
ya que sera necesario
especificar las relaciones entre las caractersticas elementales (con la letra E se podran
reconocer otras figuras que contienen las mismas caractersticas pero situadas en un
posicin espacial diferentes.) Definir un patrn complejo, como por ejemplo un insecto,
en base a este tipo de caractersticas resultara imposible, como tambin lo sera
recombinar las caractersticas elementales de un patrn de esta naturaleza para llegar a
una identificacin global del mismo.
C) DESCRIPCIONES ESTRUCTURALES.
Este modelo permite resolver algunos de los problemas relacionados con los
modelos de plantilla y caractersticas.
Las descripciones estructurales incluyen adems de la descripcin de las
caractersticas de un patrn, las relaciones entre las mismas y su disposicin
espacial; de esta forma, se superan algunas de las dificultades comentadas
anteriormente.

Eje: la descripcin estructural de la letra E consistira en la lista de una lnea


vertical, cuatro ngulos rectos y tres lnea horizontales que se unen a la lnea vertical en
la parte superior, intermedia e inferior
La especificacin de las relaciones entre las caractersticas as como su
disposicin espacial: permite la comparacin de los patrones nuevos con las
representaciones almacenadas, obviando la ambigedad de los procedimientos
anteriores.

PSICOLOGIA DE LA PERCEPCIN
TEMA VIII: RECONOCIMIENTO VISUAL
La descripcin estructural no garantizara el reconocimiento del objeto en
situaciones en las que se produce un cambio en la imagen debido al movimiento
del sujeto o del objeto: a la observacin desde puntos de vista diferentes.
Una solucin a este problema son las descripciones estructurales basadas en
el objeto, que incluye en la descripcin, el marco de referencia perceptivo o eje
intrnseco del objeto: al especificar la relacin de las partes del objeto con el eje
principal del mismo, se mantiene la constancia del objeto.
Cuando la relacin entre el objeto y el marco de referencia permanece constante, el
reconocimiento del mismo es posible a pesar de los cambios en la imagen cuan se
produce un cambio en la orientacin o en determinadas transformaciones (cuadrado y
rombo)
Con la adopcin de un marco de referencia intrnseco o centrado en el
objeto, el reconocimiento pasa a ser independiente de las transformaciones, as
como de los cambios en el punto de vista. En el ejemplo vemos una figura geomtrica
definida por la posicin de su centro y la orientacin de sus ejes horizontal y vertical, que
constituyen sus marcos de referencia intrnsecos. De esta forma, se pueden codificar las
relaciones espaciales entre las partes del objeto y el eje principal del mismo y se puede
reconocer el objeto cuando se producen cambios de tamao, posicin u orientacin.
La excepcin a esta regla la constituyen aquellos casos en que existan marcos de
referencia alternativos; cuando esto ocurre, el reconocimiento depender del
marco de referencia seleccionado.
Este modelo presenta problemas cuando existe una gran variedad de objetos
pertenecientes a una misma clase, cuando el objeto se dobla por alguno de sus ejes, o
cuando se les aade alguna parte. En estos casos, no se puede obtener un buen
ajuste cuando se compara una representacin de estas caractersticas con los
modelos almacenados en la memoria.
D) TEORA COMPUTACIONAL DE MARR Y NISHIHARA.

Esta teora(al igual que la de estructuras superficiales) es una teora del


reconocimiento en base a ejes de coordenadas, y se desarroll en el contexto de la
Inteligencia Artificial.
La teora intenta ofrecer una explicacin sobre cmo se transforman los patrones
estimulares en una representacin simblica en la que se explicitan la forma,
orientacin, posicin, movimiento, etc. de los objetos.
Este proceso se desarrolla a travs de varias etapas, en las que se generan
distintas descripciones del estmulo (esbozo primario, esbozo 2 D y modelo 3
D).
Establece una distincin entre el procesamiento visual inicial, en el que s generara
el esbozo primario y el 2 D y los procesos posteriores que llevan al modelo 3D.
En las dos primeras etapas, el procesamiento es de bajo nivel y no implica
ningn proceso de interpretacin.
Primera etapa: representacin inicial o esbozo primario
Se describe la imagen como una serie de cambios de intensidad que representan
bordes, manchas, barras, y su distribucin geomtrica (sus respectivas posiciones y
orientaciones).

El resultado llevara a una representacin de estructuras ms globales


(gradiente de densidad, contornos y texturas de las superficies) denominada esbozo
primario completo que constituye una representacin mas refinada que la anterior.
En la segunda etapa, se obtiene una representacin denominada esbozo 2 D,
Aporta informacin sobre la distancia relativa de las partes de la superficie al
observador, su orientacin en relacin con la lnea de visin y la presencia de
discontinuidades en la superficie.

Es una descripcin de la superficie del objeto desde el punto de vista del


observador.
Cuando se produce un desplazamiento del sujeto o del objeto, la representacin
cambia, por lo que todava resulta inadecuada para la comparacin con los
modelos almacenados en la memoria ya que se necesitara un modelo almacenado
en la memoria para cada uno de los puntos de vista posibles.
Para solucionar el problema anterior, Marr y Nishihara proponen una tercera etapa de
procesamiento tardo, en la que se genera una descripcin, denominada modelo 3 D
definida a partir de un sistema de coordenadas basado en los ejes naturales del
objeto, lo que permite mantener la descripcin del objeto en relacin al marco de
referencia, cuando se producen cambios en el punto de vista desde el que se observa.
Marr y Nishihara, proponen:

Una organizacin modular de las descripciones del objeto: en la que los


mecanismos de procesamiento son independientes y

Una representacin del objeto basada en primitivos volumtricos que


se pueden localizar en los objetos y analizar en trminos de ejes de coordenadas.

Los primitivos volumtricos son los conos generalizados, que consisten en las
superficies generadas a partir del movimiento de una seccin transversal a lo largo de un
eje principal. La seccin puede variar en tamao pero su forma permanece constante.
No todos los objetos pueden describirse mediante conos generalizados:
objetos como vasos, jarrones, pirmides, y algunas partes del cuerpo, podran describirse
mediante este sistema, pero no podran ser descritos mediante conos
generalizados otros objetos como rostros, rboles o plantas.
Este modelo es un modelo de IA: no un modelo capaz de explicar el reconocimiento
visual humano, por ello sus aplicaciones en el campo de la Psicologa son limitadas o
prcticamente inexistentes. Ya que en esta teora no se asume la influencia del
conocimiento previo (procesos de arriba - abajo) sobre el proceso de reconocimiento,
el modelo propuesto dara lugar a errores a la hora de reconocer este tipo de objetos.
E)

MODELO DE RECONOCIMIENTO POR COMPONENTES.

El Modelo de Reconocimiento por Componentes: Biederman: constituye una


extensin del modelo Marr y Nishihara anterior, aplicado al reconocimiento humano.
El modelo de reconocimiento por componentes parte de una idea similar a la de los
modelos de reconocimiento de palabras mediante los fonemas.
La propuesta bsica es un modelo de reconocimiento basado en un conjunto
finito de primitivos y sus posibles combinaciones, que permiten especificar los
objetos.
Como primitivos, o unidades bsicas para el reconocimiento de los objetos:
geones: que pueden ser de cuatro tipos bsicos: esferas, cilindros, bloques y
cuas, para obtener primitivos tridimensionales a partir de imgenes de entrada
bidimensionales.
Considera que los geones son caractersticas invariantes desde cualquier
punto de vista, y pueden utilizarse como material para la construccin de las
representaciones tridimensionales
El supuesto perceptivo fundamental de la teora es que los geones pueden
diferenciarse sobre la base de propiedades perceptivas de la imagen bidimensional que
son independientes del punto de vista que se adopte.
La teora sugiere: una serie de relaciones estructurales entre los
componentes que permitiran generar mltiples objetos.
El supuesto bsico del que se parte es que el sistema visual humano ha
desarrollado la capacidad de detectar determinadas organizaciones
perceptivas de los elementos de la imagen como simetra, alineamiento,
2

PSICOLOGIA DE LA PERCEPCIN
TEMA VIII: RECONOCIMIENTO VISUAL
conexin, etc., que no son accidentales;
organizaciones que no surgen por
casualidad y que se corresponden con propiedades significativas de los objetos.
Las propiedades no accidentales (fundamentalmente, simetra, paralelismo,
rectitud/curvatura, conexin y coterminacin), seran las responsables de mantener
la constancia del objeto. Se consideran como caractersticas y serian invariantes,
es decir, su correspondencia con el objeto permanece a pesar de los cambios en el punto
de vista.
El principio bsico de organizacin es que el sistema visual considera que
determinadas propiedades de los bordes de la imagen bidimensional constituyen una
evidencia de la presencia de esas mismas propiedades en los objetos tridimensionales:
un borde recto en la imagen bidimensional, sugerira la presencia de un borde recto en el
objeto tridimensional a partir del cual se ha derivado la imagen.

representados en los dibujos les faltaba algn componente esencial; y objetos ms


complejos representados con mltiples componentes). Los resultados indicaron:

El tiempo de reaccin empleado por los sujetos en la tarea de nombrar objetos


era aproximadamente igual en los dibujos de objetos simples completos e incompletos.

El tiempo de reaccin cuando los sujetos tenan que nombrar los dibujos de
objetos ms complejos fue ms corto.
Estos resultados apoyan la hiptesis del modelo de reconocimiento por componentes
que afirma que los objetos pueden identificarse correctamente a partir de una serie
limitada de geones bsicos. Adems, el hecho de obtener una ligera ventaja en el tiempo
de reaccin ante los objetos complejos
(formados por un mayor nmero de
componentes) se interpret tambin como prueba a favor del supuesto de que cuantos
mas geones contenga un objeto, mas rpidamente se llevar a cabo la comparacin con
las descripciones almacenadas sobre los geones en la memoria.

El reconocimiento por componentes procedera de la siguiente forma:


El primer paso consistira en la extraccin de borde a partir de los cambios en
luminancia.
A partir de ella, se extraeran las propiedades no accidentales de la imagen como
simetra, conexin, paralelismo, rectitud/curvatura y coterminacin, que sirven para
identificar los geones. En paralelo, se llevara a cabo un proceso de divisin del objeto en
regiones cncavas, cuyo objetivo es identificar los geones que componen, el objeto.
Hasta este punto el procesamiento procedera de abajo - arriba. Una vez activada la
descripcin de los geones del objeto, se activara la descripcin de los geones
almacenados en la memoria y se llevara a cabo el proceso de comparacin en paralelo,
que conduce finalmente a la identificacin del objeto.
Extraccin de bordes

Un segundo grupo de estudios se dedic a examinar el efecto de la degradacin del


estmulo sobre el reconocimiento de los objetos. Los resultados mostraron que el
reconocimiento empeoraba considerablemente cuando el estmulo presentaba una
degradacin que afectaba a las propiedades no accidentales porque en ese caso no se
podan identificar los geones componentes del objeto.
El modelo propuesto por Biederman es ms flexible y ms apropiado para el
reconocimiento humano que el propuesto por Marr y Nishihara y se puede aplicar a una
gama ms amplia de objetos. Los resultados son consistentes con el modelo. Sin
embargo, esta teora tambin presenta algunas dificultades: el principal problema
est en relacin con la propuesta artificial de los 36 geones y la determinacin de sus
relaciones espaciales. No existe hasta el momento ninguna evidencia emprica que
apoye la sugerencia de que los geones propuestos constituyan la base fundamental para
categorizar los objetos.

Deteccin de propiedades
no accidentales

Segmentacin
cncavas

de regiones

Activacin de geones y relaciones


entre los mismos: determinacin de
los componentes

Activacin de los modelos


objeto:
comparacin
de
componentes
con
representaciones del objeto

1) Modelo PDP De Reconocimiento Por Componentes.

En los modelos PDP se considera que el reconocimiento consiste en la


activacin de una red formada por unidades de computacin artificiales
similares a las neuronas, que procesan la informacin de forma distribuida y
en paralelo.
Un ejemplo es el modelo JIM es una red neuronal conexionista de siete capas:
L7
Las clulas responden a los objetos definidos en base a grupos de clulas
de la capa anterior (L6).
L6

Reciben las unidades de salida de L3 y L5, que constituyen una descripcin


estructural de un objeto en trminos de los geones que lo componen y las
relaciones entre los mismos y responden a conjuntos de clulas activadas
de esas capas. Representan el conjunto de todas las descripciones de
geones posibles.

L5
L4

Reciben la informacin sobre la posicin en el campo visual, tamao y


orientacin de los geones, que procede de las clulas de la capa L3. Se
especifican las relaciones espaciales entre los geones: orientacin, posicin
y tamao relativo.
Se codifican los atributos de los geones, como la forma de su eje
principal (recta o curva), si existe paralelismo (lados paralelos o no
paralelos), orientacin burda (vertical, horizontal, oblicua), aspecto
(alongado o achatado) forma de la seccin (recta o curva), tamao (grande
o pequeo), posicin horizontal (de derecha a izquierda), posicin vertical
(que vara de arriba abajo), etc.
3

del
los
las

Reconocimiento del objeto


Una serie de estudios experimentales han intentado verificar el
funcionamiento del modelo.
Un primer grupo de estudios se dedic a examinar si el reconocimiento del objeto
era ms rpido y preciso cuando se presentaban slo los geones bsicos del objeto o
cuando se presentaba el objeto perfectamente detallado. (Se dibujaron objetos comunes
completos, con todos sus componentes dibujados; incompletos, en los que a los objetos

L3

PSICOLOGIA DE LA PERCEPCIN
TEMA VIII: RECONOCIMIENTO VISUAL
L2

Se extraeran tres tipos de caractersticas: vrtices, ejes de simetra y


manchas, que permiten discriminar entre distintos tipos de geones y
especificar sus atributos.

L1

Formada por clulas sintonizadas a la orientacin y cuyos campos


receptivos se solapan, se extraeran los bordes.

II)
RECONOCIMIENTO DE CARAS.
El reconocimiento de caras constituye un importante aspecto del reconocimiento
visual fundamentalmente por la naturaleza de la estimulacin que presenta
aspectos peculiares y distintos a los presentados en el reconocimiento de objetos.
Por una parte, la relacin entre los elementos componentes de la cara (ojos, boca,
nariz, etc.) da lugar a la formacin de una configuracin en la que se percibe el
estmulo como un todo que presenta caractersticas propias e independientes de las
de sus elementos componentes.
Por otra, las caras son estmulos biolgica y socialmente importantes,
aportando informacin sobre caractersticas relevantes de las personas con las que se
interacta como edad, sexo, expresin, estado de nimo, y direccin de la mirada, que
pueden influir en el aprendizaje y la interaccin social.
El procedimiento experimental bsico utilizado en este tipo de estudios,
consiste en presentar como estmulos caras construidas artificialmente, en las que
se pueden variar las caractersticas que forman el rostro (por ejemplo, se puede cambiar
la forma de la nariz, el color de los ojos, la forma y el color del pelo, etc.).

Las tareas ms utilizadas suelen ser:

Las tareas igual - diferentes, en las que los sujetos deben comparar dos
caras, o algn componente de las mismas, y sealar si son iguales o no.

Tareas de reconocimiento: en las que deben sealar si la cara se haba


presentado anteriormente.
A) PROCESAMIENTO DE LAS CARACTERS TICAS COMPONENTES DE LAS
CARAS.
Las primeras investigaciones sobre reconocimiento de caras (70), partan del
supuesto terico de que el sistema visual analizaba las caras basndose en las
caractersticas que las componen (ojos, boca, nariz, etc.) y a partir de aqu se
realizaba una descripcin de la cara sobre la base de estas caractersticas (por ejemplo,
ojos azules, nariz afilada, labios gruesos, etc.).
Planteamiento bsico: si las diferentes caractersticas de las caras se
procesaban por separado o si, por el contrario, se procesaban como una unidad
perceptiva, en la que se produca una interaccin en la percepcin de las

caractersticas, de forma que la percepcin de los ojos fuera influida por la percepcin de
la forma de la nariz o el color del pelo, etctera.
Bradashw y Wallace: construyeron caras variando algunas caractersticas en cada
una de ellas:

En la primera (a), se presenta la cara que se toma como punto de partida

En b, se presenta una cara en la que se modifican la nariz y la barbilla.

En c, se modificaron adems de las anteriores caractersticas, el pelo y la boca.

En d, todo lo anterior, los ojos, y las lneas de la cara.

La tarea de los observadores consista en proporcionar juicios igual - diferentes


sobre dos caras presentadas secuencialmente.
Los resultados mostraron que el tiempo empleado en emitir un juicio sobre
las diferencias de caras era ms corto cuanto ms caractersticas diferentes se
presentaban en las caras.
Conclusiones: las caractersticas de las caras se procesaban de forma
independiente y secuencial y no como una unidad perceptiva. Los observadores
inspeccionaran el pelo en primer lugar, seguido por los ojos, nariz, etc. hasta que
encontraban diferencias en las caras.

Si no perciban diferencias, la respuesta sera: igual.

Si las perciban, la respuesta sera diferente.

Sin embargo, los resultados son poco concluyentes debido a dos razones:

A las demandas de la tarea utilizada que induce la estrategia de buscar


diferencias;

Las caras que presentan mas diferencias entre sus caractersticas tambin las
presentan globalmente, por lo que no se puede excluir que el procesamiento se
haya realizado globalmente.

B) INTERACCIONES ENTRE CARACTERSTICAS COMPONENTES EN EL


PROCESAMIENTO DE CARAS.
Para obviar los problemas sealados en los estudios anteriores, Sergent:
dise una serie de estmulos, que consistan en ocho caras distintas resultantes de
la combinacin de dos barbillas, dos colores diferentes para los ojos, y dos
distribuciones distintas del espacio interno de la cara (distancia de los ojos y la nariz a la
frente y a la boca).
En cada ensayo se presentan dos caras que podan ser iguales o diferir en una
nica caracterstica o en todas ellas.

La tarea de los observadores consista en pulsar una llave de respuesta si las


dos caras eran iguales y otra distinta si eran diferentes. Los resultados confirmaron
los obtenidos en estudios anteriores y adems proporcionaron una informacin
importante:

Cuando las caras diferan en una nica caracterstica, las diferencias se


perciban ms rpidamente cuando dicha caracterstica era la barbilla.

Cuando a la diferencia entre barbillas se aada una de las otras dos (ojos o
distribucin del espacio interno), la percepcin de la diferencia entre caras era todava
mas rpida.
Este resultado indicara que las caractersticas componentes de las caras no se
perciben independientemente sino que se produce una interaccin entre las mismas,
es decir una influencia mutua.
C) PROCESAMIENTO CONFIGURACIONAL DE LAS CARAS.
4

PSICOLOGIA DE LA PERCEPCIN
TEMA VIII: RECONOCIMIENTO VISUAL
Los resultados de Sergent indican que las caractersticas componentes de
las caras no se procesan independientemente; sin embargo, no permiten
determinar el proceso que subyace al reconocimiento. El hecho de que no se
representen de manera independiente en la descripcin que el sistema visual hace de las
caras, indicara que se procesan como una configuracin en el sentido de la
Gestalt: la percepcin de las caractersticas componentes junto con sus relaciones
espaciales determinara un nuevo percepto que sirve como base para el reconocimiento.
Este supuesto fue examinado por Tanaka y Farah:
Hiptesis:

Si las caractersticas componentes se representan independientemente


en la descripcin que el sistema visual hace de la cara, entonces el reconocimiento de
las mismas por separado ser igual cuando se presenten aisladamente que
cuando se presenten en el contexto de una cara.

Por el contrario, si la representacin de las caractersticas no es


independiente, se reconocern peor cuando se presenten aisladamente que
cuando se presenten en el contexto de una cara.

El procedimiento utilizado fue el siguiente: Se presentaron a los observadores


una serie de caras y durante una serie de ensayos tenan que asociar las caras con un
nombre determinado (por ejemplo, una determinada cara se asociaba con el nombre de
Juan, otra diferente con el de Enrique, etc.). Una vez aprendidos los nombres de las
caras, se presentaba dos pruebas de reconocimiento:

Reconocimiento de caractersticas componentes en un contexto, se


presentaban como estmulos caras que diferan en una nica caracterstica (por ejemplo,
la nariz) y los observadores tenan que indicar si esa caracterstica perteneca o no a la
cara asociada con un nombre determinado en la etapa anterior.

Reconocimiento
de
caractersticas
componentes
presentadas
aisladamente, se presentaban dos caractersticas diferentes (por ejemplo, dos tipos de
nariz) y los observadores deban indicar cul de ellas perteneca a una cara determinada.
Los resultados indicaron que el reconocimiento de caractersticas
componentes era peor cuando stas se presentaban aisladamente que cuando
se presentaban en el contexto de caras.
Los autores concluyeron que la representacin de caras est basada en una
descripcin global de la imagen que lleva a un mejor reconocimiento de las
caractersticas componentes en el contexto global de la cara.
Estos resultados difieren de los encontrados con estmulos diferentes como
objetos, palabras o caras invertidas, que se reconocen con igual precisin cuando se
presentan aisladas o en un contexto global.
Los estudios citados sugieren que las caras se almacenan globalmente en la
memoria, ahora bien, no responden a la pregunta de si las caras se perciben
globalmente. Este es un aspecto muy importante dado que las diferencias en el
reconocimiento de caras con respecto a otras formas visuales como caras invertidas,
objetos o palabras, sugiere que la representacin visual de las caras realizada
inicialmente en la percepcin, puede ser diferente de la representacin de otras formas
visuales.
Farah y cols: realizaron una serie de experimentos en los que incorporaron dos
paradigmas perceptivos en lugar de paradigmas de memoria.
1. Paradigma de atencin selectiva. Se presentaban dos caras simultneamente y
los observadores tenan que indicar si una determinada caracterstica (por ejemplo, la
boca) era igual o diferente en las dos caras.

Los observadores tenan que atender exclusivamente a una determinada


caracterstica e ignorar todas las dems para realizar la tarea.

La lgica que subyace es que si la representacin que proporciona el sistema


visual es una representacin global (una representacin de la cara completa) las
caractersticas a comparar sufrirn interferencia por parte del resto de las caractersticas
componentes (ojos, nariz, pelo, etc.). Como condicin de control se presentaron las
mismas caras invertidas, de forma que se mantuvieran las propiedades geomtricas
(con excepcin de la orientacin) pero no fuera posible una representacin global del
estmulo.

Los resultados mostraron una mayor interferencia en la comparacin de


caractersticas cuando las caras se presentaron en posicin recta que cuando
se presentaron invertidas.
2. Paradigma de Enmascaramiento. Las mscaras presentadas podan ser
caractersticas componentes de las caras o caras completas, y su finalidad era examinar
cul de estos aspectos distorsionaba ms la percepcin de caras.

La idea que subyace es que si las caras se perciben como un todo, la


representacin de las caractersticas componentes desempeara un papel poco
importante en el reconocimiento y, por tanto, las mscaras formadas por caras
completas distorsionaran ms el reconocimiento que las mscaras formadas por
caractersticas componentes.

Los resultados mostraron que la ejecucin en la tarea fue peor cuando la


mscara era una cara que cuando estaba formada por caractersticas
componentes.
Conclusiones: los resultados de los experimentos mostraron que la percepcin de
caras estaba menos basada en la descomposicin de partes, es decir, era ms
global, que la del resto de formas visuales presentadas. Los resultados anteriores
sugieren que las caractersticas componentes de las caras no se procesan o
codifican de forma independiente sino como una configuracin en la que se
perciben los componentes (ojos, boca, nariz, etc.) as como la relacin entre los
mismos y, adems, los cambios en la configuracin influyen en el reconocimiento de las
caractersticas componentes.
III)
DIFERENCIAS ENTRE EL RECONOCIMIENTO DE CARAS Y OBJETOS.
En la actualidad no se conoce todava si estos mecanismos que intervienen en el
reconocimiento de patrones visuales(caras y objetos ) son iguales o diferentes. No
obstante, se dispone en este momento de evidencia emprica que sugiere que el
reconocimiento de caras podra ser un tipo especial de reconocimiento visual. La
evidencia procede de distintos tipos de estudios:
1. A nivel experimental, los resultados de algunos estudios sugieren que las caras
se procesan como un todo, mientras que los objetos y caras invertidas se procesan
en base a sus componentes.
Los resultados sobre reconocimiento de patrones invertidos muestran una
mayor distorsin en el reconocimiento de caras que en el de objetos: si se observa
la fotografa de un rostro o grupo de rostros familiares en posicin recta, no observamos
ninguna dificultad en reconocerlos, pero si se invierte la posicin, la dificultad resulta
muy notable.

La comparacin entre la distorsin que se produce en el reconocimiento de caras y


objetos cuando se presentan invertidos muestra que aunque el reconocimiento de
objetos se distorsiona cuando se presentan invertidos, el empeoramiento es
mucho mayor cuando se tiene que reconocer caras invertidas.
Existen diferencias en el procesamiento de las caras en posicin invertida
o recta:

Cuando las caras se presentan invertidas sus caractersticas componentes


se procesan independientemente y no como una configuracin..
5

PSICOLOGIA DE LA PERCEPCIN
TEMA VIII: RECONOCIMIENTO VISUAL

Las
caractersticas
relacinales
(relaciones espaciales entre las
caractersticas componentes) se distorsionan cuando las caras se presentan invertidas
o con un cambio en la orientacin mayor que noventa grados.

La configuracin se distorsiona ms que las caractersticas componentes


cuando se presentan en caras invertidas y que este efecto se debe a un dficit en la
codificacin de la informacin configuracional.
2. A nivel de substrato neuronal, los estudios realizados con registros
unicelulares en primates, muestran respuesta selectiva a las caras por parte de las
neuronas situadas en el girus fusiforme dl cortex inferotemporal.
3. A nivel neuropsicolgico, los estudios realizados con pacientes que presentan
lesiones cerebrales, muestran una disociacin entre el reconocimiento de objetos
y caras.
Las lesiones en el girus fusiforme del cortex inferotemporal en el hemisferio
derecho, generalmente causan prosopagnosia (incapacidad para reconocer caras)
pero prcticamente no afectan al reconocimiento de objetos. La misma lesin en el
hemisferio izquierdo, causara incapacidad para reconocer objetos, pero deja casi
intacta la capacidad para reconocer caras.
La evidencia procedente de estudios en los que se han utilizado tcnicas de
neuroimagen indica la existencia de distintos componentes modulares en el
reconocimiento visual.
Para algunos autores: el reconocimiento visual se lleva a cabo por medio de la
actuacin de mecanismos especializados en determinados tipos estimulacin y no
mediante un sistema general y comn para todos los tipos de estmulo. Para otros
defienden que la especializacin es superficial ya que el cortex visual contiene un gran
nmero de reas que responden selectivamente a determinados estmulos, pero las
computaciones que se realizan en estas reas son muy semejantes.

Describa brevemente el modelo de reconocimiento por comparacin de


plantillas.
Las
primeras investigaciones sobre reconocimiento visual se centraron en el
reconocimiento de patrones bidimensionales, como letras y nmeros. Para el
reconocimiento de esos patrones se propone que cada carcter alfanumrico debera
haber una plantilla almacenada en la memoria con la cual se comparaba el patrn. Una
posible forma de reconocimiento, consistira en comparar la imagen correspondiente a
un patrn visual nuevo con la plantilla almacenada en la memoria y determinar se ste
encaja o no en la plantilla. Cunto ms se ajustara a la plantilla el patrn ms
probabilidad de que se reconociera.

Seale los problemas del modelo de comparacin de plantillas.


Los problemas estn fundamentalmente relacionados con su falta de economa., por la
infinidad de plantillas que tendramos que tener almacenadas el proceso sera lento y
costoso. Por otra parte cuando los patrones cambiasen de orientacin, tamao o
posicin, o cuando existiera alguna deformacin en los mismos, el reconocimiento no
sera posible.

Describa el modelo del pandemonium.


En el modelo de pandemonium, cada nmero o letra se representa internamente por una
lista de caractersticas locales que definen su forma. Cuando se presenta un patrn
nuevo se hace una lista de sus caractersticas y se compara en paralelo (todas a la vez)
con las listas de sus caractersticas de patrones conocidos almacenadas en la memoria.
Si el patrn nuevo se ajusta a alguna de las caractersticas se reconoce y se clasifica
como perteneciente a una determinada categora. El sistema consta de una serie de
mecanismos o demonios: Los demonios de la imagen, los demonios de las
caractersticas, los demonios cognitivos que actan recogiendo las respuestas anteriores
y buscan combinaciones de caractersticas que definen el patrn de cuyo reconocimiento
son responsables. Si encuentran una serie de caractersticas pertinentes en relacin con
un patrn determinado, envan su informacin al demonio de la decisin que tiene como
funcin proporcionar la respuesta final sobre el reconocimiento.
Seale los problemas del modelo del pandemonium.
Este mecanismo propuesto no es aplicable en muchos casos. El problema es que la lista
de caractersticas no es suficiente para facilitar el reconocimiento. Una dificultad mayor
estara en relacin con el reconocimiento de objetos naturales y patrones ms complejos
que los caracteres alfanumricos. Definir un patrn complejo en base a este tipo de
caractersticas resultara imposible, como tambin lo sera recombinar las caractersticas
elementales de un patrn de esta naturaleza para llegar a una identificacin global del
mismo.
Describa la propuesta de descripciones estructurales.
Las descripciones estructurales incluyen adems de la descripcin de las caractersticas
de un patrn, las relaciones entre las mismas y su disposicin espacial.
Seale los problemas de las descripciones estructurales.
Este modelo presenta problemas cuando existe una gran variedad de objetos
pertenecientes a una misma clase, cuando el objeto se dobla por alguno de sus ejes, o
cuando se les aade alguna parte. En todos estos casos no se puede obtener un buen
ajuste cuando se compara una representacin de estas caractersticas con los modelos
almacenados en la memoria.
Explique en qu consisten las descripciones estructurales basadas en el
objeto.
Las descripciones basadas en el objeto, que incluye en la descripcin, el marco de
referencia perceptivo o eje intrnseco del objeto. As al especificar la relacin de las
partes del objeto con el eje principal del mismo, se mantiene la constancia del objeto.
Defina el marco de referencia perceptivo.
Conjunto de coordenadas espaciales sobre las que se centra una representacin
perceptiva.

Seale los problemas de las descripciones estructurales basadas en el


objeto.
Presenta problemas cuando existe una gran variedad de objetos pertenecientes a una
misma clase, cuando el objeto se dobla por alguno de sus ejes, o cuando se les aade
alguna parte. En todos estos casos, no se puede obtener un buen ajuste cuando se
compara una representacin de estas caractersticas con los modelos almacenados en la
memoria.
Describa brevemente la teora del reconocimiento de Marr y Nishihara.
Esta teora se basa en ejes de coordenadas y se desarroll en el contexto de la
Inteligencia Artificial. La teora intenta ofrecer una explicacin sobre cmo se
6

PSICOLOGIA DE LA PERCEPCIN
TEMA VIII: RECONOCIMIENTO VISUAL
transforman los patrones estimulares en una representacin simblica en la que se
explicitan la forma, orientacin, posicin, movimiento, etc. de los objetos.
Defina los siguientes conceptos: organizacin modular, primitivos
volumtricos, conos generalizados.
Organizacin modular: organizacin en mdulos o mecanismos de procesamiento
independientes.
Primitivos volumtricos: Caractersticas primitivas de una representacin tridimensional.
Conos generalizados: Superficies generadas a partir del movimiento de una seccin
transversal (que puede variar en tamao pero no en forma) a lo largo de un eje principal.
Seale los problemas de la teora del reconocimiento de Marr y Nishihara
La teora propuesta por Marr y Nishihara es un modelo de IA, no un modelo capaz de
explicar el reconocimiento visual humano, por ello sus aplicaciones en el campo de la
Psicologa son limitadas o prcticamente nula. Por otra parte, hay muchos objetos
naturales y ms complejos en los que los primitivos volumtricos propuestos por Marr y
Nishihara no son aplicables, ya que en esta teora no se asume la influencia del
conocimiento previo (procesos de arriba-abajo) sobre el proceso de reconocimiento, el
modelo propuesto dara lugar a errores a la hora de reconocer este tipo de objetos.
Describa el modelo de reconocimiento por componentes.
Este modelo parte de una idea similar a la de los modelos de reconocimiento de palabras
mediante los fonemas. La propuesta bsica es un modelo de reconocimiento basado en
un conjunto finito de primitivos y sus posibles combinaciones, que permiten especificar
los objetos.

Qu son los geones?


Los geones son un conjunto finito (aproximadamente 36) de formas volumtricas
simples. Se proponen cuatro tipos de geones bsicos: esferas, cilindros, bloques y cuas,
para obtener primitivos tridimensionales a partir de imgenes de entrada
bidimensionales.
Qu son las propiedades no accidentales?
Las propiedades no accidentales son caractersticas o aspectos de la estructura de la
imagen que se corresponden con propiedades significativas de los objetos y no
dependen del punto de vista..
Fundamentalmente, simetra, paralelismo, rectitud/curvatura, conexin y coterminacin,
seran las responsables de mantener la constancia del objeto, por ejemplo, la simetra
en el objeto se proyectara en la imagen aunque se adoptaran puntos de vista diferentes.

Comente el cuadro
Extraccin de bordes

Deteccin de propiedades
no accidentales

Segmentacin
cncavas

de regiones

Activacin de geones y relaciones


entre los mismos: determinacin de
los componentes

Activacin de los modelos


objeto:
comparacin
de
componentes
con
representaciones del objeto

del
los
las

Reconocimiento del objeto


El reconocimiento por componentes procedera de la siguiente forma: El primer paso
consistira en la extraccin de borde a partir de los cambios en luminancia. A partir de la
informacin contenida en los bordes, se extraeran las propiedades no accidentales de la
imagen, que sirven para identificar los geones. En paralelo a este paso, se llevara a cabo
un proceso de divisin de los objetos en regiones cncavas, cuyo objetivo es identificar
los geones que componen el objeto. Hasta este punto el procesamiento procedera de
abajo-arriba. Una vez activada la descripcin de los geones del objeto, se activara la
descripcin de los geones almacenados en la memoria y se llevara a cabo el proceso de
comparacin en paralelo, que conduce finalmente a la identificacin del objeto.
Comente las investigaciones sobre:
- Procesamiento de las caractersticas componentes de las caras.
Las primeras investigaciones se realizaron en los aos 70, partan del supuesto terico
de que el sistema visual analizaba las caras basndose en las caractersticas que las
componen (ojos, boca) y a partir de aqu se realizaba una descripcin de la cara sobre
la base de estas caractersticas (ojos azules, nariz afilada)Estudio clsico de Bradshaw
y Wallace (1971) . Construyeron caras variando alguna caracterstica en cada una de
ellas. La tarea de los observadores consista en proporcionar juicios igual-diferentes
sobre dos caras presentadas secuencialmente, es decir, se presentaban dos caras en
intervalos sucesivos y los observadores deban indicar si eran iguales o diferentes.
Los resultados mostraron que el tiempo empleado en emitir un juicio sobre las
diferencias de caras era ms corto cuanto ms caractersticas diferentes se presentaban
en las caras. Los autores concluyeron que las caractersticas de las caras se procesaban
de forma independiente y secuencial y no como una unidad perceptiva.
Estos resultados son poco concluyentes debido a : 1) las demandas de la tarea utilizada
que induce la estrategia de buscar diferencias; 2) las caras que presentan ms
diferencias entre sus caractersticas tambin las presentan globalmente, por lo que no se
puede excluir que el procesamiento se haya realizado globalmente.
- Interaccin entre caractersticas componentes.
Sergent dise una serie de estmulos, que consistan en ocho caras distintas resultantes
de la combinacin de dos barbillas, dos colores diferentes para los ojos, y dos
distribuciones distintas del espacio interno de la cara. En cada ensayo se presentaban
dos caras iguales o distintas en una nica caracterstica o en todas ellas. La tarea de los
observadores consista en pulsar una llave de respuesta si las dos caras eran iguales y
otra distinta si eran diferentes.
7

PSICOLOGIA DE LA PERCEPCIN
TEMA VIII: RECONOCIMIENTO VISUAL
Los resultados confirmaron los obtenidos en estudios anteriores y aadieron un
informacin importante: cuando las caras diferan en una nica caracterstica, las
diferencias se perciban ms rpidamente cuando dicha caracterstica era la barbilla..
Cuando a la diferencia entre barbillas se aada una de las otras dos, la percepcin de la
diferencia entre caras era todava ms rpida. Esto indicara que las caractersticas
componentes de las caras no se percibe independientemente sino que se produce una
interaccin entre las mismas, es decir una influencia mutua.
La interaccin entre caractersticas componentes manipuladas independientemente
explicara algunos efectos del contexto sobre el reconocimiento.
- Procesamiento configuracional de caras.
Se centra en analizar si el procesamiento global de las caras se debe exclusivamente a la
interaccin de las caractersticas componentes o al hecho de que stas no se
representan independientemente en la descripcin que el sistema visual hace de las
caras.
Tanaka y Farah (1993) partieron de la siguiente hiptesis: si las caractersticas
componentes se representan independientemente en la descripcin que el sistema visual
hace de la cara, entonces el reconocimiento de las mismas por separado ser igual
cuando se presenten aisladamente que cuando se presenten en el contexto de una cara.
Por el contrario, si la representacin de las caractersticas no es independiente, se
reconocern peor cuando se presenten aisladamente que cuando se presenten en el
contexto de una cara.
Procedimiento: se presentaron a los observadores una serie de caras y durante una serie
de ensayos tenan que asociar las caras con un nombre determinado. Una vez
aprendidos los nombres de las caras, se presentaban dos pruebas de reconocimiento: en
una de ellas, reconocimiento de caractersticas componentes en un contexto , los
estmulos eran caras que diferan enana nica caracterstica y los observadores tenan
que indicar si esa caracterstica perteneca o no a la cara asociada con un nombre
determinado en la etapa anterior. La otra prueba, reconocimiento de caractersticas
diferentes y los observadores deban indicar cul de ellas perteneca a una cara
determinada.
Resultados: el reconocimiento de caractersticas componentes era peor cuando estas
representaban aisladamente que cuando se presentaban en el contexto de caras.
Conclusin de los autores: la representacin de caras est basada en una descripcin
global de la imagen que lleva a un mejor reconocimiento de las caractersticas
componentes en el contexto global de la cara.
Farh, Wilson, Drain y Tanaka (1998) incorporaron dos paradigmas perceptivos en lugar de
paradigmas de memoria: 1) el sistema de paradigma de atencin selectiva se
presentaban dos caras simultneamente y los observadores tenan que atender
exclusivamente a una determinada caracterstica e ignorar todas las dems para realizar
la tarea. Como condicin de control se presentaron las mismas caras invertidas, de forma
que se mantuvieran las propiedades geomtricas (con excepcin de la orientacin) pero
no fuera posible una representacin global del estmulo. Los resultados mostraron una
mayor interferencia en la comparacin de caractersticas cuando las caras se
presentaron en posicin recta que cuando se presentaron invertidas.
2) Paradigma de enmascaramiento, las mscaras presentadas podan ser caractersticas
componentes de las caras o caras completas, y su finalidad era examinar cul de estos
aspectos distorsionaba ms la percepcin de caras.. En los experimentos adems se
presentaron otras formas visuales como palabras, objetos y caras invertidas. Resultados:
La ejecucin de la tarea fue peor cuando la mscara era una cara que cuando estaba
formada por caractersticas componentes.
En conjunto, los resultados de los experimentos mostraron que la percepcin de caras
estaba menos basada en la descomposicin de partes, es decir, ms global, que la del

resto de formas visuales presentadas. Los resultados sugieren que las caractersticas
componentes de las caras no se procesan o codifican de forma independiente sino como
una configuracin en la que se perciben los componentes (ojos, boca) as como la
relacin entre los mismos y, adems los cambios en la configuracin influyen en el
reconocimiento de las caractersticas componentes (Tanaka y Farh, 2003)
- Seale las principales diferencias entre el reconocimiento de caras y objetos.
La comparacin entre la distorsin que se produce en el reconocimiento de caras y
objetos cuando representan invertidos muestra que aunque el reconocimiento de objetos
se distorsiona cuando se presentan invertidos, el empeoramiento es mucho mayor
cuando se tiene que reconocer caras invertidas.
A nivel neuropsicolgico, los estudios realizados con pacientes que presentan lesiones
cerebrales, muestran una disociacin entre el reconocimiento de objetos y caras. Las
lesiones en el girus fusiforme del cortex inferotemporal en el hemisferio derecho,
generalmente causan prosopagnosia, incapacidad para reconocer objetos, pero deja casi
intacta la capacidad para reconocer caras. La misma lesin en el hemisferio izquierdo,
causara incapacidad para reconocer objetos, pero deja casi intacta la capacidad para
reconocer caras.
Estudios posteriores realizados por Kanwisher et al. (1997) permitieron determinar que
una pequea regin del giro fusiforme derecho, se activa selectivamente durante la
percepcin de caras y no durante la percepcin de objetos.
En la tarea de bsqueda visual se considera que el objetivo y los elementos
distractores difieren en una caracterstica simple cuando el aumento en el nmero de
distractores determina que la deteccin del objetivo:
a
Empeore
b
no vare
c
mejore.
Las intersecciones de lneas, su repeticin y su cierre se consideran
propiedades :
a
Visuales bsicas
b
Configuracionales
c
relevantes.

También podría gustarte