Documentos de Académico
Documentos de Profesional
Documentos de Cultura
5
6
7
Ignacio Serrano Pedraza
8
9
Prólogo
1. Introducción
2. Método
2.1. Aparatos
3. Demostraciones
1. Introducción
2. Método
10
2.1. Estímulos
2.3. Aparatos
3. Resultados: Ejemplo
4. Aplicaciones: Problemas
4.2. Cantidad en la que hay que disminuir la presión sonora en dB SPL para que la
sensación sonora se reduzca en un factor multiplicativo k (O<k<1)
1. Introducción
11
2. Método
2.1. Estímulos
2.3. Aparatos
3. Resultados: Ejemplo
1. Introducción
2. Método
2.1. Estímulos
12
2.3. Condiciones experimentales
2.4. Predicciones
2.5. Aparatos
2.9. Algoritmo para el cálculo de d' y Í supuesto el modelo N-N con varianzas
iguales
3. Resultados: Ejemplo
4. Método
4.1. Estímulos
4.4. Predicciones
4.5. Aparatos
13
4.7. Material audiovisual
5. Resultados. Ejemplo
1. Introducción
2. Método
2.1. Estímulos
2.2. Procedimiento
2.3. Aparatos
2.4. Tarea
14
2.6. Material audiovisual
3. Resultados: Ejemplo
3.4. Comparación con los umbrales de audibilidad estándar (ISO, 1961 y ANSI
2004)
1. Introducción
2. Método
15
2.1. Estímulos
2.2. Procedimiento
2.3. Tarea
2.4. Aparatos
3. Resultados: Ejemplo
1. Introducción
2. Método
2.1. Estímulos
16
2.5. Instrucciones a los sujetos experimentales
3. Resultados: Ejemplo
3.2. Síntesis, utilizando una implementación del sintetizador por formantes de Klatt,
de las cinco vocales del español atendiendo a las consecuencias acústicas que tiene
la articulación diferencial de los distintos segmentos vocálicos
3.4. Mostrar cuáles son los parámetros físicos que usa nuestro sistema perceptivo
para codificar las distintas vocales del idioma
1. Introducción
2. Método
2.1. Estímulos
3. Resultados: Ejemplo
17
3.1. Especificación de los valores de los parámetros de síntesis de los nueve
estímulos utilizados
3.7. Cálculo del valor aproximado donde se localiza el máximo de las funciones de
discriminación
3.8. Justificación de que las funciones obtenidas cumplen con los criterios (a), (b) y
(c) que se han propuesto como definición parcial de percepción categórica
1. Introducción
2. Método
2.1. Estímulos
2.2. Predicciones
18
2.4. Instrucciones para el experimentador
3. Resultados: Ejemplo
3.5. Inspeccionar y describir los resultados obtenidos para el Estímulo 5 (E5). ¿Por
qué es particularmente interesante el análisis de los resultados obtenidos con este
estímulo?
3.6. Aplicaciones
1. Introducción
2. Método
2.1. Estímulos
19
2.2. Variables independiente y dependiente utilizadas en la Práctica
2.4. Aparatos
3. Resultados: Ejemplo
3.2. Estimación y representación gráfica de la fuerza del efecto (FE) en función del
tiempo desde el cese de la adaptación
11. Colorimetría
1. Introducción
2. Método
2.1. Estímulos
20
2.4. Instrucciones para el experimentador
3. Resultados: Ejemplo
3.4. Comparación con los resultados originales obtenidos por Eckert & Carter (2000)
en el caso de pétalos de flores
1. Introducción
2. Método
2.1. Estímulos
3. Resultados: Ejemplo
21
3.2. Predicción de la apariencia de color
1. Introducción
2. Método
2.1. Estímulos
2.2. Procedimiento
2.3. Tarea
3. Resultados: Ejemplo
22
3.6. Comparación con resultados obtenidos en otras especies animales
Referencias bibliográficas
23
24
Este manual de Psicología de la percepción. Prácticas, recoge el contenido de algunas de
las clases prácticas impartidas por la cátedra de Psicología de la Percepción en la
Facultad de Psicología de la Universidad Complutense de Madrid durante los últimos
veinticinco años. Las prácticas de este manual se refieren a fenómenos visuales y
auditivos que son fáciles de presentar sin ayuda de instrumentos complicados y en las
que las respuestas de los sujetos se pueden registrar mediante papel y lápiz. Utilizar
procedimientos de registro más complejos hubiera asegurado la obtención de resultados
más precisos en algunas prácticas, pero al precio de limitar la generalidad de su
aplicación.
Este manual contiene tanto demostraciones, en las que los estímulos se han diseñado
con los valores de los parámetros fijados de modo preciso para producir precisamente el
fenómeno (es el caso de las demostraciones de la Práctica #1 o el efecto McCollough de
la Práctica #10), como prácticas propiamente dichas en las que se varían los parámetros
pertinentes para obtener un resultado conocido y firmemente establecido en la disciplina
(por ejemplo, la medida de las Curvas de Audibilidad de la Práctica #5 o de Sensibilidad
al Contraste espacial de la Práctica #13). Sólo en algunos casos nos hemos arriesgado a
presentar experimentos (manipulación de una variable independiente para registrar su
efecto en una variable dependiente con el objeto de encontrar una relación funcional
entre ellas y/o de probar una hipótesis) como en el caso de la TDS de la Práctica #4 o la
percepción categórica del habla de la Práctica #8.
25
Los conocimientos de cálculo que se requieren para la resolución de algunos ejercicios
y representaciones gráficas son los adquiridos en los cursos de Matemáticas del
Bachillerato español. No hemos creído pertinente hacer uso de contrastes estadísticos
para un análisis ulterior de los resultados.
Imagen de cubierta
26
En general, el ruido visual (máscara) añadido a una imagen dificulta el reconocimiento
de ésta. De modo contraintuitivo, sin embargo, no todo ruido visual añadido a una
imagen enmascara su reconocimiento. Empíricamente el enmascaramiento perceptivo
sucede sólo cuando el ruido visual tiene su espectro de Fourier273 solapado con la banda
de frecuencias espaciales del espectro de la imagen original (fila superior a la derecha) o
adyacente a él, es decir, dentro de la banda crítica para enmascarar la 6. Sin embargo
cuando el ruido visual añadido (con la misma energía) tiene su espectro situado 1.5 a 2
octavas por debajo (fila inferior a la izquierda) o por encima (fila inferior a la derecha), es
decir, fuera de la banda crítica correspondiente a la imagen original, ésta se reconoce
fácilmente ya que no resulta preceptivamente enmascarada 4-6 y se observa, además,
que ambos, imagen original y ruido máscara, se perciben por separado. (Para observar
esos efectos, las imágenes de la portada deben contemplarse a una distancia de 20 cm
aproximadamente). Una explicación plausible de esta falta de enmascaramiento, aún con
la imagen y el ruido superpuestos espacialmente, es que la imagen original y el ruido
máscara no solapados espectralmente son codificados de modo separado e independiente
por distintos canales visuales selectivos a la frecuencia espacial de modo que no se
interfieren perceptivamente6'8. Por el contrario, cuando la imagen original y el ruido
máscara tienen sus espectros de Fourier solapados o adyacentes existe enmascaramiento
porque ambos son codificados por los mismos canales o filtros visuales en los que se
interfieren6 Nótese que ni la descripción del enmascaramiento selectivo ni su explicación
son posibles sin acudir a las características del espectro de Fourier de la imagen original y
del ruido visual, lo que sugiere que la representación espectral, imprescindible en el
estudio de la audición y de la visión del color, es también relevante para el estudio de la
visión espacial. [Demostración de ISP & VSV según idea original de Harmon y Julesz6]
Referencias:
2.Papoulis, A. (1962). The Fourier Integral and its Applications. N. Y.: McGraw-Hill.
3.Bracewell, R. N. (1978). The Fourier Transform and its Applications. N.Y.: McGraw-
Hi11.
5.Harmon, L. D. (1973). The recognition of faces. Scientific American, 229 (5), 70-82.
27
6.Harmon, L, D., Julesz, B. (1973). Masking in visual recognition: Effect of two-
dimensional filtered noise. Science, 180, 1104-1197.
28
29
1. Introducción
30
perceptivos y que para su explicación no son pertinentes las teorías adhoc, sino
que su explicación debe seguirse de las mismas teorías que explican los fenómenos
de la percepción verídica. Dicho de otro modo, cualquier explicación de la
percepción no verídica debería seguirse naturalmente de las operaciones de los
mecanismos que subyacen a la percepción en general. Este enfoque es original de
William James, uno de los fundadores de la Psicología como ciencia, que en The
Principies of Psychology escribe: "Between normal perception and illusion...there
is no break, the process being identically the same in both" (William James,
1890/1981, p. 757) [las cursivas son del propio WJ] y es compartido, entre otros
muchos, por Michael Bach el creador de la exhaustiva página web sobre ilusiones
visuales (http://michaelbach.de/ot/).
2. Método
2.1. Aparatos
CUADRO 1.1.
31
2.2. Instrucciones para el experimentador
32
pueda percibir el fenómeno visual concreto. En algunos casos el experimentador deberá
orientar al observador para que este caiga en la cuenta del fenómeno visual y de este
modo entender la complejidad que tiene la percepción.
Por último, el sujeto experimental debe comprender que las ilusiones perceptivas son
la consecuencia natural del funcionamiento normal de nuestros sistemas sensoriales y
perceptivos, del mismo modo que lo son los fenómenos de la percepción verídica. Es
decir, aunque es cierto que en muchas ocasiones los sistemas sensoriales y perceptivos
fracasan en recoger ciertas propiedades de la realidad (percepción no verídica), esto no
se debe a ningún engaño deliberado por parte de los mismos, toda vez que dichos
sistemas se limitan en todos los casos (percepción verídica y no verídica) a ejecutar las
operaciones que los caracterizan.
3. Demostraciones
33
y la inmediatez de la propia e irreductible experiencia perceptiva son dos de las causas
que hacen que la gente no se dé cuenta de que su percepción es construida por la
actuación de múltiples procesos actuando directamente sobre el estímulo próximo o sobre
representaciones mentales derivadas. Una demostración psicológica convincente de la
existencia de procesos que median en la percepción es la visión de la profundidad con
estímulos artificiales como los estereogramas, anaglifos y autoestereogramas que carecen
de claves monoculares de profundidad como la oclusión, el tamaño relativo, o la textura.
En las respectivas demostraciones se describen los estímulos sintéticos con que los se
logra la visión en profundidad y que muestran que la percepción (en este caso, la visión
3D) es una construcción mental. Esos estímulos visuales proporcionan a los ojos del
espectador dos imágenes diferentes, cada una de las cuales presenta la misma perspectiva
del objeto pero con una pequeña desviación horizontal (o disparidad) entre ellas, de
modo similar a las dos perspectivas que de forma natural reciben los ojos en la visión
binocular. Así se replica artificialmente el par de imágenes bidimensionales que se forman
naturalmente en ambas retinas al mirar una única escena y que son el origen de la
percepción 3D. Cada estímulo se compone de un par de imágenes (bien separadas -
estereogramas-, bien superpuestas espacialmente - anaglifos) o de un patrón visual
repetitivo (autoestereogramas), y de lo que se trata, como sucede naturalmente con la
visión de la escena que se tiene ante sí, es que una de las imágenes del par se proyecte en
un ojo y la otra, en el otro ojo. Lo relevante para estas demostraciones es que (en
algunos casos) se necesita un cierto tiempo para percibir la imagen 3D en todos esos
estímulos, por lo que cabe concluir que algo está pasando hasta construir la visión en
profundidad. Nótese que si el observador padece algún tipo de estrabismo es probable
que carezca de visión estereoscópica. En cada demostración se describe el estímulo y se
indica el procedimiento para percibir en ellos la tercera dimensión.
34
uno con un pequeño desplazamiento horizontal con respecto del otro, con el fin
reproducir artificialmente las dos perspectivas de la escena que, de forma natural, reciben
los ojos en la visión binocular. Aunque el procedimiento estándar para ver la imagen 3D
en este y en cualquier estereograma es utilizar un estereoscopio (Wheatstone, 1838), se
sugiere que para ver la imagen 3D se utilice el procedimiento de fusión libre,
procedimiento en el que el observador debe cruzar los ojos de tal manera que la imagen
de la izquierda sea proyectada en el ojo derecho y viceversa.
35
procedimientos reseñados en la demostración #1.
36
Un anaglifo de puntos aleatorios es un estereograma de puntos aleatorios en el que como
en cualquier anáglifo, cada imagen del par se ha representada con un color diferente y
luego han sido superpuestas en una única imagen. Utilizando el procedimiento adecuado
en el anaglifo de la izquierda se ve la superficie en relieve de la derecha. Para ver la
imagen 3D en este y en cualquier otro anáglifo de puntos aleatorios se usa el
procedimiento reseñado en la demostración #3.
37
posición de los ojos corresponde a la visión de un objeto lejano. Enfocar un objeto
cercano sin que se produzca vergencia de los ojos de modo automático requiere práctica
por lo que algunos observadores encontrarán la tarea muy difícil.
Figuras multiestables
38
modos: es, en definitiva, ambigua. La imagen formada en la retina, por ejemplo, es, en
principio, solo un agregado neutro de intensidades lumínicas en el que los puntos vecinos
pertenecientes al mismo objeto no tienen entre sí mayor afinidad que la que tienen los
puntos que pertenecen a objetos diferentes o al ruido visual. (Se dice "en principio"
porque la estadística de las imágenes naturales muestra una cierta correlación de las
luminancias en el entorno de cada pixel). A pesar de ello, la percepción del entorno es
unívoca y estable, ya que en la mayoría de los casos o la propia configuración de la
estimulación sesga la interpretación en una única dirección o los sistemas sensoriales y
perceptivos aplican reglas para conseguir esa interpretación única. Sin embargo, cuando
debido a la propia configuración se ofrecen varias interpretaciones igualmente plausibles,
esas interpretaciones parecen competir y entonces la percepción se vuelve ambigua o,
como se dice en Psicología de la Percepción, multiestable. Los estímulos visuales de la
demostración #7 son figuras multiestables (propiamente biestables) utilizadas para
mostrar que la percepción es naturalmente inestable, ambigua y reversible. Debe notarse
que en una figura multiestable la representación sensorial suele ser única y que lo múltiple
son las representaciones resultantes de los procesos perceptivos.
39
copa (si se mira a su seno) o alternativamente dos rostros enfrentados (si se mira al tallo
de la copa). B.La anciana y la joven o figura de Boring (versión de la figura de una
tarjeta postal alemana anónima de 1888 creada por el dibujante W.E.Hill en 1915 y
estudiada por Boring en 1930) (Hill, 1915; Boring, 1930). Figura multiestable en la que
se percibe o el rostro de perfil de una anciana o la cabeza de una mujer joven vuelta de
espalda. Si se percibe en principio una mujer anciana, fíjese la mirada en su nariz e
inténtese ver en ella el contorno de la mejilla de una mujer joven vuelta de espaldas; si se
percibe a una joven, fíjese la mirada en la cinta de su cuello e inténtese ver el ella la boca
de una anciana. C.Cubo de Necker (imagen publicada en 1832 por el cristalógrafo suizo
L.A.Necker). Figura multiestable que puede verse hacia delante o hacia atrás. Con una
cierta práctica se puede hacer oscilar mentalmente la figura. D.Figura pato-conejo
(versión de la original de Jastrow, 1899). Figura multiestable en la que si se mira a la
izquierda de la figura, se percibe la cabeza de un pato; si se mira a la derecha, la cabeza
de un conejo.
Imágenes compuestas
40
Demostración #8. Imagen compuesta: Perro dálmata (Fotografía de R.C.James). En
la imagen degradada puede verse la figura de un perro dálmata hozando en el suelo de un
parque y al fondo, un alcorque con el tronco de un árbol. Las personas que ven por
primera vez esa figura la perciben como un patrón aleatorio de manchas irregulares.
Nótese que el contorno del animal no existe físicamente; de hecho existe continuidad
física entre partes que se perciben separadas, como la mancha del suelo y la cabeza del
perro hozando. Además, los cambios de luminancia que permiten trazar los contornos
son localmente indistinguibles de otros cambios no significativos e incluso en algunos
lugares de la imagen son contornos ilusorios (véase la demostración #23). El
procedimiento para percibir la forma global en este y en las cuatro demostraciones que
siguen es intentar verla borrosa, bien desenfocándola de cerca o alejando la imagen. De
cerca, la imagen debe mirarse con visión central entrecerrando los párpados (lo que
modifica la función de dispersión del punto del ojo) para desenfocar a imagen;
alternativamente, la imagen debe alejarse hasta verla borrosa. Esas dos acciones tienen
como resultado eliminar las altas frecuencias espaciales o detalles que dificultan el
reconocimiento de la forma global.
41
Demostración #9. Imagen compuesta. Rostro de un icono de la izquierda socialista
compuesto por logos de empresas capitalistas. De cerca y en detalle se perciben los logos
de conocidas compañías multinacionales; de lejos o en la imagen desenfocada se percibe
el rostro de Ernesto Che Guevara.
42
Demostración #10. Estímulos visuales jerárquicos congruentes (primero y tercero por
la izquierda) e incongruentes (segundo y cuarto) utilizados para estudiar la primacía de la
percepción de la forma global. Nótese que las letras C y U grandes se perciben de forma
inmediata y automática, sin tener en cuenta los micropatrones que las componen (Sierra-
Vázquez, Serrano-Pedraza, & Luna, 2006, Figura 1 según idea original de Navon
(1977)).
Pixelado de imágenes
Objetivo: Mostrar los fenómenos perceptivos producidos por una clase de imágenes
sintéticas muy popular.
43
Demostración #11. Pixelado de imágenes: La imagen del rostro de Hermann von
Helmholtz (Boring, 1942) pixelada en 1024 cuadrados. [Imagen original de Serrano-
Pedraza & Sierra-Vázquez]. Para reconocer la imagen original en una imagen pixelada
sirve cualquier procedimiento para verla borrosa. Los procedimientos sugeridos por la
teoría unicanal de la visión espacial humana son (1) de cerca, las personas con visión
normal o corregida deben intentar desenfocar la imagen pixelada, entrecerrando los
párpados; también de cerca, las personas con miopía deben desenfocarla mirando la
imagen sin las prótesis de corrección; y (2) alternativamente, se debe alejar la imagen
hasta situarla a la distancia adecuada para verla borrosa. El procedimiento basado en la
geometría y topología de la retina humana y sugerido por la teoría multicanal de la visión
espacial humana es (3) mirarla de reojo. El procedimiento sugerido por la teoría
multicanal de la visión espaciotemporal humana es (4) mover la cabeza mientras se mira
de cerca la imagen o alternativamente (5) presentar la imagen pixelada por un tiempo
muy breve. La causa de que con todos estos procedimientos se reconozca la imagen
original es la siguiente: el pixelado de una imagen introduce ruido visual de alta frecuencia
espacial que enmascara el reconocimiento de la imagen original; con cualquiera de los
cinco procedimientos mencionados, el Sistema Visual Humano (SVH) elimina las altas
frecuencias espaciales de la imagen pixelada (es decir, el ruido visual) y selecciona las
frecuencias espaciales relativamente más bajas que son las que contienen la información
sobre la figura original, permitiendo así el reconocimiento de la imagen. [Esos cinco
44
procedimientos se encuentran ya tempranamente enumerados por Harmon (1973),
aunque sin citar las teorías de la visión espacial en los que se basan].
Comentario: Las teorías científicas tienen mayor valor de verdad cuando explican (y
45
predicen) fenómenos contrarios al sentido común (Popper, 1959). Relacionado con el
pixelado de imágenes, aparece el fenómeno contraintuitivo de que una imagen borrosa se
reconoce mejor que una imagen nítida. En efecto, si se miran muy de cerca las imágenes
presentadas en la demostración #15, de modo que los bordes del pixelado aparezcan
totalmente nítidos, con seguridad no se reconocerá los rostros de cuatro personas muy
conocidas y populares. En cambio, si se procede como en el caso del pixelado y se
perciben borrosas, se reconocerán con facilidad los rostros de los Presidentes Obama,
Rodríguez Zapatero, Bush y Aznar. El hecho de que en esas imágenes se reconozcan
mejor los rostros cuando borrosas que cuando nítidas es un fenómeno contraintuitivo
explicado por la teoría unicanal de la visión espacial humana.
Demostración #13. Cuando borroso se reconoce mejor que nítido: pixelado de las
imágenes de los rostros de B.H.Obama, J.L.Rodríguez Zapatero (fila superior), G.
W.Bush y J.M.Aznar (fila inferior). [Imágenes originales de Serrano Pedraza & Sierra
Vázquez]. Imágenes de 512 x 512 píxeles y 8 bits y regiones o bloques de promediado de
46
32x32 píxeles. Para reconocer los rostros, las imágenes deben verse borrosas utilizando
uno cualquiera de los procedimientos descritos en la demostración #11. Véase también en
la descripción de esa demostración la razón del reconocimiento de estos rostros cuando
se suavizan las imágenes.
Cuando de lejos se ve más que de cerca y mucho más lejos deja de verse
Demostración #14. Cuando de lejos se ve mejor que de cerca y mucho más lejos deja
de verse [Imagen original de Serrano-Pedraza & Sierra-Vázquez según idea de Campbell
& Maffei (1974)]. La imagen muestra un enrejado sinusoidal cuyo contraste se va
reduciendo progresivamente de abajo a arriba hasta que las franjas son imperceptibles. Si
se observa muy de cerca la imagen, la longitud percibida de las franjas (desde la base
hasta que dejan de percibirse) se reduce considerablemente; al alejarse la longitud se va
47
incrementando hasta una distancia a partir de la cual la longitud de las franjas comienza
nuevamente a reducirse; de lejos las barras dejarán de ser percibidas de tal modo que la
imagen se percibirá enteramente gris.
Enmascaramiento selectivo por ruido visual (Harmon & Julesz, 1973) (Fenómeno
perceptivo que revela la existencia de bandas críticas en la visión espacial humana)
Comentario: En los emocionantes días de la década de los setenta del pasado siglo ("in
the heady days of the 1970s") (las palabras son Thompson & Burr, 2009) uno de los
acontecimientos más relevantes en psicofisica visual fue el descubrimiento de la
existencia de mecanismos (o canales) visuales sensibles a la frecuencia espacial de las
imágenes (del mismo modo que ya se conocía la existencia de filtros auditivos
sintonizados a las frecuencias temporales de los sonidos). En las demostraciones de #8 a
#13 el hecho de que la eliminación de todo el ruido visual facilite el reconocimiento
puede hacer pensar que para enmascarar perceptivamente una imagen es necesario todo
el ruido introducido por el pixelado. Sin embargo, la eliminación selectiva de parte del
espectro del ruido permite revelar cuáles son las frecuencias espaciales más efectivas
para enmascarar una imagen. Como puede apreciarse en las imágenes de la demostración
#15, las frecuencias espaciales del ruido más efectivas para el enmascaramiento son las
adyacentes al espectro de la imagen original (e) mientras que las frecuencias espaciales
dos octavas más altas tienen poco efecto sobre la imagen (d). La teoría multicanal de la
visión espacial humana proporciona una explicación plausible de estos hechos, basada en
la codificación de esas imágenes por los canales visuales de frecuencia espacial
descubiertos mediante métodos psicofisicos. En el caso (d) no existe enmascaramiento
perceptivo, aún con la imagen y el ruido superpuestos espacialmente, porque imagen
original y ruido máscara son codificados de modo separado e independiente por distintos
canales visuales de frecuencia espacial. Sin embargo, cuando la imagen original y el ruido
máscara tienen sus espectros de Fourier solapados o adyacentes como en (e) existe
enmascaramiento porque ambos son codificados por los mismos canales visuales en los
que se interfieren. [Se ha utilizado la figura original de Harmon y Julesz (1973) solo por
razones históricas y como homenaje a estos dos autores. La portada de este Manual de
Prácticas es un ejemplo de que ahora es fácil replicar la demostración original con
cualquier imagen].
48
Demostración #15. Enmascaramiento selectivo con ruido visual y demostración de la
existencia de canales de frecuencia espacial en la visión humana [Harmon, L. & Julesz,
B. (1973), Masking in visual recognition: Effect of two-dimensional filtered no¡se.
Science, 180, 1194-1197. Figura 1. © Copyright AAAS 1973. Figura reproducida con
permiso]. a. Retrato de Abraham Lincoln pixelado en 20x20 regiones o bloques. La
máxima frecuencia espacial de la imagen original es de aproximadamente 12
ciclos/anchura de la imagen (c/i), sin embargo el pixelado introduce ruido visual con
frecuencias espaciales superiores a 12 c/i. b. Filtrado paso-bajo numérico de la imagen
pixelada que mejora el reconocimiento. El filtrado ha eliminado todas las frecuencias
espaciales superiores a 12 c/i. Precisamente el efecto de cualquiera de los procedimientos
mencionados en la demostración #11 para reconocer la figura original es realizar
biológicamente un filtrado paso-bajo análogo a este filtrado numérico. c. Resultado de
49
eliminar las frecuencias espaciales superiores a 40 c/i. Las frecuencias espaciales
adyacentes entre 12 c/i y 40 c/i no han sido eliminadas. La percepción del rostro mejora
solo ligeramente. d. Resultado de eliminar las frecuencias espaciales del ruido solo entre
12 c/i a 40 c/i. El rostro de Lincoln es fácilmente reconocible. Nótese que a una cierta
distancia las imágenes b y d son indistinguibles, mientras que a esa misma distancia en las
imágenes a y c se sigue percibiendo el pixelado.
50
Demostración #16. Imagen híbrida: Aznar y Rodríguez Zapatero. [Imagen original de
Serrano Pedraza & Sierra Vázquez]. De cerca se percibe el rostro de J. L. Rodríguez
Zapatero, de lejos el de J.M.Aznar.
Objetivo: Mostrar que la experiencia perceptiva no es una copia del entorno y que,
aunque la mayoría de las veces esa experiencia recoge de modo fidedigno las propiedades
físicas del mundo real, algunos patrones estimulares dan lugar a una experiencia
perceptiva errónea. Este objetivo es común a todas las demostraciones que siguen.
51
alteración perceptiva afecta a la geometría de la imagen (es decir, a su forma, tamaño,
longitud, u orientación). Ilusiones de este tipo son las de Müller-Lyer, Ponzo, Delboeuf,
Poggendorff, Hering, Ehrenstein, Zóllner, entre muchas otras, y cuyas versiones más
corrientes se representan en la demostración #17 [Véase Robinson, 1972, para un listado
exhaustivo de ilusiones visuales geométricas].
52
Demostración #17. Ilusiones visuales geométricas. A.Versiones estándar de las
ilusiones visuales geométricas más conocidas: Müller-Lyer, Ponzo, Delboeuf,
Poggendorff, Hering, Ehrenstein. [Véanse las referencias a los trabajos originales en
Sierra-Vázquez y Serrano-Pedraza (2011)]. La ilusión de Müller-Lyer (a), la más famosa
de todas las ilusiones geométricas, consiste en que dos segmentos de igual longitud, se
perciben con longitud diferente (más largo el que está limitado por las puntas de flecha
hacia adentro que el limitado por puntas de flecha hacia fuera). La ilusión de Ponzo (b)
consiste en que dos segmentos paralelos de igual longitud entre líneas convergentes se
perciben con distinta longitud. La ilusión de Delboeuf (c) consiste en que un círculo de
igual tamaño rodeado y rodeando otros círculos, se percibe con tamaño distinto. La
ilusión de Poggendorf (d) consiste en que dos segmentos oblicuos colineales separados
por dos líneas paralelas se perciben como pertenecientes a líneas rectas diferentes. La
ilusión de Hering (e) consiste en que dos líneas rectas paralelas insertas en un patrón de
líneas radiales se perciben curvadas hacia afuera en el centro (en la versión de Wundt las
líneas radiales divergen y las líneas paralelas se perciben curvadas hacia adentro). En la
ilusión de Ehrenstein (f) un cuadrado inserto en un patrón radial se percibe o como un
trapecio o como un cuadrado girado en profundidad. B.Versión estándar de la Ilusión de
Zóllner. La ilusión de Zóllner consiste en que líneas paralelas oblicuas cortadas por
segmentos horizontales y verticales se perciben como convergentes y divergentes.
53
demostraciones que siguen [Véase Robinson (1972) para un listado exhaustivo de
ilusiones visuales de brillo o de contraste].
54
Demostración #20. Ilusión visual de contraste: Parrilla de Hermann (Hermann, 1870).
Si se mira fijamente al centro de la imagen, aparecen puntos negros ilusorios en las
intersecciones de las bandas claras. La ilusión es más intensa en las regiones periféricas
que en el punto de fijación.
Demostración #21. Ilusión visual de contraste: Bandas de Mach (Mach, 1865; Ratliff,
55
1965, 1972). [Figura original de Serrano-Pedraza & Sierra-Vázquez]. Las bandas de
Mach son las estrechas franjas ilusorias (una más oscura, la otra más clara) que se
perciben en los lugares en los que el perfil de luminancia en forma de rampa (dibujado en
la parte superior) se une con las áreas uniformes oscura y clara. En la figura, la posición
de cada banda ilusoria está señalada con una flecha.
56
Demostración #23. Ilusión visual de contraste: Contornos ilusorios o contornos
cognitivos Triángulo de Kanizsa (Kanizsa, 1986). El triángulo de Kanizsa está compuesto
por los contornos ilusorios que forman los lados de un triángulo también ilusorio, más
claro (a la izquierda) o más oscuro (a la derecha) que el fondo, aunque la superficie de la
figura triangular ilusoria es físicamente uniforme con el fondo. Nótese que, a diferencia
de las ilusiones de contraste anteriormente descritas, en este caso, la ilusión de contraste
se produce sin que existan cambios físicos de luminancia.
Post-efectos acromáticos
57
Demostración #24. Post-efecto acromático: Post-efecto de orientación (Stromeyer,
1978, Figura 4 A). [Thompson, M. & Burr, D.(2009).Visual aftereffects. Current
Biology, 19 (1), R11-R14. Figura 2. © Copyright Elsevier, 2009. Figura reproducida con
permiso]. En su versión estándar, el post-efecto de orientación consiste en que la
adaptación a franjas paralelas inclinadas (estímulo adaptador) en una dirección tiene
como efecto que franjas verticales de un estímulo test se perciban inclinadas en la
dirección opuesta a la del estímulo adaptador. El procedimiento para lograr el postefecto
es el siguiente: compruébese que la mitad derecha de la imagen tiene líneas rectas
verticales (estímulo test); tápese esa mitad; mírese durante treinta segundos a la mitad
izquierda de la imagen (estímulo adaptador que tiene líneas inclinadas parale- las)
moviendo los ojos a lo largo de la línea horizontal central; destápese la parte derecha y
mírese a la línea horizontal del estímulo test. Por un breve tiempo se percibirá ahora las
líneas rectas (antes percibidas como verticales) inclinadas en direcciones opuestas a las
del estímulo adaptador.
58
Demostración #25. Post-efecto acromático: Post-efecto acromático de figura o post-
imagen acromática. Imagen posterizada (estímulo visual adaptador) para producir una
post-imagen acromática negativa (es decir, con el contraste invertido) de la imagen de
Sta. Teresa de Lisieux. Como prueba de la popularidad de este tipo de fenómenos
perceptivos, la imagen procede de una estampa muy difundida editada en el año 1940
para ayudar a las Misiones de la Iglesia Católica y que fue adquirida en un puesto
ambulante del Rastro de Madrid. La imagen, estática, toscamente dicotomizada en sus
niveles de gris y con el contraste invertido, es óptima para producir la postimagen
negativa correspondiente. Además, las instrucciones insertas en la propia estampa son
absolutamente precisas (e inteligibles por todos) para producir la postimagen: "Maravilla
de Optica//Advertencia sobre esta lmaen/ Fije Vd. la vista sobre los tres pequeños puntos
blancos del rostro, cuente (/despacio/) hasta 60; mire al cielo o a una pared, - cuente
hasta cinco con la vista fija y verá la imagen de la Santa subir". Al mirar fijamente al
estímulo adaptador procúrese no parpadear. Durante un tiempo breve, lo que se percibe
en el campo uniforme después de la adaptación es una imagen en escala de grises, con el
contraste de la imagen original y dinámica.
Post-efectos cromáticos
59
Comentario: En los post-efectos cromáticos la adaptación a un estímulo cromático
tiene como consecuencia la percepción del mismo color (post-efecto homocromático) o
del color complementario (post-efecto heterocromático) en una superficie blanca
uniforme. En la demostración #26 se consigue el post-efecto de color heterocromático.
Cuando, como en la demostración #25, el estímulo adap tador tiene categoría de figura,
el post-efecto cromático correspondiente recibe el nombre de post-imagen cromática
(demostración #27).
60
Demostración #27. Post-imagen cromática. Imagen (estímulo visual adaptador) para
producir como post-imagen cromática la actual bandera constitucional de España, cuyo
diseño y colores fueron elegidos por Carlos III en 1785 con el objetivo de distinguir a lo
lejos los buques de la Armada española. Para obtener la post-imagen, procédase como se
describe en la demostración #25, mirando a la cruz central durante aproximadamente un
minuto y a continuación fijando la mirada en una superficie uniforme blanca.
61
Demostración #28. Ilusión visual de movimiento: Ilusión de Pinna-Brelstaff. En la
imagen (Pinna & Brelstaff, 2000) aparecen dos anillos concéntricos compuestos por
elementos con forma romboidal. Todos esos elementos están estáticos. Sin embargo, si
se mueve la cabeza hacia la imagen o se aleja de ella, se produce una fuerte impresión de
movimiento circular en el que los anillos se mueven en sentidos opuestos.
3.2.4. Visión espacial, sensibilidad visual temporal, del color y del movimiento
Demostración #29. Ilusión de Hinton (también llamada Lilac Chaser illusion o ilusión
de los perseguidores del lila) (J.L.Hinton & M.Bach, ©2005-2010;
http://michaelbach.de/ot/col_lilacChaser/index.html). El estímulo se compone de once
discos borrosos (como manchas) de color magenta (o lila) dispuestos en un círculo sobre
un fondo de color gris, cada uno de los cuales aparece y desaparece físicamente sin
cambiar de posición y sucesivamente (o sea, en presentación estroboscópica) y en la
dirección de las agujas del reloj. Cuando se mira fijamente a la cruz central, sucede lo
siguiente: primero se percibe un hueco gris moviéndose con los discos de color magenta
62
presentes, después se percibe un disco de color verde muy saturado que se mueve, en
lugar del hueco, con los discos de color magenta y finalmente (aproximadamente a los
veinte segundos), los discos de color magenta desaparecen y solo se percibe la mancha
de color verde (¡algo que no está físicamente presente en el estímulo!) moviéndose
alrededor del punto de fijación. Cuando se desplaza la mirada de la cruz de fijación, las
manchas de color magenta reaparecen otra vez y se percibe el hueco gris moviéndose. La
ilusión de Hinton es un fenómeno perceptivo muy complejo consecuencia de la
combinación del movimiento aparente, la existencia de postefectos de color
heterocromáticos y el efecto o desvanecimiento de Troxler (efecto que consiste en que
cuando se mantiene fija la mirada en un punto particular, después de unos veinte
segundos, estímulos alejados de ese punto, en la periferia del campo visual, se van
desvaneciendo hasta desaparecer).
Sujeto experimental:
NOMBRE.......................................................................................
63
consiguiente experiencia perceptiva.
1.5. Defina imagen pixelada y describa uno cualquiera de los fenómenos perceptivos
relacionado con ellas.
1.6. Enumere los cinco procedimientos reseñados en la demostración #11 para reconocer
la imagen global en una imagen pixelada (asócielos con la correspondiente teoría de
la visión humana).
64
1.7. Describa el fenómeno perceptivo que sucede cuando ve la imagen de la
demostración #14 muy, muy cerca y la va alejando progresivamente.
1.8. Indique una condición suficiente para que una imagen ruidosa enmascare
perceptivamente a otra.
1.9. Indique la causa, según la teoría multicanal de la visión espacial humana, por la que
ruido visual cuyo espectro de Fourier se solapa con el de la imagen original o es
adyacente a él, enmascara a esa imagen.
65
1.10. Defina imagen híbrida y describa el fenómeno perceptivo relacionado con esa clase
de imágenes.
2.2. Describa una cualquiera de las ilusiones visuales de contraste de las demostraciones
#18 a #23.
66
2.3. Describa el post-efecto acromático de figura de la demostración #25.
67
68
1. Introducción
69
y ruido blanco, en el rango 0.60-1 (Poulton & Stevens, 1955) y a=0.67 para un tono de
3000 Hz (Stevens, 1970 y 1975). Nótese que tomando logaritmos en ambos miembros,
resulta:
Esta ecuación también se puede expresar del siguiente modo (Figura 2.1B):
2.Calcular del valor de los parámetros a y b para cada persona del grupo.
70
Figura 2.1. Representación gráfica de la ley potencial de Stevens para la percepción de la
sonoridad A.Gráfica en escala lineal de la ley potencial de Stevens para la percepción de
la sonoridad, en sones, en función de la presión sonora en dinas/cm2 (b=10 a=0.60).
B.Gráfica que representa la ley potencial de Stevens para la sonoridad (en sones) en
función del nivel de presión sonora en dB SPL utilizando los mismos valores para los
parámetros b y a que en el gráfico A.Nótese que el eje de ordenadas está graduado en
escala logarítmica.
2. Método
2.1. Estímulos
71
Se utilizarán 27 estímulos sonoros. Cada estímulo es un ruido blanco Gaussiano, es decir,
un sonido cuyo espectro de amplitud es uniforme, con nivel No en dB y cuyo espectro
de fase es aleatorio con fdp uniforme entre los valores (-ir,ir). Los sonidos son originales
y han sido generados utilizando MATLAB dentro del ran go 1-22050 Hz. La frecuencia
de muestreo utilizada para generar los estímulos fue de 44100 Hz. Los ruidos se han
generado con 9 niveles de presión sonora No=0, ±5, ±10, ±15, ±20 dB con relación al
nivel depresión sonora del ruido de referencia. Cada nivel se presentará tres veces.
72
producida por el estímulo test teniendo en cuenta la sensación sonora producida por el
estímulo de referencia.
2.3. Aparatos
1.El nivel de cada estímulo test está fijado de modo que su nivel de presión sonora en
dB con relación al sonido de referencia es el adecuado, sea cual sea el valor de la
presión sonora absoluta en dinas/cm2 del estímulo de referencia en la
presentación. Por ello, la relación entre estimación y nivel de presión sonora en dB
será siempre lineal, sean dB sin más o dB SPL (véase más adelante).
3.Sin embargo, para comparar los resultados obtenidos en esta Práctica con los
resultados estándar, se pueden seguir dos estrategias:
a)Usar un sonómetro para medir la presión sonora (dB SPL) del estímulo de
referencia, siendo el valor recomendado 30 dB SPL. [Véase la columna N del
Cuadro 2.2].
73
En el directorio MATERIAL PRACTICA 2 se encuentran dos archivos de audio con
extensión wav con el siguiente contenido:
2. Practica2 Archivo de audio que contiene las veintisiete parejas de ruido blanco. En
todas las parejas, el primer ruido tiene el nivel de presión sonora de referencia y el
segundo es el estímulo test cuya sonoridad hay que estimar respecto a la del ruido
de referencia.
-Solo en caso de no utilizar sonómetro para la calibración del volumen del equipo:
Ahora vais a escuchar un ruido al que voy a bajar el volumen hasta que sea
apenas audible. Decidme cuando dejáis de oírlo. [El experimentador presenta el
fichero de audio Practide
-Si consideráis que el ruido test se oye con el doble de sonoridad escribiréis 200, si se
oye con la mitad, 50.
74
- No os preocupéis demasiado por la precisión, ni en intentar cálculos mentales
complicados, solo escribid la respuesta que os venga espontáneamente a la cabeza.
-Anotad la respuesta en la casilla correspondiente de las filas Lesti_m del Cuadro 2.1.
Estáis todos preparados. Empezamos. [El experimentador presenta el fichero de
audio Practica2 Experimento.wavl.
La ley potencial de Stevens relaciona la sonoridad con una medida absoluta de la presión
sonora, no con la medida relativa en dB, que es como vienen expresados los estímulos en
esta Práctica. El objetivo de la deducción siguiente es expresar la estimación general de la
sonoridad (L) en función de la presión sonora en dB SPL (N). Luego, tomando
logaritmos en ambos miembros de la expresión resultante, se obtendrá una relación lineal
que permitirá aplicar los procedimientos conocidos de regresión lineal para la estimación
de los parámetros.
y que:
por lo que:
75
Haciendo:
se obtiene:
Recordando que:
se obtiene finalmente:
76
en el Cuadro 2.2 el proceso del cálculo del valor de los parámetros de la propia ley de
Stevens para la estimación de la sonoridad. Para que las estimaciones de los parámetros
de la ley de Stevens sean comparables con los valores estándares, los valores de la
sonoridad estimada en unidades relativas, Le1tim hay que transformarlos en sonoridad
medida en sones, L, mediante la ecuación:
3. Resultados: Ejemplo
CUADRO 2.1.
3.2. Cálculo del valor de los parámetros de la ley de Stevens correspondiente al sujeto
experimental
En el Cuadro 2.2 aparece el proceso de cálculo del valor de los parámetros de la ley de
77
Stevens correspondiente al sujeto experimental.
CUADRO 2.2.
78
En el Cuadro 2.3 aparecen los valores de los parámetros de la ley de Stevens
correspondientes al sujeto experimental del ejemplo.
CUADRO 2.3.
Por ello, la ley de Stevens para la percepción de la sonoridad, en sones, para el sujeto
experimental es:
Análisis:
con b=11.37, Pré 0.0002 dinas/cm2, a=0.618. Puesto que la gráfica es una línea recta,
para representarla basta encontrar las coordenadas de dos puntos; por ejemplo, para
N=10, L=0.12 y para N=50, L=2.06. [Por favor, trácese la recta en todo el gráfico, ¡no
utilice como límites los puntos que han servido para trazarla!].
79
Figura 2.3. Representación gráfica de los resultados experimentales y de la ley potencial
de Stevens para la ercepcións de la sonoridad. A.En el panel se muestran la estimación
de la onoridadpen sones (círculos) en función del nivel de presión sonora en dB SPL y la
gráfica (línea recta) de la función que ajusta esos datos obtenida por regresión lineal.
B.En el panel se muestran, en escala lineal-lineal, la estimación de la sonoridad en sones
(círculos) en función de la presión sonora en dinas/cm2 y la curva de la función potencial
(ley de Stevens) para el sujeto experimental que relaciona la estimación de la sonoridad
80
en sones y la presión sonora (b= 11.37, a=0.618).
4. Aplicaciones: Problemas
4.1. Decrementos en presión sonora (escala absoluta) desiguales, razón aja o variable?
entre sensaciones
Demonstration #4, The decibel scale. Houtsma, A.J.M., Rossing, T. D., Wagenaars,
W.M. (1987). Tracks #8-11.
-Escucharéis ruido blanco de banda ancha cuya potencia sonora se reduce en pasos
de 6, 3 y 1 db SPL. Las demostraciones para cada paso se presentan dos veces.
Problema
Resultados
81
anterior es aproximadamente igual a 0.90, es decir percibe los ruidos casi con la misma
sonoridad, pero un poquito más débiles.
por ello:
Resulta que si a=0.60 como valor estándar y 8=1 dB SPL, como en la tercera serie de
la demostración, entonces:
lo que significa que (i) aunque físicamente el factor de decrecimiento en presión sonora
(dinas/cm2) es variable de un ruido al siguiente, la ley potencial predice que
subjetivamente el decrecimiento se ha de percibir como fijo y (ü) que en el caso de
8=1dB SPL, el siguiente ruido se oye con casi igual sonoridad que el anterior, pero un
poquito más débil en sonoridad ¡confirmando la experiencia fenoménica! [Nota
importante: Para cada sujeto experimental se debe usar su propio exponente y comprobar
si sus estimaciones empírica y teórica son consistentes].
4.2. Cantidad en la que hay que disminuir la presión sonora en dB SPL para que la
sensación sonora se reduzca en un factor multiplicativo k (O<k<1).
82
En una noticia aparecida en un diario de difusión nacional (El País) se informa de que
un grupo de científicos de diversas instituciones españolas, incluidas Universidades y
CSIC, se reunieron para elaborar un reglamento acerca de la potencia sonora de señales
acústicas urbanas. El encabezado de la noticia es que "Las sirenas de alarmas tendrán
que reducir en un 10% su potencia". La noticia precisa que "La Comisión ha llegado a la
conclusión de que rebajando en 10 dB la potencia sonora (de las sirenas) `la función de
señales de alerta se cumple perfectamente y la sensación sonora de las personas se
reduce a la mitad'". Las informaciones periodísticas de una noticia científica o
tecnológica raras veces la recogen de modo fidedigno. Se supone que ese grupo de
científicos y técnicos se reunirían para algo más sofisticado que para alcanzar la
conclusión que aparece destacada en la nota, puesto que, conocida la ley de Stevens para
la percepción de la sonoridad junto con el valor del exponente, el cálculo de la solución
es, como se verá, casi trivial. A continuación se generaliza el problema y se plantea el
caso general.
Problema
Calcúlese la cantidad en que hay que rebajar o disminuir la presión sonora en dB SPL
para que la sonoridad se reduzca en un factor multiplicativo k ,0<k<l. (Nótese que en el
caso de la noticia k=1/2).
Solución
Sea D la cantidad en dB SPL que hay que disminuir la presión sonora N, en dB SPL,
para que la sonoridad se reduzca en un factor k. La ley de Stevens relaciona la
sonoridad, L, con la presión sonora P, en dinas/cm2; por lo tanto, es necesario calcular la
expresión que relaciona la sonoridad con la presión sonora, en dB SPL, N.Se sabe que:
y que:
83
Ahora es posible enunciar formalmente el problema. En efecto, el objetivo es
encontrar D tal que:
Desarrollando el exponente:
Así pues, con un exponente estándar igual a 0.60 hay que reducir la presión sonora en
10 dB SPL aproximadamente para que la sensación sonora se reduzca a la mitad, que es
la conclusión a la que llegó la Comisión según la nota aparecida en el diario.
Sujeto experimental:
NOMBRE.......................................................................................
84
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde).
RESULTADOS [3]
[CUADRO 2.2.]
85
Valores de los parámetros de la ley de Stevens para el sujeto experimental
[CUADRO 2.3.]
Por ello, la ley de Stevens para la percepción de la sonoridad, en sones, para el sujeto
experimental es
Análisis:
86
Función representada en la Figura 2.3B:
87
Representación gráfica de los resultados experimentales y de la ley potencial de Stevens
para la percepción de la sonoridad. A.En el panel se muestran la estimación de la
sonoridad en sones (círculos) en función del nivel de presión sonora en dB SPL y la
gráfica (línea recta) de la función que ajusta esos datos obtenida por regresión lineal.
B.En el panel se muestran, en escala lineal-lineal, la estimación de la sonoridad en sones
(círculos) en función de la presión sonora en dinas/cm2 y la curva de la función potencial
(ley de Stevens) para el sujeto experimental que relaciona la estimación de la sonoridad
en sones y la presión sonora (b=.......... a=..........). [FIGURA 2.3.]
88
Decrementos en presión sonora (escala absoluta) desiguales, razón ¿fija o variable? entre
sensaciones [4.1]
Resultados
Solución:
Cantidad en la que hay que disminuir la presión sonora en dB SPL para que la sensación
sonora se reduzca a la mitad [4.2]
89
Calcúlese la cantidad en la que hay que reducir la presión sonora en dB SPL para que
la sonoridad se reduzca a la mitad. Compárese el resultado con la conclusión de la
comisión de técnicos e indíquese la causa del acuerdo o de la discrepancia. [Nota:
Resuélvase el problema directamente y no mediante la fórmula final encontrada en el
texto principal. Utilícese esa fórmula solo para verificar la solución propia].
Solución:
90
91
92
1. Introducción
93
la oscuridad el exponente estándar es a=0.33 y para un estímulo que es un punto brillante
es a=0.5 (Stevens, 1970 y 1975, Stevens & Stevens, 1963). Nótese que tomando
logaritmos en ambos miembros, resulta:
La ley de Stevens estándar para la percepción del brillo (en brils) en escala lineal
(Figura 3.1A) es (Stevens & Stevens, 1963, Pokomy, & Smith, 1986):
Esta ecuación también puede ser representada utilizando una escala en dB:
En escala log-log, la ley de Stevens para la percepción del brillo (Figura 3.1B) es:
94
Figura 3.1. Representación gráfica de la ley potencial de Stevens para la percepción del
brillo A.Gráfica en escala lineal de la ley potencial de Stevens para la percación del brillo
en brils, en función de la luminancia, en cd/m2 (b=6.82, a=0.33). B.Gráfica de la misma
ley en escala log-log.
95
(sujeto experimental).
2.Calcular los valores de los parámetros a y b para cada persona del grupo.
2. Método
2.1. Estímulos
Se utilizarán 27 estímulos visuales que son imágenes de círculos luminosos con diferentes
niveles de luminancia. Las imágenes son originales y han sido generadas con MATLAB.
Se utilizarán 9 niveles relativos de luminancia (niveles de gris) (L = 8, 16, 32, 64, 128,
192, 224, 240, 248) y se realizarán tres presentaciones por cada nivel de luminancia L.
96
Figura 3.2. Ejemplos de imágenes usadas en el experimento. El círculo de la izquierda en
ambas imágenes muestra el estímulo con el brillo de referencia; el círculo de la derecha
de la imagen A muestra el estímulo con el brillo más débil de todos, el círculo de la
derecha de la imagen B muestra el estímulo con el brillo más intenso de todos.
97
Figura 3.3. A.Ejemplo de un ensayo o presentación. A la izquierda de la imagen, círculo
con el brillo de referencia; a la derecha, círculo cuyo brillo hay que estimar con relación
al de referencia. B.Ejemplo de ruido blanco utilizado entre presentaciones para eliminar
posibles post-efectos no deseados.
2.3. Aparatos
Se ha creado un archivo (véase Material audiovisual en §2.5) que contiene una película
con extensión avi suponiendo que el dispositivo de presentación de imágenes no está
calibrado. En general, los dispositivos de presentación de imágenes vienen por defecto sin
calibrar por lo que la relación entre los valores (voltaje) de la imagen y la luminancia (en
cd/m2) emitida no es lineal. Para corregir la luminancia se utiliza un procedimiento
denominado corrección gamma y para el cual es necesario la utilización de un fotómetro
a fin de medir la relación real entre voltaje y luminancia. Como seguramente no se habrá
realizado la corrección gamma en el sistema de presentación de imágenes, el fichero
PracticaExperimento.avi se ha generado asumiendo un valor típico para el exponente
gamma de 2.3 de tal manera que al presentar esta película con un sistema de proyección
o en un monitor no calibrados la luminancia estará aproximadamente corregida (véanse
más detalles en el apartado siguiente).
98
imágenes, cada una con dos círculos: el círculo de la izquierda en ambas imágenes
muestra el estímulo con el brillo de referencia; el círculo de la derecha en la
primera imagen muestra el estímulo con el brillo más débil posible, el círculo de la
derecha de la segunda imagen muestra el estímulo con el brillo más intenso
posible.
2. Practica3 Archivo de vídeo que contiene una película con las 27 presentaciones,
que son imágenes con parejas de círculos. En cada presentación, el círculo de la
izquierda es el de referencia que tendrá siempre el mismo brillo y, al lado, un
segundo círculo cuyo brillo hay estimar con respecto al de referencia. Entre cada
presentación se presenta una imagen de ruido blanco. El nivel de gris de las
imágenes está modificado para que al presentarlas con un sistema de proyección o
en un monitor no calibrados (no linealizados) los niveles de luminancia (niveles de
gris) sean los adecuados (7=2.3 y corrección realizada usando el procedimiento
descrito por Pelli & Zang (1991) ecuaciones (9) y (10)).
-Primero veréis dos imágenes como las mostradas [El experimentador presenta los
ficheros Practica3Mínimo. jpg y Practica3Máximo. jpg]. Aquí veis el estímulo de
referencia junto con el estímulo test con luminancia más débil y el estímulo de
referencia junto con el test más intenso.
-Vuestra tarea es registrar en el Cuadro 3.1 el número que según vuestra opinión
refleja mejor la relación entreel brillo de la imagen de referencia y la otra imagen
de cada pareja.
99
-No os preocupéis demasiado por la precisión, ni en intentar cálculos mentales
complicados, solo escribid la respuesta que os venga espontáneamente a la cabeza.
Se sabe que:
Haciendo:
se obtiene:
que pone de manifiesto la relación lineal entre log Br y log L.Puesto que L (luminancia) y
Br (brillo estimado) son conocidos, A y B pueden estimarse ahora por procedimientos
elementales de regresión lineal. Haciendo:
100
Recordando que,
3. Resultados: Ejemplo
En el Cuadro 3.1 aparece el brillo estimado (Br) por la persona ejemplo (sujeto
experimental) en cada presentación.
CUADRO 3.1.
3.2. Cálculo del valor de los parámetros de la ley de Stevens correspondiente al sujeto
experimental
En el Cuadro 3.2 aparece el proceso de cálculo del valor de los parámetros de la ley de
Stevens correspondiente al sujeto experimental.
101
CUADRO 3.2.
102
CUADRO 3.3.
Por ello, la ley de Stevens para la percepción del brillo, en unidades subjetivas
arbitrarias, para el sujeto experimental es:
Br = 9.078Lo.506
Análisis:
El valor obtenido para el exponente a es algo distinto del valor estándar. Ello puede ser
debido a que los estímulos utilizados en la Práctica subtienden un ángulo visual diferente
al de los estímulos utilizados para obtener el valor estándar.
con b=9.078, a=0.506. Puesto que la gráfica es una línea recta, para representarla basta
encontrar las coordenadas de dos puntos, por ejemplo para L=8, Br=26 y para L=248,
Br=147.76. [Por favor, trácese la recta en todo el gráfico. ¡No utilice como límites los
puntos que han servido para trazarla!].
103
Figura 3.4. Representación gráfica en escala log-log de los resultados experimentales
obtenidos y de la recta de regresión. El gráfico muestra la estimación del brillo (círculos)
en función de la luminancia relativa y la gráfica (línea recta) de la función que ajusta esos
datos obtenida por regresión lineal. Nótese que los datos de luminancia son niveles de
gris y no valores en cd/m2.
104
Figura 3.5. Representación gráfica en escala lineal de los resultados experimentales
obtenidos y de la ley potencial de Stevens para la percepción del brillo. El gráfico
muestra la estimación del brillo (círculos) en función de la luminancia relativa y la curva
correspondiente a la función potencial para el sujeto experimental que relaciona el brillo
con la luminancia relativa (b=9.078, a=0.506). Nótese que los datos de luminancia son
niveles de gris y no valores en cd/m2.
Sujeto experimental:
NOMBRE....................................................................................
105
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde).
RESULTADOS [3]
[CUADRO 3.1]
106
Valores de los parámetros para el sujeto experimental [CUADRO 3.3]
Por ello, la ley de Stevens para la percepción del brillo, en unidades subjetivas arbitrarias,
para el sujeto experimental es:
107
Análisis:
108
Representación gráfica en escala log-log de los resultados experimentales obtenidos y de
la recta de regresión. El gráfico muestra la estimación del brillo (círculos) en función de la
luminancia relativa y la gráfica (línea recta) de la función que ajusta esos datos obtenida
por regresión lineal. Nótese que los datos de luminancia son niveles de gris y no valores
en cd/m2. [FIGURA 3.4]
109
Representación gráfica en escala lineal de los resultados experimentales obtenidos y de la
ley potencial de Stevens para la percepción del brillo. El gráfico muestra la estimación del
110
brillo (círculos) en función de la luminancia relativa y la curva correspondiente a la
función potencial para el sujeto experimental que relaciona el brillo con la luminancia
relativa (b=.........., a=..........). Nótese que los datos de luminancia son niveles de gris y
no valores en cd/m2. [FIGURA 3.5]
111
112
1. Introducción
La Teoría de la Detección de la Señal (TDS) (Green & Swets, 1974; Laming, 1973;
Peterson, Birdsall & Fox, 1954; Swets, 1961; Tanner & Swets, 1954; véase Jáñez
(1992) para una exposición en castellano de la TDS) como teoría del comportamiento de
una persona en una tarea de detección distingue la sensibilidad de la persona o
discriminabilidad de la señal (d) del criterio o sesgo de respuesta (un índice del cual es /3)
y establece que (Swets, Tanner y Birdsall, 1961):
113
El modelo TDS N-N con varianzas iguales supone específicamente que las
distribuciones de los efectos sensoriales de la señal+ruido y del ruido son normales con
varianzas iguales.
Por lo tanto:
a)Si en una tarea sensorial de detección una persona se comporta de acuerdo con la
TDS N-N, al mantener fija la SNR, variando o las probabilidades a priori o la
matriz de consecuencias o las instrucciones, el índice de sensibilidad de la persona
se mantendrá constante, la persona variará su criterio y los resultados
experimentales se ajustarán a una curva teórica reglada, la curva de isosensibilidad
o curva ROC (cuya forma depende del supuesto gaussiano para los efectos
sensoriales del ruido y de la señal inserta en ruido, parametrizada por la distancia
d' entre las medias de las respectivas distribuciones).
b)Si en una tarea sensorial de detección una persona se comporta de acuerdo con la
TDS N-N, al variar solo la SNR, manteniendo fijas las probabilidades a priori, la
matriz de consecuencias y las instrucciones, variará la detectabilidad o
discriminabilidad de la señal, la persona mantendrá fijo su criterio y los resultados
se ajustarán a una curva teórica reglada, la curva de isocriterio (cuya forma
depende del supuesto gaussiano para las distribuciones de los efectos sensoriales
del ruido y de la señal inserta en ruido, parametrizada por el criterio ¡3).
114
4.Representar gráficamente la sensibilidad y el criterio del sujeto experimental.
PARTE I
2. Método
2.1. Estímulos
Se utilizan dos tipos de estímulos: Estímulo 1 que es ruido solo (Figura 4.la) y Estímulo 2
que se compone de la señal inserta en ruido (Figura 4.1b). El ruido acústico es ruido
blanco Gaussiano (véase Método de la Práctica 2) dentro del rango 1-22050 Hz, y la
señal es un tono puro de 1000 Hz. La frecuencia de muestreo utilizada para generar los
estímulos fue de 44100 Hz. La duración de los estímulos es de 1.6 segundos y se
presentan utilizando una ventana temporal Butterworth de orden 30 (González y Wintz,
1977). Ambos sonidos son originales y han sido generados utilizando MATLAB.
115
Figura 4.1. Realizaciones de los estímulos utilizados en los experimentos. a. Estímulo 1,
ruido blanco Gaussiano de un segundo de duración. El panel de la izquierda representa el
estímulo en función del tiempo o dominio temporal y el panel de la derecha representa su
espectro de amplitud. En el histograma se representa la distribución de intensidades de la
señal. Nótese la forma aproximada de función Gaussiana. b. Estímulo 2, señal+ruido,
tono puro de 1000 Hz inserto en ruido gaussiano. El panel de la izquierda muestra el
estímulo en el dominio temporal. Nótese que, para hacer evidente la forma sinusoidal de
la señal, solo se representa un trozo de 10 milisegundos de duración. El panel de la
derecha muestra en escala log-lineal el espectro ideal de la señal inserta en el ruido.
116
Figura 4.2. Secuencia temporal de cada ensayo. El estímulo es presentado
temporalmente dentro de una ventana de Butterworth de orden 30.
CUADRO 4.1.
2.4. Predicciones
Dadas las condiciones experimentales (Cuadro 4.1), las predicciones para esta Parte 1 de
la Práctica son las siguientes:
117
su razón de verosimilitud P.Puesto que P(s) varía de una condición a otra, TDS
predice que el criterio de la persona variará de la condición A a la B.En particular,
y puesto que PA(s)<PB(s), se predice que /3A > /3B.
2.5. Aparatos
Puesto que las Tablas de la curva normal suelen ofrecer las probabilidades con cuatro
cifras decimales, es conveniente que el alumno calcule P(S~s+n) y P(Sin) con cuatro
cifras decimales con el fin de que el cálculo de d' y 0 sea lo más exacto posible. Dada la
forma geométrica de la curva normal el uso de solo dos cifras decimales para las áreas
bajo ella origina errores de importancia.
1.CONDICIONA P(s) 0.3: Contiene dos archivos de audio con extensión .wav y mp3
y un archivo de Excel con extensión xls.
118
a)Practica4 Instrucciones.wav. Archivo de audio en el que imparten las
instrucciones para la realización del experimento.
b) Practica4 P(s) 0.3 Archivo de audio que consta de los cien ensayos en los que
se presenta bien el ruido solo, bien la señal inserta en ruido.
2.CONDICIÓNB P(s) 0.7: Contiene también dos archivos de audio con extensión
wav y mp3 y un archivo de Excel con extensión xls.
b) Practica4 P(s) 0.7 Archivo de audio que consta de los cien ensayos en los que
se presenta bien el ruido solo, bien la señal inserta en ruido.
e)Practica4_Ensayos en los que aparece la señal TDS P(s) B.xls. Archivo gráfico
en el que figuran los ensayos en los que aparece señal (aparecen también
enumerados en el Cuadro 4.5 más adelante).
Las instrucciones que se imparten a los sujetos experimentales son las siguientes:
-La tarea que van a realizar es muy sencilla. Consiste en detectar una señal como
esta..., inserta en un fondo de ruido como este....
-Van realizar cien ensayos donde unas veces se presentará el ruido solo... y otras
veces se presentará la señal inserta en ruido....
-La secuencia temporal de los ensayos será siempre la misma: cada ensayo se iniciará
con una voz que indica rásu número; a continuación se presentará el ruido solo o
la señal con el ruido; y por último se le pedirá que emita la respuesta.
-Por ejemplo un ensayo sería: ciento uno..., respuesta, o también, ciento dos
...,respuesta....
119
-El tipo de respuesta se les indicará a continuación.
[Se reproducen los archivos de audio Practica4 P(s) 0.3.mp3 y Practica4 P(s)
0.7.mp3 informando verbalmente a los sujetos de la condición experimental a la
que cada uno corresponde].
2.9. Algoritmo para el cálculo de d 'y %I supuesto el modelo N-N con varianzas iguales
2.Encontrar z„ tal 'que P(z'z zJ= P(sin) utilizando la tabla de la distribución normal.
(Recuérdese: z, es la puntuación típica del criterio en la distribución de los efectos
sensoriales producidos por la presentación repetida del ruido).
mediante la fórmula d'= z, - zs (Coombs, Dawes & Tversky, 1970; Egam, 1975
120
ecuación 3.13) obtenida, suponiendo distribuciones normales con varianzas
iguales. En efecto, sean:
mediante la fórmula:
121
(Recuérdese que xc es el criterio o sesgo de respuesta en el eje de los efectos
sensoriales, fi, la razón de verosimilitud del criterio y exp[x] = ex).
3. Resultados: Ejemplo
CUADRO 4.2.
122
123
CUADRO 4.3.
CUADRO 4.4.
124
CUADRO 4.5.
125
Condición B: Ensayos en los que aparece la señal inserta en ruido
126
3.2.2. Parte I.Condición B
CUADRO 4.6.
iii. Acerca de la sensibilidad del sujeto experimental: Puesto que SNRA=SNRB, TDS
predice que la sensibilidad de la persona será igual o parecida en ambas
condiciones experimentales. Resulta que d'A (1.535) es aproximadamente igual a
d'B (1.523) por lo que la sensibilidad de la persona es la misma en ambos
127
experimentos y, por tanto, se cumple el modelo de TDS N-N con varianzas iguales
respecto de la sensibilidad.
ni. Acerca del criterio del sujeto experimental: Puesto que PA (s) <PB (s), TDS
predice que l3A será mayor que /3B. Sucede que, en efecto, PA (=2.2) es mayor
que NB (=0.691) por lo que en esta persona se cumple el modelo de TDS N-N
(varianzas iguales) respecto del criterio. En particular, el criterio de la persona es
más conservador en la condición A que en la B (alt./el criterio en la condición B es
más liberal que en la condición A).
ni. ¿Ajuste al modelo de TDS N-N con varianzas iguales? Dadas las condiciones
experimentales, TDS predice que los resultados experimentales estarán en la
misma curva ROC o de isosensibilidad teórica. La Figura 4.4 muestra que, en
efecto, los resultados experimentales están en la misma curva ROC teórica
parametrizada por el valor de d', por lo que el comportamiento de esta persona en
la tarea de detección se ajusta al modelo de TDS N-N con varianzas iguales.
128
Figura 4.4. Curva ROC teórica (línea roja más gruesa) correspondiente al sujeto
experimental. La curva está basada en el supuesto de distribuciones normales (con
varianzas iguales) de los efectos sensoriales del ruido y de la señal+ruido (o modelo de
TDS N-N con varianzas iguales). Los círculos negros (A, B) representan los resultados
experimentales (tasa de aciertos versus la tasa de falsas alarmas) de la Parte I.
3.5. Representación gráfica de la sensibilidad y del criterio o sesgo de respuesta del sujeto
experimental en cada una de las dos condiciones experimentales
En la Figura 4.5 se representan los criterios adoptados por la persona conforme las
probabilidades a priori de la aparición de la señal y el ruido varíen.
3.5.2. Supuesto que no se ajusta al modelo de TDS N-N con varianzas iguales
Si las d' tuvieran valores diferentes, represéntense en la Figura 4.6 las fdp
correspondientes a los efectos sensoriales de la señal, teniendo en cuenta para su
129
localización relativa los valores de d' obtenidos, suponiendo que dichas fdp son
Gaussianas. En la misma gráfica, represéntese el criterio obtenido en cada caso.
130
Figura 4.6. El comportamiento de la persona en la tarea de detección no se ajusta al
modelo TDS N-N con varianzas iguales. Representaciones gráficas de la sensibilidad d' y
de los respectivos criterios o sesgos de respuesta xx para cada una de las dos condiciones
experimentales (A y B) de la Parte I.
PARTE II:
En la mayoría de las exposiciones sobre la TDS se insiste sobre todo en la curva ROC y
131
en el cambio del criterio de decisión de la persona con la variación de una cualquiera de
las variables que influyen sobre él. Sin embargo, para los estudios en psicofisica
sensorial, es mucho más interesante comprobar si una persona mantiene constante su
criterio de decisión en experimentos acerca de la detectabilidad o discriminabilidad de la
señal (Egam, Schulmann & Greenberg, 1959). Nótese que en muchos experimentos de
psicofisica visual y auditiva, sobre todo en los que la tarea es la detección de una señal
enmascarada por ruido de una densidad de potencia No constante, lo que se determina es
el umbral para detectar la señal, relacionado con su energía y por tanto con d'.
4. Método
4.1. Estímulos
Se utilizan dos tipos de estímulos: Estímulo 1 que es ruido solo y Estímulo 2 que se
compone de la señal inserta en ruido.
4.4. Predicciones
Dadas las condiciones experimentales (Cuadro 4.7), las predicciones para esta Parte II de
la Práctica son las siguientes:
132
dA>dB>dc, es decir, que la señal A será más discriminable que la señal B y ésta
más que la señal C.
ni. Acerca del criterio o sesgo de respuesta. Un índice para el criterio en TDS N-N es
P.Puesto que las todas las variables de las que depende P permanecen fijas en las
tres condiciones, TDS predice que el criterio de la persona se mantendrá constante
en las tres condiciones, es decir, /3A, is y fic serán iguales o muy parecidas.
ni. ¿Ajuste al modelo de TDS N-N con varianzas iguales? El instrumento conceptual
para comprobar que los resultados se ajustan al modelo N-N con varianzas iguales
es la curva de isocriterio teórica parametrizada por el valor correspondiente de
P.Por ello, en esa tarea de detección el comportamiento de la persona se ajusta a
TDS modelo N-N con varianzas iguales si y solo si los resultados experimentales
están en la misma curva de isocriterio parametrizada por el valor correspondiente
de P.
CUADRO 4.7.
4.5. Aparatos
133
uno contiene dos archivos de audio con extensión wav y .mp3 y un archivo de Excel con
extensión xls
b) Practica4 P(s) 0.5 Archivo de audio que consta de los cien ensayos de la
condición A en los que se presenta bien el ruido solo, bien la señal inserta en
ruido.
a) PracticaInstrucciones. wav
a) PracticaInstrucciones.wav
Las mismas instrucciones que en la Parte 1, con el cambio lógico en el material que se
134
presenta.
5. Resultados. Ejemplo
En los Cuadros 4.8, 4.9 y 4.10 aparecen los resultados experimentales de la Parte II,
Condiciones A, B y C así como la matriz de respuestas directas y la matriz de
probabilidades condicionales o matriz de resultados. En el Cuadro 4.11 se enumeran los
ensayos en los que aparece la señal inserta en ruido en cada una de las tres condiciones
A, B y C.En la Figura 4.7 se representan, en el diagrama de la curva ROC, los resultados
experimentales de la persona en cada condición.
CUADRO 4.8.
135
5.1.2. Parte II. Condición B
CUADRO 4.9.
136
5.1.3. Parte 11. Condición C
CUADRO 4.10.
137
CUADRO 4.11.
Ensayos en los que aparece la señal inserta en ruido en cada una de las tres
condiciones A, By C
138
Figura 4.7. Representación gráfica de los resultados del experimento de la Parte H. En el
139
diagrama de la curva ROC se ha representado (círculos negros) la probabilidad de
aciertos (o tasa de aciertos) versus la probabilidad de falsas alarmas (o tasa de falsas
alarmas) obtenidas en cada una de las tres condiciones (A, B y CJ de la Parte H.
140
CUADRO 4.12.
iii. Acerca del criterio del sujeto experimental. Puesto que las todas las variables de las
que depende R permanecen fijas en las tres condiciones, TDS predice que el
criterio de la persona se mantendrá constante, es decir, PA, RB y (3c serán iguales
o muy parecidas. El resultado es que, en efecto, los valores de PA, RB, Rc son
parecidos, por lo que en esta persona se cumple el modelo de TDS N-N (con
varianzas iguales) respecto del criterio.
141
ni. ¿Ajuste al modelo de TDS N-N con varianzas iguales? Dadas las condiciones
experimentales, TDS predice que los resultados experimentales estarán en la
misma curva ROC o de isocriterio. En la Figura 4.8 se muestra que, en efecto, los
resultados experimentales están prácticamente en la misma curva de isocriterio
teórica parametrizada por el valor de R, por lo que el comportamiento de esa
persona en la tarea de detección se ajusta al modelo de TDS N-N (con varianzas
iguales).
En la Figura 4.8 aparece representada (línea negra más gruesa) la curva de isocriterio
teórica para el sujeto experimental del ejemplo. [La curva de isocriterio teórica ha sido
obtenida mediante cálculo numérico suponiendo distribuciones normales (con varianzas
iguales) de los efectos sensoriales de la señal+ruido y del ruido y el valor numérico de
(3=1.33 obtenido experimentalmente].
Figura 4.8. Curva de isocriterio teórica (línea roja más gruesa) correspondiente al sujeto
experimental. [Figura original de Serrano-Pedraza & Sierra-Vázquez]. La curva está
basada en el supuesto de distribuciones normales (varianzas iguales) de los efectos
142
sensoriales del ruido y de la señal+ruido o modelo de TDS N-N con varianzas iguales.
Los círculos grises (A, B y C) representan los resultados experimentales (tasa de aciertos
versus tasa de falsas alarmas) de la Parte H.Las curvas grises son las curvas ROC o de
isosensibilidad.
143
Figura 4.9. Representaciones gráficas de la discriminabilidad d'y del criterio x, para cada
una de las tres condiciones experimentales (A, B y C) utilizadas en la Parte H.
Sujeto experimental:
NOMBRE.....................................................................................
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde).
RESULTADOS [3]
[CUADRO 4.2]
144
Resultados experimentales en la condición B
[CUADRO 4.3]
145
Parte 1, Condición A:
146
Matriz de probabilidades condicionales o Matriz de resultados
Parte I, Condición 8:
Matriz de resultados
147
Representación gráfica de los resultados del experimento de la Parte I.En el diagrama de
la curva ROC se ha representado (círculos negros) la probabilidad de aciertos versus la
probabilidad de falsas alarmas obtenidas en cada una de las dos condiciones (Ay B) de la
Parte I. [FIGURA 4.3]
148
Parte 1. Condición [3.2.2]
[CUADRO 4.6]
149
(ü) Acerca del criterio del sujeto experimental:
150
Curva(s) ROC teórica(s) (línea(s) negra(s) más gruesa(s)) correspondiente(s) al sujeto
experimental. La(s) curva(s) están basada(s) en el supuesto de distribuciones normales
(con varianzas iguales) de los efectos sensoriales del ruido y de la señal+ruido (o modelo
N-N con varianzas iguales). Los círculos negros (A y B) representan los resultados
experimentales (tasa de aciertos versus la tasa de falsas alarmas) de la Parte I. [FIGURA
4.4]
Supuesto que se ajusta al modelo de TDS N-N: da = d, y /3, > 13, [3.5.1]
151
El comportamiento de la persona en la tarea de detección se ajusta al modelo de TDS N-
N con varianzas iguales. Representaciones gráficas de la sensibilidad d' y de los
respectivos criterios o sesgos de respuesta xx. [FIGURA 4.5]
Si las d' tuvieran valores diferentes, represéntense en la Figura 4.6 las fdp
correspondientes a los efectos sensoriales de la señal, teniendo en cuenta para su
localización relativa los valores de d' obtenidos, suponiendo que dichas fdp son
Gaussianas. En la misma gráfica, represéntese el criterio obtenido en cada caso.
152
El comportamiento de la persona en la tarea de detección no se ajusta al modelo TDS N-
N con varianzas iguales. Representaciones gráficas de la sensibilidad d' y de los
respectivos criterios o sesgos de respuesta xx para cada una de las dos condiciones
experimentales (A y B) de la Parte I. [FIGURA 4.6]
RESULTADOS [5]
[CUADRO 4.8]
153
Parte II. Resultados experimentales en la condición B
[CUADRO 4.9]
154
Parte III. Resultados experimentales en la condición C
[CUADRO 4.10]
155
Parte II, Condición A:
156
Matriz de probabilidades condicionales o Matriz de resultados
157
Matriz de probabilidades condicionales o Matriz de resultados
158
la curva ROC se ha representado (círculos negros) la probabilidad de aciertos versus la
probabilidad de falsas alarmas obtenidas en cada una de las tres condiciones (A, B y C)
de la Parte H. [FIGURA 4.7]
159
Valores de los parámetros de TDS para la Parte II
[CUADRO 4.12]
160
(üi) ¿Ajuste al modelo N-N con varianzas iguales?
En la Figura 4.8 se representan la (s) curva (s) de isocriterio teórica para el sujeto
experimental.
161
Curva(s) de isocriterio (línea(s) negra(s) más gruesa(s)) correspondiente(s) al sujeto
experimental [Figura original de Serrano-Pedraza & Sierra-Vázquez]. La(s) curva(s)
está(n) basada(s) en el supuesto de distribuciones normales (con varianzas iguales) de los
efectos sensoriales del ruido y de la señal+ruido o modelo N-N con varianzas iguales.
Los círculos negros (A, B y C) representan los resultados experimentales (tasa de
aciertos versus la tasa de falsas alarmas) de la Parte H.Las curvas grises son la curvas
ROC o de isosensibilidad. [FIGURA 4.81
162
[5.5]
Condición A:
Condición B:
Condición C:
163
Representaciones gráficas de los respectivos índices de discriminabilidad d' y criterios o
sesgos de respuesta xx para cada una de las tres condiciones experimentales (A, B y CJ
de la Parte H. [FIGURA 4.9]
164
165
1. Introducción
CUADRO 5.1.
166
167
Figura 5.1. Curva de audibilidad (línea negra continua), en escala log-log, típica de una
persona adulta con audición normal que es el estándar internacional ISO R/226 (1961)
(MAF). Está basada en la determinación experimental de los umbrales de audibilidad
(cuadrados negros) de 51 personas entre 18 y 25 años (Robinson y Dadson, 1956). Los
círculos son los datos experimentales de Berger (1981) y la línea discontinua es la curva
teórica que ajusta esos datos. [Scharf, B. & Buus, S. (1986). Audition 1: Stimulus,
Physiology, Thresholds. En K.R.Boff, Kaufman, L. & Thomas. J. P. (eds.) Handbook
of Perception and Human Performance. Vol 1. Sensory Processes and Perception. N. Y.:
Wiley & Sons, 1986. Figura 14.23].
168
3.Determinar la propia CA.
5.Representar el audiograma.
Figura 5.2. Curvas de audibilidad, en escala log-log, de algunas especies animales. Las
curvas están basadas en datos de Heffner, 1983; Heffner y Heffner, 1980, 1985; Heffner
y Masterton, 1980. [Goldstein, 1999, Figura 12.13].
2. Método
2.1. Estímulos
Se utilizarán ocho tonos puros con frecuencias temporales de 125, 250, 500, 1000, 2000,
4000, 8000 y 12000 Hz respectivamente. Cada tono puro tiene una duración de 400 ms
y serán presentados dentro de una ventana temporal en forma de función de Butterworth
de orden 30 (González y Wintz, 1977) (véase Figura 5.3), cada uno con amplitud
variable según se describe en el apartado siguiente. Los sonidos son originales y han sido
169
generados utilizando MATLAB.
Figura 5.3. Ejemplo de un tono puro de 125 Hz ventaneado temporalmente con una
función de Butterworth de orden 30.
2.2. Procedimiento
Para la determinación del umbral de audibilidad del tono, cada uno de los ocho tono
puros se presentará en tres escalas descendentes de 15 pasos o presentaciones cada una,
disminuyendo 5 dB SPL la amplitud del tono en cada paso con relación al anterior. Cada
presentación tiene una duración de 400 ms con intervalos de silencio de 500 ms entre
pasos (véase la Figura 5.4).
2.3. Aparatos
170
de archivos wav conectado a unos altavoces. Puesto que es una tarea de detección de
tonos puros, el volumen de los altavoces tiene que ajustarse antes del experimento. Véase
el procedimiento de calibración en el apartado 2.5. Instrucciones para el experimentador.
2.4. Tarea
La persona tiene que contar los pasos que oye para cada frecuencia temporal.
Figura 5.4. Ejemplo de las cinco primeras presentaciones de una escala descendente para
un tono puro de 125 Hz.
Para calibrar los aparatos de audio utilizados en esta Práctica el método óptimo es utilizar
un sonómetro. Ahora bien, si se carece de instrumentos de calibración en lo que sigue se
describe un método de calibración aproximado utilizando un tono puro de 4000 Hz (que
se encuentra en el archivo de audio del material audiovisual etiquetado como tono de
referencia ]Os.wav). Este tono se presentará durante 10 segundos. El experimentador
debe reproducir este sonido a la vez que pregunta a los sujetos experimentales si lo
perciben. En la primera presentación el tono puro tiene que ser perfectamente audible. Si
la respuesta es afirmativa, el experimentador reducirá el volumen del sistema de
reproducción hasta que la mayoría de los sujetos indiquen que el tono puro no es
perceptible. El tono puro de 4000 Hz es el que mejor se percibe en campo libre (ver
Tabla 1 columna ISO 1961), es decir, es el que menor presión sonora necesita para ser
171
justamente audible.
Esta calibración permite determinar el umbral para todos los tonos puros. Sin ella
podría ocurrir que algunos tonos puros se detectasen sin problemas en los quince pasos
(véase punto 2.2. Procedimiento). Esta calibración es útil también para normalizar la
escala. Supuesto que el sujeto tiene audición normal, se puede asignar el valor de 0 dB al
último paso que detecte para 4000 Hz y el resto de pasos se incrementará de 5 en 5 dB.
No obstante, en el peor de los casos, el único efecto de esta calibración sobre la curva de
audibilidad es que esta tendrá una forma parecida a la forma estándar, pero desplazada
hacia arriba o hacia abajo. [Véase la nota de cautela acerca de esta Práctica al final del
apartado 3.5]
a)125 15pasos
b)25015pasos
e)500
d)100015
172
e)2000
J)400015 pasos_5dB.wav
g)8000 15pasos
h)1200015pasos
-Ahora escucharéis un tono al que voy a bajar el volumen hasta que apenas lo oigáis.
[Se reproduce el archivo Tono de referencia 400010s.wav].
Para cada tono de una determinada frecuencia temporal hay tres secuencias de quince
pasos cada una.
-En cada secuencia vuestra tarea consistirá en contar los pasos que oís de cada tono e
indicarlo con una cruz en la casilla correspondiente del Cuadro 5.2 de la hoja de
respuestas.
173
3. Resultados: Ejemplo
En el Cuadro 5.2 aparecen los resultados del experimento de detección para la persona
del ejemplo (sujeto experimental) y se calculan los umbrales de audibilidad para cada
tono puro.
CUADRO 5.2.
Resultados experimentales y cálculo del umbral de audibilidad para cada tono puro
174
3.2. Representación gráfica del umbral de audibilidad de cada tono en función de su
frecuencia temporal
Figura 5.5. Umbrales de audibilidad (círculos negros) binaural de los tonos puros en
función de la frecuencia temporal del tono para el sujeto experimental. La línea poligonal
que une los círculos que representan los umbrales obtenidos experimentalmente es una
aproximación de la CA de esa persona.
3.4. Comparación con los umbrales de audibilidad estándar (ISO 1961 y ANSI 2004)
CUADRO 5.3.
175
Análisis:
Nivel auditivo (v) dB HL= Umbral obtenido (v) dB SPL (Uo)-Umbral estándar (v)
dB SPL(Ue)
En el Cuadro 5.4 se calcula el nivel auditivo del sujeto experimental para cada tono
puro suponiendo que los valores en dB obtenidos experimentalmente para los UA son
reales y no fruto del procedimiento de asignación utilizado. Un nivel auditivo positivo
significa que el umbral obtenido es mayor que el normal (pérdida auditiva) y un nivel
auditivo negativo, que es menor (ganancia auditiva). Por ello en la representación gráfica
utilizada, para indicar que un nivel auditivo positivo corresponde a una pérdida de
audición, los valores positivos se representan en la parte negativa del eje de ordenadas
(Figura 5.6).
CUADRO 5.4.
176
Figura 5.6. Audiograma (línea poligonal) correspondiente al sujeto experimental. El nivel
auditivo para cada tono (círculos negros) se representa en función de la frecuencia
temporal del tono. Nótese que para indicar que un nivel auditivo positivo corresponde a
una pérdida de audición, en la representación gráfica los valores positivos se representan
en la parte negativa del eje de ordenadas.
Análisis:
177
desviaciones de los valores estándar no son importantes ya que en los sujetos con
audición normal son debidas a variaciones estadísticas o al sistema de calibración
utilizado y no a un posible déficit auditivo.
[Nota importante: La medida de la capacidad auditiva se realiza para cada oído por
separado y no binaural, como se ha realizado en esta Práctica. Además, la audio-metría
tonal liminar realizada por audiometristas y otorrinos está calibrada respecto a otra
referencia. En esta Práctica se obtiene una estimación no calibrada de la pro-pia CA y los
resultados del audiograma no son válidos como medida de la función auditiva, que debe
de ser llevada a cabo por el profesional adecuado. Sin embargo, las características físicas
de los sonidos (incluido el modo de su presentación temporal) generados adhoc para ser
utilizados en esta Práctica están tan controladas como las de los sonidos utilizados de
modo estándar en la medida de la función auditiva por los profesionales antes citados].
Sujeto experimental:
NOMBRE.......................................................................................
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde).
RESULTADOS [3]
[CUADRO 5.2]
178
En la primera columna otórguese el cero de la escala de dB al paso de la serie del tono
puro de 4000 Hz con el punto de transición (PT) menor. Después, rellénese esa columna
en pasos de 5 en 5 dB (tanto positivos como negativos).
179
Umbrales de audibilidad (círculos negros) en función de la frecuencia temporal de los
tonos puros para el sujeto experimental. La línea poligonal que une los círculos que
representan los umbrales obtenidos experimentalmente es una aproximación de la CA de
esa persona. [FIGURA 5.5]
Comparación con las Curvas de Audibilidad estándar (ISO 1961; ANSI 2004) [3.4]
[CUADRO 5.3]
Análisis:
180
Representación del audiograma [3.5]
Nivel auditivo (v) = Umbral obtenido (v) (Uo) - Umbral estándar (v) (Ue)
[CUADRO 5.4]
181
Aud¡ogramo (línea polígono¡) correspondiente al sujeto experimental. El nivel auditivo de
cada tono (círculos negros) se representa en función de la frecuencia temporal del tono.
Nótese que para indicar que un nivel auditivo positivo es una pérdida de audición, en la
representación gráfica los valores positivos se representan en la parte negativa del eje de
ordenadas. [FIGURA 5.6]
Análisis:
[Nota importante: La medida de la capacidad auditiva se realiza para cada oído por
separado y no binaural, como se ha realizado en esta Práctica. Además, la audiometría
tonal liminar realizada por audiometristas y otorrinos está calibrada respecto a otra
referencia. En esta Práctica se obtiene una estimación no calibrada de la propia CA y los
182
resultados no son válidos como medida de la función auditiva, que debe de ser llevada a
cabo por el profesional adecuado. Sin embargo, las características físicas de los sonidos
(incluido el modo de su presentación temporal) generados adhoc para ser utilizados en
esta Práctica están tan controladas como las de los sonidos utilizados de modo estándar
en la medida de la función auditiva por los profesionales antes citados].
183
184
1. Introducción
En 1940 Harvey Fletcher sugirió, siguiendo a Helmholtz (1863), que el sistema auditivo
humano periférico consiste en un banco de filtros lineales, paso-banda, cuyas funciones
de transferencia de modulación (FTM) se solapan entre sí, suponiendo que la membrana
basilar es la base biológica de tales filtros. Fletcher también demostró mediante métodos
psicofísicos la existencia de esos filtros auditivos.
185
Figura 6.1. Demostración de la existencia de bandas críticas y determinación de su
anchura mediante enmascaramiento simultáneo con ruido paso-banda centrado en la
frecuencia temporal de la señal. A.Resultados de Fletcher (1940) para diferentes tonos
puros. La anchura de la banda está representada por la razón crítica (critical ratio).
B.Resultados de Schooneveldt & Moore (1989) (figura tomada de Moore (2003)).
Umbral de audibilidad de un tono puro de 2000 Hz en función de la anchura de banda
(en Hz) de un ruido máscara centrado en esa frecuencia temporal. Nótese que el umbral
del tono crece con el aumento de la anchura de banda del ruido hasta una determinada
186
anchura espectral (400 Hz aproximadamente) y luego se mantiene constante.
Los resultados muestran que los umbrales de audibilidad del tono puro aumentan con
la anchura de banda del ruido máscara hasta una "anchura de banda crítica" o punto de
transición; un incremento ulterior de la anchura de banda del ruido no afecta al umbral de
audibilidad del tono, que se mantiene constante; es decir, aunque la potencia del ruido
sigue aumentando, su poder enmascarador se mantiene constante. Véase más claramente
este resultado en la Figura 6.1B, en la que se muestran los umbrales de audibilidad de un
tono puro de 2000 Hz enmascarado por ruido (centrado en esa frecuencia temporal) en
función de la anchura espectral del ruido máscara (Schooneveldt y Moore, 1989).
187
Nótese que en la literatura sobre audición el término banda crítica se utiliza
indistintamente por lo menos con tres significados diferentes: como la banda espectral del
ruido estímulo que enmascara efectivamente la señal (y fuera de la cual, otros
componentes espectrales del ruido no tienen efecto sobre la señal), como la banda
espectral del filtro centrado en la frecuencia de la señal (es la definición popular en
Wikipedia http://en.wikipedia.org/wiki/Critical_band) y como el filtro auditivo
correspondiente.
[El lector que quiera obviar los detalles matemáticos puede prescindir de este apartado y
del siguiente y continuar en §1.4 dedicado a las predicciones experimentales].
üi.Postulado 2: Se supone que para detectar un tono puro (señal) inserto en ruido
acústico (máscara), el oyente usa un único filtro auditivo centrado en la frecuencia
de la señal o en una frecuencia temporal próxima a la frecuencia de la señal.
iii.Postulado 3: Solo los componentes espectrales del ruido que pasan por el filtro de
detección (es decir, aquellos que por su frecuencia temporal caen dentro del ancho
de banda crítico) son efectivos para enmascarar al tono puro. Por lo tanto, la
potencia del ruido que pase fuera del filtro no tendrá efecto enmascarador.
188
señal/ruido constante, K, a la salida del filtro.
2.Modelo 2. La persona usa la salida del filtro auditivo que maximiza la razón entre la
energía de la señal y la potencia del ruido a la salida del filtro.
Demostración:
189
En efecto, sean: v, la frecuencia temporal, en Hz; v., frecuencia temporal del tono
puro utilizado como señal; P, potencia en el umbral de audibilidad del tono puro de
frecuencia vo enmascarado por el ruido, la variable dependiente, fijada por la persona;
H(v,vo), la Función de Transferencia (FT) del filtro auditivo centrado en la frecuencia
temporal Yo que procesa el tono; la Función de Transferencia de Modulación (FTM) del
filtro auditivo; p(v), la función de densidad de potencia del ruido, fijada de antemano por
el experimentador.
Entonces (por el Postulado 4) en el umbral de audibilidad del tono, P,, sucede que:
Supuesto que IH(vo;vo)1 sea igual a 1 (es decir que las FTM de los filtros estén
normalizadas a la unidad), entonces:
Así pues, la potencia en el umbral de la señal inserta en ruido es una medida indirecta
del área de solapamiento entre el ruido y el filtro auditivo, por lo que conocido de
antemano el espectro de amplitud del ruido se podría obtener la anchura y la forma de la
FTM del filtro auditivo. (La determinación de la forma del filtro auditivo no se realizará
en esta Práctica).
La fórmula general de la ecuación (1) sirve para cualquier tipo de ruido de los
190
utilizados en los experimentos de enmascaramiento: de banda ancha, paso-bajo, paso-
alto, paso-banda, ruido horadado o con muesca espectral. [Véase en LópezBascuas
(1999) la lógica del cálculo de la anchura de la banda crítica usando ruido de banda
ancha como máscara]. Manipulando el espectro del ruido máscara y midiendo los
cambios en P, es posible encontrar la forma de la FTM del filtro auditivo Hl y, por tanto,
estimar la anchura de la banda crítica. Nótese que, en principio, la ecuación (1) implica
que cuanta más potencia del ruido máscara pase por el filtro, mayor será el umbral de
audibilidad, P, necesario para detectar el tono puro usado como señal (Serrano-Pedraza
& Sierra-Vázquez, 2006; SerranoPedraza, Sierra-Vázquez, & Derrington, 2013). Si el
filtro auditivo es o no pasobanda es algo a determinar empíricamente.
191
de donde:
Pero:
es el área bajo la FTM al cuadrado desde vo-Av/2 a vo+Av/2, es decir, el área, que
llamaremos A, del filtro auditivo centrado en vo para la anchura de banda del ruido, Av:
Supongamos a priori que el filtro auditivo sea un filtro paso-banda. Sea B, en Hz, la
anchura de la banda crítica o anchura del filtro auditivo, por ahora desconocida. Por el
Postulado 3 existen dos situaciones:
iii.Que la anchura de banda del ruido sea menor que la anchura de la banda del filtro,
es decir, Av < B.Entonces, nos remitimos a la consecuencia y P aumenta con la
anchura de banda del ruido, Ay.
iii.Que la anchura de banda del ruido sea mayor o igual que la banda del filtro, es
decir Av a B.Entonces, el ruido fuera del filtro no afecta al umbral de audibilidad y
PS permanecerá relativamente constante aunque la anchura de banda del ruido,
Av, aumente.
192
donde P (Av;vo), en dB SPL, variable dependiente, es la medida del umbral de
audibilidad del tono puro de frecuencia temporal vo, enmascarado por ruido, en función
de la anchura de banda del ruido máscara, Av. K, constante de proporcionalidad; Av, en
Hz, anchura de banda del ruido, variable independiente; No, en dB SPL, densidad de
potencia del ruido máscara; A(Av;v0), área desde vo-Av/2 a vo+Av/2 bajo la FTM (al
cuadrado) del filtro centrado en vo ; B, en Hz, anchura de la banda crítica o estimación
de anchura efectiva del filtro auditivo.
193
Figura 6.2. Estimación de la anchura de la banda crítica a partir de los umbrales de
audibilidad de un tono puro enmascarado con ruido paso-banda. En este ejemplo se ha
supuesto, como se atribuye que supuso Fletcher (1940), que la FTM del filtro auditivo es
una función rectangular centrada en la frecuencia temporal del tono puro. En este caso la
función está centrada en 500 Hz y con una banda crítica de 78.67 Hz (que se desconoce
de antemano y que se trata de encontrar experimentalmente). Los cuatro paneles
superiores muestran la FTM (al cuadrado) del filtro (rectángulo con línea negra), el
espectro de amplitud del ruido paso-banda máscara (rectángulo en gris) con diferentes
anchuras (25, 50, 100 y 200 Hz) y el espectro de amplitud del tono puro (función delta
de Dirac representada mediante una flecha situada en la frecuencia temporal del tono
puro). El panel de la parte inferior muestra los resultados experimentales predichos
mediante el modelo del espectro de potencia para el enmascaramiento descrito en el
texto; la flecha dirigida hacia la abscisa indica el valor numérico de la anchura de la banda
crítica. [Nota: Aunque la idea está extensamente difundida en la literatura sobre audición,
parece ser que en ninguna publicación el propio Fletcher supuso que la FTM de los filtros
auditivos fuese una función rectangular (Allen, 1996, p. 1837), pero la adopción de esa
194
forma para la FTM facilita la comprensión del procedimiento].
195
Figura 6.3. Anchura de la banda crítica (medida en anchura de banda rectangular
equivalente, en Hz) en función de la frecuencia temporal del tono puro de acuerdo con
las fórmulas (4) y (5) del texto obtenidas, respectivamente, en Múnich, 8M y en
Cambridge, B, La línea discontinua muestra la anchura de banda de un tercio de octava
centrada en la respectiva frecuencia. [Figura adaptada de Hartmann (1998) (Figura
10.9)].
2. Método
2.1. Estímulos
Salvo el tono puro aislado, cada estímulo se compone del tono puro inserto en un ruido
máscara (véase Figura 6.4, estímulo auditivo). Las características respectivas de la señal
y de las máscaras son: señal: tonos puros de 500 y 2000 Hz; cada tono puro tendrá una
duración de 400 ms y será presentado dentro de una ventana temporal de Butterworth de
orden 30; máscaras: ruido paso-banda centrado en 500 y en 2000 Hz con nueve
anchuras de banda diferentes. Para el ruido centrado en 500 Hz las anchuras de banda
del ruido son: 25, 50, 75, 100, 150, 200, 300, 400 y 500 Hz. Para el ruido centrado en
2000 Hz las anchuras de banda del ruido son: 50, 100, 200, 250, 300, 400, 600, 800, y
1600 Hz. Todos los ruidos tendrán el mismo nivel (densidad de potencia), por lo que
196
cuanto mayor sea la anchura de banda del ruido, mayor será su potencia.
Figura 6.4. Funciones de onda (primera fila) y espectros de amplitud (segunda fila) de un
tono puro de 500 Hz aislado, de ruido paso-banda centrado en 500 Hz y anchura de
banda de 500 Hz y de uno de los estímulos utilizados, combinación del tono puro y del
ruido. Los valores de la amplitud representada en el dominio de Fourier son relativos y su
objetivo es meramente didáctico. Nótese que la duración real de los estímulos es de 400
msec.
2.2. Procedimiento
Para la determinación de los umbrales auditivos se utilizará el método de los límites con
escalas o series descendentes con una tarea SÍ/NO. Aunque son conocidas las
limitaciones del método con esta tarea (por ejemplo, la falta de control del criterio de
respuesta del observador), se utilizará este método porque permite una aproximación
rápida al valor del umbral. Se determinará el umbral auditivo de la señal en ausencia y en
presencia de ruido máscara. Para la determinación del umbral auditivo de cada tono puro
se presentará en tres escalas descendentes de 15 pasos cada una, disminuyendo 5 dB con
relación al anterior con intervalos de silencio de 500 ms entre pasos (ver Figura 6.5A).
Para la determinación del umbral auditivo de cada tono puro en presencia del ruido
197
máscara se procederá del mismo modo, solo que el ruido aparecerá continuamente (ver
Figura 6.5B), es decir tanto en los intervalos en los que aparece la señal como en los
periodos de silencio.
Figura 6.5. A.Ejemplo de las cinco primeras presentaciones de una escala descendente
para un tono puro de 500 Hz sin enmascarar. B.Ejemplo de las cinco primeras
presentaciones del tono puro de 500 Hz junto con el ruido máscara (ruido gaussiano)
filtrado paso-banda centrado en 500 Hz y con anchura de banda de 200 Hz.
2.3. Tarea
Para cada tono, el sujeto tiene que contar los pasos que oye del tono enmascarado por
cada tipo de ruido.
2.4. Aparatos
198
tonos puros, el volumen de los altavoces tiene que ajustarse antes del experimento. Véase
el procedimiento de calibración en el apartado Instrucciones para el experimentador.
Para calibrar los aparatos de audio utilizados en la práctica se emplearán los tonos de 500
y 2000 Hz sin máscara. (Se recomienda calibrar los aparatos de audio utilizando el tono
de 2000 Hz y usar la calibración para ambos experimentos). Estos tonos se presentan en
quince presentaciones con niveles de presión sonora decreciente de 5 en 5 dB. El
experimentador debe reproducir este sonido a la vez que pregunta a los sujetos
experimentales cuántas presentaciones del tono pueden oír. Lo ideal es que la mayoría de
los sujetos oigan entre once y catorce presenta ciones. No hay que dejar que oigan todas
las presentaciones. Si a un determinado volumen sonoro se oyesen las quince
presentaciones, el experimentador ha de bajar el volumen del aparato reproductor hasta
que la mayoría de los sujetos indiquen que solamente se oyen entre once y catorce
presentaciones aproximadamente. El tono puro de 2000 Hz se percibe con más facilidad
que el de 500 Hz en campo abierto (ver Cuadro 5.1 columna ISO 1961 de la Práctica
relativa a la Curva de Audibilidad), por lo tanto si no se oyen las quince presentaciones
para 2000 Hz tampoco se oirán para 500 Hz.
Esta calibración también es útil para normalizar la escala. Si suponemos que el sujeto
tiene audición normal, entonces al último paso que detecte para 2000 Hz le podemos
asignar el valor de 0 dB y el resto de pasos incrementará de 5 en 5 dB. (Véase nota bajo
el cuadro 6.2). Ese mismo paso será también de 0 dB para el tono de 500 Hz. No
obstante, independientemente de los valores físicos reales de los umbrales, estos no
tendrán efecto sobre la estimación de la anchura de cada banda crítica.
199
b)500 15Mask.wav: tono puro y ruido máscara de anchura de banda (Ay) igual a
25 Hz.
c)500 Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a 50
Hz.
d)500 1575Mask.wav: tono puro y ruido máscara de anchura de banda (Ay) igual a
75 Hz.
e)500 Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a 100
Hz.
g)500 Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a 200
Hz.
j)500 NoMask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a
500 Hz.
b)2000 Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a 50
Hz.
d)2000 Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a
200
200 Hz.
e)2000 15Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a
250 Hz.
g)2000 15Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a
400 Hz.
h)2000] Mask.wav: tono puro y ruido máscara de anchura de banda (Av) igual a
600 Hz.
Las instrucciones que se impartirán a los sujetos experimentales son las siguientes:
-Ahora escucharéis un tono al que voy a bajar el volumen sonoro hasta que apenas lo
oigáis.
-Decidme los pasos que oís. [El experimentador presenta el archivo NoMask.wav y
fija el volumen sonoro de maveraque los sujetos oigan entre once y catorce
pasos].
201
presentaciones del tono de 500 Hz con diferentes ruidos. Notad que cada tres
secuencias el ruido es el mismo en todos los pasos, pero que el tono de 500 Hz va
disminuyendo de volumen en cada paso.
-Por tanto, para cada tipo de ruido hay tres secuencias de quince pasos o
presentaciones, cada una indicada en la Tabla de la hoja de respuestas.
Encada secuencia vuestra tarea consiste en contar los pasos o presentaciones que oís
del tono inserto en cada ruido e indicarlo con una cruz en la casilla
correspondiente del Cuadro 6.1 de la hoja de respuestas
.................................................................................................
Ahora vamos a hacer lo mismo con un tono de 2000 Hz. [El experimentador
reproduce los archivos de audio de PRACTICA6_EXPERIMENTO2 cuidando de
presentar cada archivo tres veces. En cada caso se irá indicando la anchura de
banda del ruido para que los sujetos anoten la respuesta en la columna
correspondiente].
3. Resultados: Ejemplo
En los Cuadros 6.1 y 6.2 aparecen los resultados experimentales de una persona ejemplo
(sujeto experimental), así como el cálculo de los umbrales de audibilidad en presencia de
ruido paso-banda máscara.
3.1.1. Resultados experimentales. Señal: tono puro de 500 Hz. Umbral NPE=6 dB SPL
(ISO, 1961)
CUADRO 6.1.
202
Anchura de banda del ruido máscara, Av (Hz)
3.1.2. Resultados experimentales. Señal: tono puro de 2000 Hz. Umbral NPE=1 dB SPL
(ISO, 1961)
CUADRO 6.2.
203
Nótese que la respuesta indicada con el símbolo # ha servido para fijar el cero de la
escala de dB en ambos experimentos. Es decir, se ha otorgado el cero de la escala de dB
al paso 12 de la serie 2 de 0 Hz de anchura de banda, que es el que tiene el punto de
transición (PT) menor.
En las Figuras 6.6 y 6.7 se representan gráficamente los umbrales de audibilidad para los
tonos puros de 500 Hz y 2000 Hz respectivamente, en función de la anchura de banda
del ruido máscara, así como el procedimiento de estimación de la anchura de la banda
crítica.
204
Figura 6.6. Umbrales de audibilidad (círculos negros) para la persona del ejemplo de un
tono puro de 500 Hz en función de la anchura de banda en Hz de un ruido paso-banda
máscara centrado en la frecuencia temporal del tono. La banda crítica estimada a partir
de los datos experimentales es de 86 Hz aproximadamente.
205
Figura 6.7. Umbrales de audibilidad (círculos negros) para la persona del ejemplo de un
tono puro de 2000 Hz en función de la anchura de banda en Hz de un ruido paso-banda
máscara centrado en la frecuencia temporal del tono. La banda crítica estimada a partir
de los datos experimentales es de 270 Hz aproximadamente.
y la de Cambridge es:
206
Análisis:
Análisis:
207
Figura 6.8. Representación gráfica de las estimaciones de la anchura de las bandas
críticas obtenidas experimentalmente comparadas con las de Múnich y Cambrigde. El
círculo negro indica la anchura de la banda crítica estimada para el tono puro de 500 Hz;
el cuadrado negro, la anchura de la banda crítica estimada para el tono puro de 2000 Hz.
Sujeto experimental:
NOMBRE.......................................................................................
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde).
RESULTADOS [3]
Resultados experimentales. Señal: tono puro de 500 Hz. Umbral NPS=6 dB SPL (ISO,
1961) [3.1.1]
208
Resultados experimentales y cálculo de los umbrales de audibilidad. Señal: tono puro
de 500 Hz
[CUADRO 6.1]
Resultados experimentales. Señal: tono puro de 2000 Hz. Umbral NPS=1 dB SPL (ISO,
1961) [3.1.2]
[CUADRO 6.2]
209
Otórguese el cero de la escala de dB al paso de la serie de 0 Hz de anchura de banda
con el punto de transición (PT) menor.
210
Umbrales de detección (círculos negros) de un tono puro de 500 Hz en función de la
anchura de banda en Hz de un ruido paso-banda enmascarador centrado en la frecuencia
temporal del tono. La banda crítica estimada a partir de los datos experimentales es de
Hz aproximadamente. [FIGURA 6.6]
211
Umbrales de detección (círculos negros) de un tono puro de 2000 Hz en función de la
anchura de banda en Hz de un ruido paso-banda enmascarador centrado en la frecuencia
temporal del tono. La banda crítica estimada a partir de los datos experimentales es de
Hz aproximadamente. [FIGURA 6.7]
y la de Cambridge es:
212
Análisis:
Análisis:
213
Representación gráfica de las estimaciones de la anchura de las bandas críticas obtenidas
experimentalmente comparadas con las de Múnich y Cambrigde. El círculo negro indica
la anchura de la banda crítica estimada para el tono puro de 500 Hz; el cuadrado negro,
la anchura de la banda crítica estimada para el tono puro de 2000 Hz. [FIGURA 6.8]
214
215
1. Introducción
Entender la percepción de las vocales supone comprender, entre otras cosas, cuáles son
las características físicas presentes en la señal acústica que permiten codificar
apropiadamente dichos segmentos lingüísticos. Desde un punto de vista articulatorio, las
vocales se pueden clasificar atendiendo a dos dimensiones principales: el lugar de
articulación (que nos indica si la lengua se sitúa en una posición más anterior o más
posterior al articular la vocal) y el modo de articulación (que nos indica si la lengua se
halla más lejos o más cerca de la bóveda de la cavidad bucal). Considerando estos
criterios, en español nos encontraríamos con los siguientes grupos (Quilis y Fernández,
1992):
a)Vocales altas: si la lengua está tan próxima como sea posible al paladar duro o al
paladar blando, manteniendo el sonido producido por la cualidad vocálica.
216
Figura 7.1. Clasificación articulatoria de las vocales españolas atendiendo al lugar
(abscisa) y al modo (ordenada) de articulación [Quilis y Fernández, (1992), Curso de
fonética y fonología españolas. Madrid: CSIC. FIG. 22].
La Teoría Acústica de la Producción del Habla (Fant, 1960) permite predecir cuál
será la apariencia acústica de las vocales descritas a partir de las configuraciones
articulatorias que se acaban de especificar. Más en concreto, la forma acústica que
adopta una vocal depende de la interacción de dos factores: el flujo de aire que proviene
de los pulmones (y que queda estructurado en la laringe al pasar por la glotis) y las
propiedades de transmisión del tracto vocal (determinadas por la forma particular que
este adopte). La caracterización del modelo suele hacerse en el dominio de la frecuencia
temporal por resultar más intuitivo desde un punto de vista psicológico. Por tanto, en
primer lugar hay que caracterizar el espectro de la forma de onda generada al pasar el
flujo de aire por la glotis, espectro que se representa en la parte superior izquierda de la
Figura 7.2.
217
Figura 7.2. Producción de las vocales de acuerdo con la teoría de la fuente y el filtro. La
producción de las vocales se ilustra en el dominio de la frecuencia temporal,
considerando que el tracto vocal se comporta como un filtro lineal para las diferentes
vocales. Para cada vocal, el espectro de amplitud del flujo de aire por la glotis (a la
izquierda) es modificado por la Función de Transferencia de Modulación (FTM) del filtro
del tracto vocal (en el centro) para producir el espectro de la vocal (a la derecha).
218
[Pickett (1998). The Acoustics of Speech Communication. Fundamentals, Speech
Perception Theory, and Technology. Boston: Allyn and Bacon. FIGURE 4-10. Adaptada
de Fant (1960)].
Suponiendo que el tracto vocal puede considerarse como un filtro lineal, las
características espectrales de las vocales pueden predecirse a partir de los espectros
representados en la parte izquierda y central de la Figura 7.2. En la parte derecha de la
misma figura aparece el resultado de procesar el espectro de la función de onda glótica,
con los distintos filtros lineales asociados a la posición articulatoria propia de las
diferentes vocales. Ese resultado es, por tanto, una representación en el dominio de la
frecuencia de dichas vocales. En una lengua como el español, es posible caracterizar
todas las vocales especificando únicamente los dos primeros formantes (F1 y F2)
asociados a cada una de ellas. Una manera útil de representar cada vocal es mediante una
carta de formantes en la que se representa F 1 en función de F2. Los valores de F1 y F2
para las vocales del español pueden inspeccionarse en la carta de formantes que aparece
en la Figura 7.3.
219
Figura 7.3. Carta de formantes para las vocales del español. Formante F1 (ordenada)
versus el formante F2 (abscisa). [Martínez Celdrán (1998). Análisis Espectrográfico de
los Sonidos del Habla. Barcelona: Ariel. FIG 3.1]. Nótese que la frecuencia temporal
disminuye de izquierda a derecha (F2) y de abajo a arriba (F1) para que la carta de
formantes sea isomórfica a la clasificación articulatoria de las vocales que aparece en la
Figura 7.1.
220
Figura 7.4. Diagrama de bloques del sintetizador de Klatt. [Klatt, D. H. (1980). Software
for a cascade/parallel formant synthesizer. Journal of the Acoustic Society of America,
67(3), 971-995. FIG. 61.
2.Sintetizar, utilizando una implementación del sintetizador por formantes de Klatt, las
cinco vocales del español atendiendo a las consecuencias acústicas que tiene la
articulación diferencial de los distintos segmentos vocálicos.
4.Mostrar cuáles son los parámetros físicos que usa nuestro sistema perceptivo para
codificar las distintas vocales del idioma.
221
2. Método
2.1. Estímulos
http://www.asel.udel.edu/speech/ tutorials/synthesis/Klatt.html
La tarea es, por tanto, con la información disponible, generar los ficheros de síntesis
adecuados para las distintas vocales del español. Cada estímulo debe tener una duración
de 300 ms. En el Cuadro 7.1 aparece una lista de los parámetros proporcionados por el
sintetizador junto con su nombre y sus rangos (mínimo, máximo) y en el Cuadro 7.2 los
valores de los parámetros para generar las vocales sintéticas utilizadas en el experimento.
CUADRO 7.1.
222
A continuación, aparecen los parámetros de síntesis que se utilizaron para generar los
estímulos usados en el experimento de reconocimiento de vocales. Se presentan de este
modo para que el alumno pueda con facilidad insertarlos en el sintetizador de Klatt.
Además se resumen en el Cuadro 7.2 para poder comparar las variaciones de los
parámetros (especialmente los valores de F1 y F2).
Parámetros de síntesis
CUADRO 7.2.
223
experimento
224
Todos los estímulos tienen una duración de 300 ms y están normalizados en
intensidad (70 dB SPL).
En una primera parte se presentará a los sujetos cada uno de los estímulos y se les
pedirá que los describan verbalmente. La idea es determinar si, de modo espontáneo, los
estímulos son percibidos como muestras de habla.
225
experimenten la relación que existe entre el parámetro que está siendo manipulado y su
experiencia perceptiva. Al final de esta fase, el experimentador mostrará los parámetros
de síntesis utilizados en los estímulos que aparecerán en el experimento y discutirá las
diferencias si las hay.
Es tarea del experimentador hacer ver al alumno el camino que se está recorriendo
desde la producción de una señal lingüística hasta la percepción de esa señal, pasando
por la materialización acústica de la misma. En efecto, consideraciones acerca de la
producción de la vocal asociada a una teoría potente (como la teoría acústica de la
producción del habla) nos llevaron a determinar los valores físicos de los parámetros que
se utilizan en la construcción de estímulos para este experimento. Ahora, el experimento
muestra que esas diferencias en los valores físicos son las que determinan la cualidad de
nuestra experiencia perceptiva.
Parte I
226
-A continuación, vamos a presentaros varios sonidos. Vuestra tarea consiste,
simplemente, en describirlos verbalmente. [El experimentador presenta cada uno
de los cinco estímulos en el orden /a/,, /e/s, /i/s, /o/s, /u/,; ficheros de audio:
a.wav, e.wav, i.wav, o.wav y u.wav].
Parte II
3. Resultados: Ejemplo
[Compárense las Figuras 7.1 y 7.3 del manual de Prácticas. Formúlense dos reglas que
relacionen las características acústicas de las vocales (mostradas en la Figura 7.3) con las
dimensiones articulatorias de las mismas (que se recogen en la Figura 7.1). Una regla
debe concernir al lugar de articulación y otra al modo de articulación.]
3.2. Síntesis, utilizando una implementación del sintetizador por formantes de Klatt, de
las cinco vocales del español atendiendo a las consecuencias acústicas que tiene la
articulación diferencial de los distintos segmentos vocálicos
En el Cuadro 7.3, y a título de ejemplo, se proporcionan los valores de F0. Cada celda
indica que la frecuencia fundamental empezó adquiriendo un valor de 140 Hz y
paulatinamente descendió hasta 110 Hz.
CUADRO 7.3.
227
Valores de los parámetros utilizados para la síntesis de cada vocal
CUADRO 7.4.
228
En el Cuadro 7.5 aparecen los porcentajes de identificación de cada categoría vocálica
en cada estímulo.
CUADRO 7.5.
En la Figura 7.5 aparecen los histogramas en los que se representan los porcentajes de
identificación de cada categoría vocálica para cada estímulo.
229
230
Figura 7.5. Porcentajes de identificación de cada categoría vocálica en cada una de las
vocales sintéticas utilizadas como estímulos: /a/,, /e/,, /i/s, /o/,, /u/,. En la abscisa de cada
histograma, las categorías vocálicas del castellano; en la ordenada, porcentaje de
identificaciones del estímulo como perteneciente a cada categoría.
3.4. Mostrar cuáles son los parámetros físicos que usa nuestro sistema perceptivo para
codificar las distintas vocales del idioma
[A título de ejemplo se explicita el papel de uno de los parámetros físicos que usa
nuestro sistema perceptivo].
Sujeto experimental:
NOMBRE.......................................................................................
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde).
RESULTADOS [3]
231
[Compárense las Figuras 1 y 3 del Manual de Prácticas. Formúlense dos reglas que
relacionen las características acústicas de las vocales (mostradas en la Figura 7.3) con las
dimensiones articulatorias de las mismas (que se recogen en la Figura 7.1). Una regla
debe concernir al lugar de articulación y otra al modo de articulación.]
Síntesis, utilizando una implementación del sintetizador por formantes de Klatt, de las
cinco vocales del español atendiendo a las consecuencias acústicas que tiene la
articulación diferencial de los distintos segmentos vocálicos [3.2]
Valores de los parámetros utilizados para la síntesis de cada vocal [CUADRO 7.3]
232
Parte 1: Descripción verbal de los estímulos: [3.3.1]
Nota: Durante la realización del experimento, ocúltense las columnas encabezadas por
Est.
[CUADRO 7.4]
233
Porcentajes de identificación de cada categoría vocálica en cada estímulo
[CUADRO 7.51
234
En la Figura 7.5 aparecen los histogramas en los que se representan los porcentajes de
identificación de cada categoría vocálica para cada estímulo.
235
Porcentajes de identificación de cada categoría vocálica en cada una de las vocales
sintéticas utilizadas como estímulos: /a/,, /e/,, /i/,, /o/,, /u/,. En la abscisa de cada
histograma, las categorías vocálicas del castellano; en la ordenada, porcentaje de
identificaciones del estímulo como perteneciente a cada categoría. [FIGURA 7.5]
Mostrar cuáles son los parámetros físicos que usa nuestro sistema perceptivo para
codificar las distintas vocales del idioma. [3.4] [Obsérvese cómo la variación de F1 y F2
afecta a la categorización fonológica].
236
237
238
1. Introducción
Podría decirse que todo acto perceptivo apela a una cierta categorización del mundo.
Además, no toda variación física en estímulos perceptibles genera una variación de la
sensación, por lo que parece sensato suponer que el número de categorías perceptivas es
mucho menor que el de estímulos. No obstante, en esta Práctica vamos a hablar de
percepción categórica (o categorial) en el sentido estricto que ha asumido el concepto en
el ámbito de la percepción del habla (Liberman, Harris, Hoffman y Griffith, 1957).
239
Figura 8.1. Porcentaje de respuestas de identificación de una categoría fonológica en
función de la variable física pertinente.
240
Figura 8.2. Porcentaje de respuestas correctas a cada par del continuo acústico.
241
críticas de Múnich para los filtros auditivos (ver Práctica 6, Figura 6.3). Un Bark se
corresponde con la anchura de banda crítica en cualquier posición del rango de
frecuencia (y a una distancia de 1.3 mm en la membrana basilar). Por tanto, la escala de
Bark refleja la distancia tonotópica entre dos sonidos. Si dos pares de sonidos están
separados por el mismo número de Barks, entonces su representación en la membrana
basilar también es equidistante.
Además de la escala de Bark, existen otras escalas (como la de Cam, basada en las
anchuras de las bandas críticas estimadas por la escuela de Cambridge) que sirven al
mismo propósito. En esta Práctica emplearemos la primera; no obstante, una
representación gráfica de ambas puede verse en la Figura 8.3. (Cfr. Hartmann, 1998,
Figura 10.10).
Figura 8.3. Dos escalas diferentes de tonalidad (Bark y Cam) (Hartmann, 1998, Figura
10.10).
242
donde v es la frecuencia temporal del estímulo y z su valor en Barks.
Estas fórmulas son razonablemente precisas (con una desviación inferior a 0.05 Bark)
en el rango de 0.2 kHz a 6.7 kHz. No obstante, para frecuencias inferiores a 500 Hz la
relación entre v y z es aproximadamente lineal (z=v/100) y esta será la ecuación que
utilizaremos en esta Práctica para ese rango inferior de frecuencias.
8.Justificar si las funciones obtenidas cumplen con los criterios (a), (b) y (c) que se
243
han propuesto como definición parcial de percepción categórica. Establecer si
aparece el efecto de frontera fonémica.
2. Método
2.1. Estímulos
Los estímulos serán nueve vocales estacionarias que formarán un continuo desde la
categoría /i/ hasta la categoría /e/. El continuo se crea modificando las frecuen cias del
primer y el segundo formante (y sus correspondientes anchuras de banda) en pasos
iguales en la escala de Bark. Para calcular los valores de Bark se usan las fórmulas de
Traunmüller (1990) citadas más arriba.
Los valores de los formantes tercero, F3, cuarto, F4, y quinto, F5, se mantienen
constantes en 2500, 3500 y 4500 Hz, respectivamente. Sus anchuras de banda, B3, B4,
y B5, también se mantienen constantes en 200, 150 y 200 Hz, respectivamente. La
frecuencia fundamental, F0, va variando de 125 Hz a 80 Hz. La duración de los
estímulos es de 300 ms con una rampa de inicio (ascendente) y de finalización
(descendente) de 50 ms.
Los estímulos han sido sintetizados con el algoritmo de Klatt (véase la Práctica 7 de
este Manual) con los valores para sus parámetros que aparecen a continuación y se
resumen en el Cuadro 8.1:
244
CUADRO 8.1.
Valores de los parámetros utilizados para generar los estímulos sintéticos (Est. sint.)
utilizados en el experimento
245
246
2.2. Procedimiento y tarea
El experimento consta de dos Partes con dos tareas diferentes, una de identificación y
otra de discriminación variable 2IAX (modificada).
247
2.3. Instrucciones para el experimentador
248
los porcentajes).
Vais a escuchar los sonidos que acabáis de sintetizar. Como sabéis, se trata de un
conjunto de vocales. Algunas son instancias claras de la vocal /i/, otras son
instancias claras de la vocal /e/ y otras son vocales más ambiguas que podrían ser
/i/ o ser /e/.
Esta es una /i/ clara. [El experimentador presenta el archivo con el estímulo 11:
Practica8 i.wav]. Esta es una /e/ clara. [El experimentador presenta el archivo con
el estímulo 19: Practica8 I9jrototipo e.wav].
Ahora vais a escuchar alternativamente cada una de estas vocales empezando por
la /i/. [El experimentador presenta la secuencia alternativa de 10 estímulos
comenzando por el estímulo Ti: H_prototipo i. wav, D_prototipo e. wav].
A continuación voy a presentar, mezcladas, tanto vocales claras como las que
acabáis de oír, como otras más ambiguas. Vuestra tarea consiste en decidir, para
cada caso, si la vocal es una /i/ o una /e/. No debéis pensar mucho la respuesta.
Responded espontáneamente a todos los estímulos que se presenten. Si no estáis
seguros de qué contestar en algún caso, responded al azar. Los primeros 20
ensayos serán de práctica y no se tomarán en cuenta para el cálculo de
porcentajes. Indicad la respuesta marcando con una cruz la casilla de la columna
correspondiente del Cuadro 8.3 (/i/ si oís el sonido i, /e/ si oís el sonido /e/).
Durante la realización del experimento, tapad las columnas del Cuadro 8.3
encabezadas por el símbolo St. ¿Alguna pregunta?
249
Parte II: Experimento de discriminación
-Ahora vais a escuchar pares de estímulos como los que habéis escuchado hasta este
momento. Vuestra tarea es simplemente decidir si los dos estímulos son iguales o
diferentes basándoos en cualquier clave física que os permita distinguirlos.
-Los primeros 16 ensayos son de práctica, para que podáis familiarizaros con la tarea
y no se tomarán en cuenta para el cálculo de porcentajes. Después empezará el
experimento propiamente dicho.
3. Resultados: Ejemplo
3.1. Especificación de los valores de los parámetros de síntesis de los nueve estímulos
utilizados
En el Cuadro 8.2 aparecen los valores de los parámetros de síntesis de uno de los nueve
estímulos utilizados en los experimentos de identificación (Parte 1) y de discriminación
(Parte II).
CUADRO 8.2.
Valores de los parámetros de síntesis utilizados para generar los estímulos utilizados
en el experimento
250
PARTE 1: EXPERIMENTO DE IDENTIFICACIÓN
3.2. Obtención experimental de los porcentajes de identificación para cada estímulo del
continuo
CUADRO 8.3.
251
En el Cuadro 8.4 aparecen los porcentajes de identificación de la vocal /i/ para cada
estímulo del continuo.
CUADRO 8.4.
252
3.3. Obtención de la función de identificación asociada al continuo anterior
La frontera entre categorías (FC) es el estímulo que es identificado como /i/ el 50% de
las veces.
Por tanto, la frontera entre categorías está entre el estímulo 15 (F1=349 Hz y F2=1992
Hz) y el estímulo 16 (F1=369 Hz y F2=1955 Hz).
253
Como se estudió en la práctica anterior, F1 es el correlato más importante del modo
de articulación y, por tanto, calculamos, mediante interpolación lineal, la frontera con
respecto a ese valor.
Así pues, x=5 Hz y, por tanto, la frontera entre categorías es igual a 349 Hz + 5 Hz =
354 Hz. Es decir:
3.5. Obtención experimental de los porcentajes de discriminación correcta para cada par
de estímulos del continuo
En el Cuadro 8.5 se registran los resultados del experimento de discriminación (Parte II)
para el sujeto experimental. Las columnas I del cuadro indican la respuesta "iguales", las
columnas D, las respuestas "diferentes" y las columnas P del cuadro indican el par de
estímulos que se ha presentado en cada ensayo. Las columnas encabezadas por la letra P
han de ser ocultadas durante la realización del experimento.
CUADRO 8.5.
254
En el Cuadro 8.6 aparecen los porcentajes de respuestas correctas para los ensayos con
estímulos pertenecientes a categorías fonémicas diferentes (discriminación).
CUADRO 8.6.
255
3.6. Representación de la función de discriminación asociada al continuo anterior
Figura 8.5. Porcentaje de respuestas correctas para los ensayos con estímulos
pertenecientes a categorías fonémicas diferentes. La línea poligonal que aproxima una
función Gaussiana representa la función de discriminación.
3.7. Cálculo del valor aproximado donde se localiza el máximo de las funciones de
discriminación
Así pues, en la función de discriminación (Figura 8.5) el máximo se sitúa en el par 15-16.
256
Nótese que el par en el que la función de discriminación tiene un máximo (Figura 8.5)
está compuesto precisamente por los estímulos vocálicos en los que la pendiente de la
función de identificación es máxima (Figura 8.4), es decir, en la frontera entre categorías.
3.8. Justificación de que las funciones obtenidas cumplen con los criterios (a), (b) y (c)
que se han propuesto como definición parcial de percepción categórica
Análisis:
Sujeto experimental:
NOMBRE........................................................................................
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde).
RESULTADOS [3]
257
Valores de los parámetros de síntesis de los nueve estímulos utilizados
[CUADRO 8.2]
Nota: Durante la realización del experimento, ocúltense las columnas encabezadas por el
símbolo St.
[CUADRO 8.3]
258
Porcentajes de identificación de la vocal /i/ en cada estímulo del continuo
[CUADRO 8.4]
259
Porcentaje de respuestas de identificación de la vocal /i/ en función de la posición del
estímulo en el continuo. La línea poligonal que aproxima una función sigmoide representa
la función de identificación. [FIGURA 8.4]
260
Nota: Durante la realización del experimento, ocúltense las columnas encabezadas por P.
[CUADRO 8.5]
261
Porcentajes de discriminación de los miembros de cada par como pertenecientes a
categorías fonémicas diferentes
[CUADRO 8.6]
262
Porcentaje de discriminación de los miembros de cada par como pertenecientes a
categorías fonémicas diferentes en función de la composición de cada ar. La línea
poligonal que aproxima una función Gaussiana representa la función de discriminación.
[FIGURA 8.5]
Justificación de que las funciones obtenidas cumplen con los criterios (a), (b) y (c) que se
han propuesto como definición parcial de percepción categórica [3.8]
Análisis:
263
Justificación de las ventajas de utilizar una representación psicoacústicamente motivada
en la construcción de los estímulos experimentales [3.9]
Análisis:
264
265
1. Introducción
266
consonantes. Más en concreto los intervalos de octava (2:1), los de quinta (3:2) y los de
cuarta (4:3) se consideran consonancias perfectas, siendo el intervalo de octava el
máximamente consonante. Por su parte, los intervalos de sexta mayor (5:3), tercera
mayor (5:4), tercera menor (6:5) y sexta menor (8:5) se consideran consonancias
imperfectas. Esta (presunta) "universalidad" hace sospechar que quizá la base de esos
juicios esté ligada al funcionamiento del sistema auditivo o, cuando menos, indica que
merece la pena considerar esa posibilidad.
267
Figura 9.1. Representación esquemática de las sensaciones consonantes y disonantes que
produce la combinación de dos tonos puros, uno de frecuencia fija f,, y otro de
frecuencia variable f2=f,+ f. 4f_, incremento de f, a partir del cual se discriminan los dos
tonos. 4fcB, incremento de f a partir del cual el tono f2 cae fuera de su banda crítica.
[Roederer, (2008). The Physics and Psychophysics of Music. Berlin: FIGURE 2.12].
Por tanto, parece que la banda crítica marca un límite "natural" que separa las
sensaciones disonantes de las consonantes cuando se presentan al sujeto dos tonos puros
simultáneamente. En síntesis: si la diferencia entre las respectivas frecuencias temporales
de dos tonos puros es menor que una banda crítica, los tonos suenan disonantes; si la
diferencia es mayor, entonces suenan consonantes (Rossing, 1990). En realidad, la
transición que se produce entre la sensación de aspereza y la sensación de suavidad es
gradual y, por tanto, no debe esperarse un cambio abrupto. Así pues, en tomo al límite
268
de la banda crítica existiría un rango aproximado de frecuencias que marcarían esa
transición gradual que se da entre la percepción consonante y disonante de tonos puros.
269
3.Verificar si el par percibido como máximamente disonante se corresponde con el
predicho por la gráfica de la Figura 9.2.
2. Método
2.1. Estímulos
Se utilizarán cuatro tipos de estímulos diferentes, todos ellos constituidos por suma de
dos tonos puros en el que uno de ellos tiene una frecuencia temporal de 1000 Hz en la
fase de entrenamiento y de 2000 Hz en la fase experimental. Cualquier estímulo obedece
por tanto a la siguiente ecuación:
con v, fijo, vi=1000 Hz o 2000 Hz y v2 variable. Todos los estímulos tienen una
duración de 1 segundo y están normalizados en intensidad.
La descripción de los estímulos de cada bloque se detalla en los Cuadros 9.1 y 9.2
(dada la naturaleza del experimento solo se detalla la frecuencia de los estímulos; la
amplitud y la fase no están explícitamente indicadas).
2.2. Predicciones
Teniendo en cuenta la información proporcionada por las Figuras 9.1 y 9.2, se pueden
realizar las siguientes predicciones.
üi.Predicción 2(p2): la anchura de la banda crítica (en Hz) para 1000Hz, según la
fórmula de Cambridge (Práctica #6), es:
270
Según la Figura 9.2 el tono que se percibe con la máxima aspereza o disonancia
es aquel que difiere del tono test en 0.25 la banda crítica. Por tanto, la
combinación de un tono de 1000 Hz con un tono de aproximadamente 1034 Hz
(1000 + 0.25 x 132.64) se ha de percibir con la aspereza máxima.
iii.Predicción 3(p3): según las Figuras 9.1 y 9.2 la combinación de un tono de 1000
Hz con un tono de 1140 Hz se ha de percibir en el límite entre la consonancia y la
disonancia.
iv.Predicción 5(p5): más allá de la banda crítica no todas las combinaciones son
igualmente consonantes. Tal y como se deduce de la introducción, los intervalos
de octava serán más consonantes que cualesquiera otros intervalos.
CUADRO 9.1.
Valores de las frecuencias temporales de los dos tonos puros componentes de cada
estímulo sonoro y predicción de la experiencia perceptiva
v, =1000Hz
271
CUADRO 9.2.
Valores de las frecuencias temporales de los dos tonos puros componentes de cada
estímulo sonoro y predicción de la experiencia perceptiva
vl = 2000Hz
272
El paradigma experimental utilizado es el de identificación, con dos fases: fase de
entrenamiento y fase experimental. La fase de entrenamiento tiene tres partes. En todas
estas partes el experimentador usará los estímulos correspondientes a un tono puro de
referencia de 1000 Hz. En la primera parte, se presentarán tres veces a los sujetos el
primer estímulo de los tipos 1 (Estl) y 2 (Esta) y el último estímulo del tipo 4 (Est7) para
proporcionarle las categorías de respuesta (pulsación, aspereza y consonancia,
respectivamente). No obstante, antes de especificarle la categoría asociada a cada
estímulo, el experimentador pedirá a cada participante que informe sobre el modo en que
espontáneamente percibe cada estímulo, esto es, sobre si el estímulo es percibido como
consonante o no. Una vez proporcionadas las etiquetas de los estímulos, en la segunda
parte del entrenamiento, cada uno de ellos será presentado (alternativamente) en cinco
ocasiones y el experimentador se asegurará de que el participante puede discriminarlos.
En la tercera parte del entrenamiento, el experimentador presentará al sujeto los
estímulos con distintos niveles de aspereza y consonancia (tres veces cada par).
273
En cualquier caso, el experimentador debe ser cuidadoso para no sesgar a priori en la
fase de entrenamiento al sujeto sobre cómo ha de percibir los estímulos. En esa fase
primera de entrenamiento, el experimentador solo informará al sujeto de que algunos
estímulos le sonarán más consonantes (eufónicos, fluidos, limpios...) y otros le sonaran
más disonantes (ásperos, rugosos...), pero no asociará de modo explícito esas categorías
con cada uno de los estímulos. El experimentador anotará cuidadosamente cuál es la
sensación espontánea que generan los estímulos en el participante. Solo en la segunda
fase del entrenamiento se proporcionarán al participante las categorías propuestas en esta
práctica. Esto no quita fuerza a la interpretación de los resultados. De hecho, nuestro
interés principal es determinar si los distintos estímulos suscitan en el oyente sensaciones
que este clasifica en categorías perceptivas diferentes, con independencia del nombre que
se asigne a esas categorías. En cualquier caso, para evitar que el sujeto haya aprendido
simplemente a asociar una etiqueta verbal a un estímulo concreto (con independencia de
la disonancia o consonancia que le suscita), en la fase experimental el sujeto ha de
evaluar estímulos con una frecuencia distinta a la que fue expuesto en la fase de
entrenamiento.
b)E2 1000.wav: par de tonos puros con frecuencias de 1000 y 1005 Hz.
e)ES consonancia] par de tonos puros con frecuencias de 1000 y 1140 Hz.
274
3.PRACTICA9_EXPERIMENTO 2. Contiene un archivo de audio wav, Secuencia
de estímulos usados en la fase experimental con el tono de 2000 Hz.
A.Fase de entrenamiento
Parte 1
-En este experimento vais a escuchar distintos tipos de sonidos. Unos os parecerán
más consonantes (más lim pios, más fluidos, más eufónicos) y otros os parecerán
más disonantes (más ásperos, más rugosos, más turbios).
-Escuchad estos dos estímulos: [El experimentador presenta los Estímulos 3 (aspereza
máxima: E31000) y 7 (consonancia máxima: 000) tres veces cada uno].
-Escuchad ahora este estímulo: [El experimentador presenta tres veces el Estímulo 1:
El pulsación10001.
Parte 2
-Ahora vamos a presentaros los tres estímulos que habéis oído para asegurarnos de
que sabéis cómo etiquetarlos. [El experimentador presenta alternativamente los
archivos Elpulsaciónl1000, E7consonanciamax1000 y E31000 -tres veces cada
uno- especificando sus categorías asociadas y asegurándose de que el participante
puede discriminarlos].
Parte 3
-A lo largo del experimento os aparecerán estos estímulos junto con algunos más. En
concreto, aparte de las pulsaciones, hay estímulos ásperos en distintos grados y
consonantes en distintos grados. Estos son dos estímulos con dos grados distintos
275
de aspereza: [El experimentador presenta al sujeto tres veces los Estímulos 3 y 4;
y E4 Y estos son dos estímulos con distintos grados de consonancia (el
experimentador presenta tres veces los Estímulos 6 y 7; E6consonancia21000 y
E7consonanciamax1000].
-¿Alguna pregunta?
B.Fase experimental
Bloque de práctica
-Vais ahora a escuchar distintos estímulos como los que se os han presentado hasta
ahora, pero con una tonalidad diferente. Vuestra tarea consiste en clasificar cada
estímulo utilizando estas cinco categorías: pulsación (P), aspereza (A), aspereza +
(A+), consonancia(C) y consonancia + (C+). Debéis utilizar las categorías "+"
cuando el estímulo os parezca especialmente áspero o especialmente consonante.
-Primero tendréis un bloque de práctica para que os familiarices con la tarea. [El
experimentador presenta a los sujetos los 21 primeros ensayos de Practica9 Por
favor, tapad las columnas del Cuadro 9.3 encabezadas por el símbolo Est.
3. Resultados: Ejemplo
Bloque de práctica
En el Cuadro 9.3 se registran los resultados obtenidos por la persona ejemplo (sujeto
experimental) en la evaluación del grado de consonancia de los distintos pares de tonos
puros.
276
CUADRO 9.3.
v, =2000 Hz
En el cuadro 9.4 se registran los resultados obtenidos por la persona ejemplo (sujeto
experimental) en la evaluación del grado de consonancia de los distintos pares de tonos
puros.
CUADRO 9.4.
v,= 2000 Hz
277
278
En el cuadro 9.5 aparecen los porcentajes de la categoría percibida en cada
combinación y la verificación de las predicciones.
CUADRO 9.5.
v1=2000 Hz
279
280
Figura 9.3. Porcentajes de la categoría percibida para cada uno de los siete estímulos. P,
pulsaciones; A. aspereza; A+ aspereza máxima; C, consonancia; C+, consonancia
máxima.
281
y 2 son percibidos, mayoritariamente, como pulsaciones (predicción 1); los estímulos 3 y
4 son percibidos mayoritariamente como ásperos (predicción 2) y los estímulos 6 y 7 son
percibidos mayoritariamente como consonantes (predicciones 4 y 5).
3.5. Inspeccionar y describir los resultados obtenidos para el Estímulo 5 (E5). ¿Por qué
es particularmente interesante el análisis de los resultados obtenidos con este
estímulo?
3.6. Aplicaciones
282
2. Calcúlese la frecuencia del segundo tono para que el par se perciba con una
aspereza máxima. Justifíquese teóricamente la respuesta.
Sujeto experimental:
NOMBRE.......................................................................................
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde
RESULTADOS [3]
Bloque de práctica
Nota: Durante la realización del experimento, ocúltense las columnas encabezadas por
Est.
v1=2000 Hz
[CUADRO 9.3]
283
Bloque experimental (Ensayos para el análisis)
Nota: Durante la realización del experimento, ocúltense las columnas encabezadas por
Est.
v,=2000 Hz
[CUADRO 9.4]
284
285
Porcentaje de la categoría percibida y verificación de las predicciones v,=2000 Hz
[CUADRO 9.5]
286
287
Porcentajes de la categoría percibida para cada uno de los 7 estímulos. [FIGURA 9.3]
288
Verificación de si el par percibido como máximamente disonante se corresponde con el
predicho por la gráfica de la Figura 9.2 [3.3]
Aplicaciones [3.6.]
289
conjuntos de tonos. Además, el alumno deberá generar los estímulos para verificar que
sus predicciones son correctas.
2. Calcúlese la frecuencia del segundo tono, para que el par se perciba con una
aspereza máxima. Justifíquese teóricamente la respuesta.
290
291
1. Introducción
Descubierto por Celeste McCollough en 1965, el efecto que lleva su nombre consiste
en que, previa adaptación durante unos minutos a un enrejado con franjas alternas negras
y con matiz de color en una orientación dada, las franjas acromáticas claras de la misma
orientación en un estímulo test se perciben tenuemente coloreadas con el matiz
complementario (Figura 10.1, Thompson y Burr, 2009). Se dice que este post-efecto es
contingente a la orientación porque el particular matiz ilusorio complementario percibido
en las franjas claras del estímulo test acromático depende de la particular orientación de
estas. Por ejemplo, si la persona se adapta a un enrejado con franjas verticales negras y
rojas alternas, percibirá un tenue color verde en las franjas claras verticales del estímulo
test; por el contrario, si la persona se adapta a un enrejado con franjas horizontales
negras y ver des, percibirá un tenue color rojo en las franjas claras horizontales del
estímulo test (Figura 10.1).
292
Figura 10.1. La adaptación a enrejados con franjas rojas y verdes ortogonales (A) tiene
como consecuencia que las franjas claras con la misma orientación del estímulo test (B)
se perciban tenuemente coloreadas con los colores complementarios (C) (En C se han
coloreado las franjas para hacer visible el efecto perceptivo) [Thompson, M. & Burr, D.
(2009). Visual Aftereffects. Current Biology 19 (1), R11-R14. Figura 4. © Copyrigth
Elsevier 2009. Figura reproducida con permiso].
Originalmente, McCollough encontró que este post-efecto puede durar una hora o
más (McCollough, 1965). En la mayoría de las personas, el efecto McCollough persiste
solo durante unos segundos, como los post-efectos regulares, y después desaparece; en
muy pocas, persiste en los minutos posteriores a la demostración. Pero se ha encontrado
que en algunas personas el efecto puede persistir durante horas, días, semanas
(Stromeyer & Mansfield, 1970), meses (Jorres & Holding, 1975) e ¡incluso años! Esas
personas siguen percibiendo el color complementario al de adaptación en patrones de la
vida cotidiana que poseen franjas blancas y negras, como los códigos de barras. Además,
su duración puede variar con el consumo de cafeína y otras drogas psicoactivas.
293
Nota importante: Conocida esta información, las personas que realicen la Práctica
deberían entregar su consentimiento por escrito antes de comenzar la Demostración.
Algunas variables de las que depende el efecto son: (a) el tiempo de exposición a los
estímulos adaptadores; (b) el tiempo de demora de la visión del estímulo test; (c) la
orientación relativa del enrejado test respecto del enrejado adaptador; (d) el ojo (derecho,
izquierdo) expuesto a la adaptación; (e) la orientación absoluta en la retina del estímulo
test; (f) la localización relativa del enrejado test en la retina respecto a la región de la
retina que ha sido expuesta a la adaptación (el post-efecto es más efectivo cuando la
imagen retiniana del enrejado test tiene la misma localización retiniana que la del enrejado
adaptador); y (g) la frecuencia espacial fundamental del enrejado adaptador o del
estímulo test (o anchura de las franjas) (Uhlarik & Osgood, 1974). Otras variables son
enumeradas por Stromeyer (1978).
Figura 10.2. Evolución de la fuerza del efecto con el tiempo de demora desde el final de
la fase de adaptación, supuesto que la fuerza máxima del efecto es igual a 100. La
relación entre la fuerza del efecto McCollough (S) y el tiempo (t) desde el cese de la
294
adaptación (en minutos) viene dado por la ecuación S=]00to.33 (MacKay & MacKay,
1974). Esta ecuación es la que mejor se ajusta a resultados experimentales obtenidos
utilizando el método de cancelación del matiz (MacKay & MacKay, 1974).
La causa precisa del efecto es aún hoy desconocida. Para explicarlo, McCollough supuso
la existencia en el Sistema Visual Humano de mecanismos sensibles a la orientación de
los bordes del estímulo adaptador y que, a la vez, son diferencialmente sensibles a la
longitud de onda. La primera explicación funcional supone que el efecto es debido a la
adaptación o fatiga de esos mecanismos de codificación. Esta explicación se basa en el
supuesto general de que la estimulación repetida con un patrón tiene como consecuencia
fatigar el mecanismo que lo codifica. McCollough (1965) postuló simplemente que "en el
Sistema Visual, mecanismos detectores de bordes están sujetos a la adaptación al color,
respondiendo con sensibilidad decreciente a aquellas longitudes de onda con las cuales
han sido más recientemente estimulados" (p. 1115). La falta de transferencia intraocular
en el efecto McCollough indica que en VI (región del córtex visual en la que existen
neuronas sintonizadas tanto a la frecuencia espacial, orientación, como al color) las
aferencias de ambos ojos que llegan a las neuronas que responden al color no están
combinadas, es decir las neuronas que codifican el color en V1 son predominantemente
monoculares (Coltheart, 1973), aunque recientemente existen evidencias a favor de
células binoculares para la codificación del color (Peirce et al., 2008).
La Teoría de los Procesos Oponentes explica el efecto por la fatiga de la parte del
mecanismo oponente implicado en la codificación del estímulo adaptador. La adaptación
a un campo de color rojo vertical fatiga la parte "roja" del mecanismo oponente R/G con
sensores en orientación vertical; por tanto, lo que se percibe en el estímulo acromático es
el resultado de la acción de la parte "verde" del mecanismo R/G con sensores en
orientación vertical, y recíprocamente (Figura 10.6).
295
solo un caso simple de fatiga de las neuronas y que existen neurotransmisores implicados
que parecen ser los responsables de su larga duración (Shute, 1979). [Una teoría
computable del efecto puede verse en Ciroux (2006)].
Figura 10.3. Explicación del efecto McCollough según la teoría de procesos oponentes.
A.Test. Sensores verticales y horizontales (cada uno compuesto de dos partes
antagonistas dibujadas como elipses verticales) del mecanismo oponente R/G codifican
296
respectivamente las franjas verticales y horizontales del enrejado test (en la región
inferior solo se ha mostrado un sensor de cada orientación). Como la intensidad de la
respuesta de ambas partes es parecida, la experiencia perceptiva es acromática. Por
supuesto, existen también sensores en otras orientaciones, pero su actividad es nula o
casi nula. B.Fase de adaptación. Con la exposición prolongada al enrejado rojo vertical se
fatiga el mecanismo oponente de los sensores verticales que responde a longitudes de
onda larga (rojo), pero el mecanismo oponente de los sensores que responde a longitudes
de onda media (verde) sigue activa; con la exposición al enrejado verde horizontal, se
fatiga el mecanismo oponente de los sensores horizontales verticales que responde a
longitudes de onda media (verde), pero el mecanismo oponente de los sensores que
responde a longitudes de onda larga (rojo) sigue activa. C.Post-test. Al volver a mirar el
enrejado acromático, solo aquellas partes de los sensores que siguen activas responden
ahora: la parte vertical activa (verde) del mecanismo oponente responde ahora a las
franjas verticales claras y la parte horizontal activa (roja) del mecanismo oponente, a las
horizontales claras, provocando el efecto. (Los respectivos mecanismos oponentes con
baja actividad debido a la fatiga se han representado en gris).
3.Estimar y representar la fuerza del efecto en función del tiempo del cese de la
adaptación al enrejado test (en minutos y para algunos sujetos experimentales, en
días).
2. Método
2.1. Estímulos
a)Estímulo test: Cualquier tipo de patrón con franjas blancas y negras con
orientaciones horizontal y vertical (Figura 10.4A). En la Figura 10.4A aparecen
dos tipos de patrones, pero otros estímulos con patrones parecidos pueden servir
como estímulo test.
297
enrejado con franjas horizontales de color negro y verde (Figura 10.4B). [Post-
efectos rojos y verdes se generan más fácilmente que post-efectos amarillos y
azules (Stromeyer, 1978)].
2.4. Aparatos
La secuencia temporal para conseguir el efecto es la siguiente (Power, Hausfeld & Gorta,
1981, p. 115):
1.Fase del test. Presentación previa a los sujetos experimentales del enrejado test con
el fin de comprobar que se compone de franjas verticales y horizontales blancas y
negras.
298
franjas blancas verticales del test se perciben ahora de color verdoso y las
horizontales, de color rosa pálido.
Las siguientes instrucciones son útiles que la Práctica resulte adecuadamente realizada:
1.Lo óptimo para lograr un efecto potente es que la persona mire durante treinta
segundos cada estímulo adaptador alternadamente y ello durante veinte minutos,
aunque con diez minutos en total y quince segundos cada estimulo basta para
obtener el efecto.
299
Figura 10.4. A.Estímulos test habituales para comprobar el efecto McCollough. (Una
cualquiera de esas dos imágenes basta como estímulo de comprobación). B.Estímulos
adaptadores para inducir el efecto. Para potenciar el efecto vía contraste simultáneo
cromático deben utilizarse ambos estímulos presentados alternadamente. Para lograr el
efecto, nótese primero que las franjas claras de cualquiera de los estímulos test son
blancas, es decir, carecen de matiz de color. Luego, mírese (sin fijar la mirada en un
punto particular) alternativamente los estímulos adaptadores durante quince segundos
cada uno (20 presentaciones de cada enrejado cromático adaptador, 40 presentaciones en
total). Finalmente mírese otra vez al estímulo test elegido. Las franjas claras verticales se
verán ahora verdosas y las horizontales, rojizas. Si se inclina la cabeza o se gira la página
45 grados, se verán las franjas claras otra vez blancas. Si la inclinación o el giro es de 90
grados, los matices de color ilusorios se intercambian. Para notar la duración del efecto,
después de la adaptación mire el estímulo test de cuando en cuando.
300
6.El efecto depende de la frecuencia espacial. Por ello, si se realiza la presentación
con Power Point hay que comprobar que la frecuencia espacial fundamental del
estímulo test (o de modo equivalente, la anchura de las franjas con perfil de
luminancia en forma de onda cuadrada) sea igual o parecida a la de los estímulos
adaptadores.
Observad esta imagen y notad que las franjas verticales y horizontales son blancas
y negras y no tienen matiz de color.
-Ahora vais a mirar cada una de estas imágenes durante treinta segundos, una detrás
de otra, alternativamente.
-Para evitar post-efectos indeseados en esta fase, debéis mirar al centro de cada
imagen, pero moviendo algo los ojos en torno a un círculo imaginario en la parte
central de la imagen.
301
[Comprobación de la duración del efecto]
-En cada presentación estimad la saturación del color ilusorio respecto de la de este
en una escala de 0 a 100, siendo 100 la saturación con la que ahora veis el color
ilusorio y 0 si no percibís ningún matiz de color.
-Cada día, al comenzar la clase, voy a volver a presentar el estímulo adaptador para
ver si a alguno de vosotros le dura el efecto.
-Si aún veis el efecto, anotad la saturación del color ilusorio en la casilla de la
columna correspondiente del Cuadro 10.2.
3. Resultados: Ejemplo
Descripción cuando se mira inclinando la cabeza o girando el enrejado test 45°y 90°
Cuando se mira el enrejado test con la cabeza inclinada o girado 45 grados, el efecto
302
ilusorio deja de percibirse. Si se mira con la cabeza inclinada o el enrejado test girado 90
grados, ahora las franjas horizontales se perciben verdosas y las verticales, de color rosa.
Descripción del efecto al mirar el estímulo test con un ojo adaptado y con otro sin
adaptar
Con el ojo adaptado se percibe el efecto como en la condición binocular; con el ojo sin
adaptar, el efecto desaparece.
3.2. Estimación y representación gráfica de la fuerza del efecto (FE) en función del
tiempo desde el cese de la adaptación
En el Cuadro 10.1 aparece la estimación de la fuerza del efecto (en un escala de 0 a 100,
donde 100 es la fuerza del efecto inmediatamente después de la adaptación) estimado por
la persona sujeto experimental ejemplo. En la Figura 10.4 se representa la fuerza del
efecto en función del tiempo (en minutos) transcurrido desde la adaptación.
CUADRO 10.1.
303
Figura 10.5. Fuerza del efecto McCollough en función del tiempo (en minutos)
transcurrido desde el cese de la adaptación.
CUADRO 10.2.
Estimación de la fuerza del efecto en función del tiempo transcurrido (en días) desde
la adaptación
304
Figura 10.6. Fuerza del efecto McCollough en función del tiempo (en días) transcurrido
desde el cese de la adaptación.
Sujeto experimental:
NOMBRE.......................................................................................
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde).
RESULTADOS [3]
305
Descripción del efecto en general
Descripción del efecto al mirar el estímulo test con un ojo adaptado y con otro sin
adaptar.
306
Estimación y representación gráfica de la fuerza del efecto en función del tiempo desde el
cese de la adaptación [3.2]
[CUADRO 10.1]
307
Fuerza del efecto McCollough en función del tiempo (en minutos) transcurrido desde el
cese de la adaptación. [FIGURA 10.5]
Estimación de la fuerza del efecto en función del tiempo (en días) transcurrido desde
la adaptación
[CUADRO 10.2]
308
Fuerza del efecto McCollough en función del tiempo (en días) desde el cese de la
adaptación. [FIGURA 10.6]
309
310
1. Introducción
311
lumínica que ilumina al objeto o al filtro; /1(k) función de reflectancia del objeto (p(X)) o
función de transmitancia del filtro (i(X)); x(a.), y(Á,),z(í1,), funciones de
emparejamiento, ajuste o igualación de colores del observador colorimétrico patrón CIE-
1931 (Figura 11.1 y Cuadro 11.3); y k, factor de normalización.
Las fórmulas para el cálculo de los valores triestímulo son ligeramente diferentes para
fuentes lumínicas y para objetos o filtros.
I.Fuentes lumínicas
De modo que para un objeto difusor o transmisor perfectos (/3(7)=1), Y=100. Así pues,
312
el valor triestímulo Y indica el porcentaje de luz reflejada o transmitida por el objeto.
313
correspondientes del Cuadro 11.3. La función y(A) es idéntica a la función de eficiencia
espectral lumínica para visión fotópica V(,.).
1.2.3. Diagrama de cromaticidad x-y para el observador colorimétrico patrón CIE 1931
(Figura 12.2A)
El diagrama de cromaticidad x-y CIE (1931) aparece en la Figura 11.2. La línea curva
(ver Figura 11.2 A) en forma del contorno de la puntera de la suela de un zapato es el
lugar en el que se localizan las luces monocromáticas del espectro visible (lugar del
espectro o locus espectral).
Según Wyszecki & Stiles (1982, pp. 175), la longitud de onda dominante de un
estímulo de color es la longitud de onda de una luz monocromática que al mezclarse con
314
un estímulo acromático particular iguala perceptivamente el estímulo de color dado.
Puesto que no todas las rectas con origen en el punto acromático y que pasan por un
punto cualquiera del diagrama de cromaticidad cortan el locus espectral, no todas las
luces tienen longitud de onda dominante. Una luz compuesta que tenga longitud de onda
dominante se percibe con el matiz de la luz monocromática de esa longitud de onda pero
con menor saturación, dado que las luces que están situadas en el locus espectral están
saturadas al 100%.
Sea (xei yc) las coordenadas de cromaticidad del estímulo de color cuya pureza de
excitación queremos calcular; (xw, yw), las coordenadas del iluminante (D65, A, B, etc)
(en esta Práctica supondremos que las coordenadas del iluminante patrón o punto
acromático son x,=0.33, y,,=0.33) y por último, (xd, yd), las coordenadas de la longitud
de onda dominante para el estímulo de color dado. La pureza de excitación, pe, se define
así:
Por ejemplo, para el color dado con coordenadas (0.45, 0.40) y longitud de onda
dominante ~d = 585nrn con coordenadas (0.54, 0.45), la pureza de excitación, pej es:
315
Otras ecuaciones para determinar la pureza de excitación (pe) (Wyszecki y Stiles,
1982 Eq. 1(3.4)) son:
En todas las ecuaciones anteriores la pureza de excitación puede adoptar valores entre
0 y 1. Cuanto más próximo esté el estímulo de color a la longitud de onda dominante,
más puro es el estímulo y por lo tanto, la pureza de excitación estará próxima a 1 y
viceversa.
316
1.3. Objetivos de la Práctica
317
inferir su matiz.
4.En el caso de los pétalos de flores, comparar los resultados con los originales
obtenidos por Eckert & Carter (2000).
2. Método
2.1. Estímulos
I.Fuentes lumínicas
Las gráficas de las funciones de radiancia, P(L), de las fuentes lumínicas L 1, L2, L3,
L4, L5 y L6 aparecen en la Figura 11.4.
318
319
320
Figura 11.4. Funciones de radiancia, P(X), de las fuentes lumínicas cuyos valores
triestímulo y coordenadas de cromaticidad han de ser calculados.
321
Figura 11.5. Distribución de irradiancia espectral, P(X), normalizada de una lámpara con
filamento de tungsteno (Wyszecki y Stiles, 1982, Figura 5(1.2(.2)). En la Práctica es la
fuente lumínica J.
CUADRO 11.1.
II. Objetos
322
Figura 11.6. Fotografía de un clavel (arriba), una margarita (abajo a la izquierda) y una
rosa (abajo a la derecha), junto con sus pétalos aislados. [Eckert, M. P. & Carter, G. A.
(2000). Flowers produce variations in color saturation by arranging petals at oblique and
varying angles. Journal of the Optical Society of America A, 17, 825830. Figura 1. ©
Copyright OSA 2000. Figura reproducida con permiso]. Deliberadamente la imagen
cromática se ha reproducido en escala de grises como una imagen acromática para
eliminar los matices de color. Precisamente uno de los objetivos de la Práctica es inferir
el matiz de los pétalos aislados de cada flor a partir de sus coordenadas de cromaticidad,
conocidos el iluminante y las respectivas funciones de reflectancia de los pétalos.
323
324
Figura 11.7. Funciones de reflectancia espectral, p(7L), de un pétalo aislado de un clavel
(A), de una margarita (B) y de una rosa (C). (Eckert & Carter, 2000, figuras 4, 5, 6
(arriba)). [M.P.Eckert & G.A.Carter (2000). Flowers produce variations in color
saturation by arranging petals at oblique and varying angles. Journal of the Optical
Society of America A, 17, 825-830. Figuras 4, 5 y 6. ©Copyright OSA 2000. Figuras
reproducidas con permiso]. Las funciones que se utilizan en la Práctica corresponden a
las curvas exteriores en cada panel.
CUADRO 11.2.
325
S(X,), función de radiancia de la fuente lumínica que ilumina al objeto o al filtro; /3(k),
función de reflectancia del objeto (p(2)) o función de reflectancia del filtro (i(7,,)); x(Á,),
y(Á,), z(Á,), las funciones de emparejamiento o igualación del color (Cuadro 11.3); Ak
intervalo de muestreo; k, factor de normalización. Para el cálculo de los valores
triestímulo, las integrales de la Introducción se sustituyen por sumas. Así pues:
I.Fuentes lumínicas:
326
2.2.2. Cálculo de las coordenadas de cromaticidad (procedimiento simplificado)
El material auxiliar contiene un programa de Excel (CIE1931.xls) para calcular los valores
triestímulo (con el procedimiento simplificado descrito antes) y las coordenadas de
cromaticidad, con el fin de evitar operaciones tediosas a los alumnos, sobre todo cuando
el estímulo de color viene definido con una función discreta o discretizada con muchos
327
valores.
El papel del experimentador en esta Prácticas se limita a guiar a los alumnos en los
difentes cálculos a realizar.
CUADRO 11.3.
Funciones de igualación del color z(7L)) del observador colorimétrico patrón CIE
1931 y funciones de respuesta cromática -b(r(,)-g( a intervalos de 5 nm
328
329
3. Resultados: Ejemplo
En los Cuadros 11.4 y 11.5 se muestran los resultados del cálculo de los valores
triestímulo simplificados para la fuente lumínica L1 y el pétalo de clavel,
respectivamente, así como la longitud de onda dominante y la predicción de su color.
I.Fuentes lumínicas
CUADRO 11.4.
330
Valores triestímulo modificados, coordenadas de cromaticidad y matiz de lafuente
lumínica L1
II. Objetos
CUADRO 11.5.
El cálculo de valores triestímulo permite comparar fuentes lumínicas entre sí. Como
ejercicio:
331
En la Figura 11.8 se representa el locus espectral para el observador colorimétrico patrón
CIE 1931, así como la localización de la fuente lumínica L1 y del objeto 01 (pétalo del
clavel) en el diagrama cromático.
3.4. Comparación con los resultados originales obtenidos por Eckert & Carter (2000) en
el caso de pétalos de flores
Las coordenadas de cromaticidad del objeto 01 (pétalo del clavel) coincide con los
resultados de Eckert & Carter (2000) (Figura 11.9 A). La predicción del matiz de color a
partir de su representación en el diagrama de cromaticidad CIE 1931 (rosa claro)
332
coincide con la experiencia fenoménica (Figura 11.9 B).
333
Figura 11.9. A.Coordenadas de cromaticidad (rombos) de los pétalos aislados (iluminante
D65) en el diagrama de cromaticidad x-y CIE 1931. B.Las flores y los pétalos de la
Figura 11.6 en color. [Eckert, M. P. & Carter, G. A. (2000). Flowers produce variations
in color saturation by arranging petals at oblique and varying angles. lournal of the
Optical Society of America A, 17, 825-830. Figuras 1 y 7. © Copyright OSA 2000.
Figuras reproducidas con permiso].
Sujeto experimental:
NOMBRE.......................................................................................
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde).
RESULTADOS [3]
334
Cálculo de los valores triestímulo modificados y de las coordenadas de cromaticidad
[3.1]
I.Fuentes lumínicas
[CUADRO 11.4]
II. Objetos
335
Valores triestímulo modificados, coordenadas de cromaticidad y matiz de los objetos
[CUADRO 11.5]
336
Representación en el diagrama cromático x-y CIE 1931 de las fuente lumínicas (círculos)
y de los objetos (triángulos) utilizados en la Práctica. [FIGURA 11.81
Comparación con los resultados originales obtenidos por Eckert & Carter (2000) en el
caso de pétalos de flores [3.4]
337
338
A.Coordenadas de cromaticidad (rombos) de los pétalos aislados (iluminados con D65)
en el diagrama de cromaticidad x-y CIE 1931. B.Las flores y los pétalos en color.
[Eckert, M. P. & Carter, G. A. (2000). Flowers produce variations in color saturation by
arranging petals at oblique and varying angles. Journal of the Optical Society of America
A, 17, 825-830. Figuras 1 y 7 © Copyright OSA 2000.Figuras reproducidas con
permiso]. [FIGURA 11.91
I.Fuentes lumínicas
339
340
341
Funciones de radiancia, P(2,), de las fuentes lumínicas cuyos valores triestímulo y
coordenadas de cromaticidad han de ser calculados. [FIGURA 11.4]
Fuente lumínica Ll
342
x=
Y=
Fuente lumínica L2
x=
Fuente lumínica L3
x=
Fuente lumínica L4
343
x=
Y=
Fuente lumínica L5
x=
Fuente lumínica L6
x=
344
x=
Y=
345
[Figura 11.5]
[CUADRO 11.1]
Fuente lumínica L7
x=
II. Objetos
346
Funciones de reflectancia, p(a,), de los pétalos de un clavel. La función que se utiliza en
la Práctica es la correspondiente a la curva exterior [Eckert, M. P. & Carter, G. A.
(2000). Flowers produce variations in color saturation by arranging petals at oblique and
varying angles. Journal of the Optical Society of America A, 17, 825-830. Figura 4. ©
Copyright OSA 2000. Figura reproducida con permiso]. [Figura 11.7A]
[CUADRO 11.2A]
x=
347
Objeto 02: pétalo de una margarita.
Funciones de reflectancia, p(),), de los pétalos de una margarita. La función que se utiliza
en la Práctica es la correspondiente a la curva discontinua exterior [Eckert, M. P. &
Carter, G. A. (2000). Flowers produce variations in color saturation by arranging petals at
oblique and varying angles. Journal of the Optical Society of America A, 17, 825-830.
Figura 5. © Copyright OSA 2000. Figura reproducida con permiso]. [FIGURA 11
[CUADRO 11.2B]
348
x=
Y-
Funciones de reflectancia, p(a,), de los pétalos de una rosa. La función que se utiliza en
la Práctica es la correspondiente a la curva discontinua exterior. [Eckert, M. P. & Carter,
G. A. (2000). Flowers produce variations in color saturation by arranging petals at
oblique and varying angles. Journal of the Optical Society of America A, 17, 825-830.
Figura 6. Copyright OSA 2000. Figura reproducida con permiso]. [Figura 11.7C]
[CUADRO 11.2C]
349
x=
Y=
350
351
1. Introducción
Apariencia de color es el aspecto de la percepción visual por el que una persona es capaz
de asignar atributos perceptivos (matiz, saturación, brillo y claridad) a cualquier estímulo
visual dado, presentado en el campo visual de la persona (Wyszecki, 1986). La teoría
tricromática (Young, 1802; Helmholtz, 1859-1867) explica muchos de los fenómenos
conocidos de la apariencia del color. Sin embargo, fenómenos como los post-efectos
cromáticos (el efecto McCullough, por ejemplo) no pueden ser explicados por esa teoría.
Una teoría de la percepción del color que solventa los problemas de la teoría tricromática
y explica fenómenos visuales no explicados por ella es la Teoría de Procesos Oponentes
(Hering, 1878; Hurvich y Jameson, 1955, 1974; Jameson y Hurvich, 1955; véase
Hurvich, 1981, cap. 5).
352
Figura 12.1. Funciones de respuesta de los mecanismos cromáticos rojo-verde (gráfica
rojo-verde) y amarillo-azul (gráfica amarillo-azul) y acromático (línea blanca). La
respuesta (o valencia) cromática de cada mecanismo (Cuadro 11.3 de la Práctica #11
columnas y(X)-b(),)y- se ha representado en función de la longitud de onda de la luz.
Conocida la composición espectral de la luz que llega al ojo del observador procedente de
un estímulo visual cualquiera (E(Á)) y las respectivas funciones de respuesta cromática,
es posible predecir a ciegas el color con el que se verá ese estímulo. Para ello basta
suponer (Hurvich, 1981, p. 66) que:
353
donde RRIG, RyB y RWB1 son las respectivas respuestas cromáticas y
acromáticas.
Los coeficientes cromáticos que permiten relacionar las respuestas de los mecanismos
oponentes cromáticos con la percepción (apariencia) del matiz de color, se definen así:
donde las barras indican valor absoluto. El coeficiente de saturación (Hurvich, 1981, p.
79) es:
354
Los objetivos de esta Práctica son:
2. Método
2.1. Estímulos
Se utilizarán los mismos dos tipos de estímulos que en la Práctica 11: luces,
caracterizadas por su función de radiancia y objetos (pétalos aislados de diferentes de
flores de distintas plantas) iluminados con el iluminante D65 y caracterizados por sus
funciones de reflectancia espectral.
I.Fuentes lumínicas
Las gráficas de funciones de radiancia, P(Á), de las fuentes lumínicas L1, L2, L3,
L4, L5 y L6 aparecen en la Figura 12.2 (idénticas a las utilizadas en la Práctica #11).
355
Figura 12.2. Funciones de radiancia, P( de las fuentes lumínicas cuyos coeficientes
cromáticos han de ser calculados con el fin de inferir su apariencia cromática.
Figura 12.3. Distribución de irradiancia espectral, P(}), normalizada de una lámpara con
filamento de tungsteno (Wyszecki y Stiles, 1982, Figura 5(1.2.2)). En la Práctica es la
fuente lumínica J.
CUADRO 12.1.
356
onda discretizada a intervalos de 50 nm
II. Objetos
Figura 12.4. Clavel (arriba), margarita (abajo a la izquierda) y rosa (abajo a la derecha),
junto con sus pétalos aislados. [Eckert, M. P. & Carter, G. A. (2000). Flowers produce
variations in color saturation by arranging petals at oblique and varying angles. Journal of
the Optical Society of America A, 17, 825-830. Figura 1. © Copyright OSA 2000. Figura
reproducida con permiso]. Deliberadamente la imagen cromática se ha reproducido como
una imagen acromática para eliminar sus matices de color. Precisamente, uno de los
357
objetivos de esta Práctica es inferir el matiz color de los pétalos a partir de sus
coeficientes cromáticos, conocidos el iluminante y las respectivas funciones de
reflectancia.
CUADRO 12.2.
358
El procedimiento general para calcular los coeficientes cromáticos es el siguiente:
donde X',Y' y Z' son los valores triestímulos modificados (ver Capítulo 11,
apartado 2.2.2).
359
Supóngase que para un determinado campo de color, RRIG 0.263, RYB 0.018,
Rw/Bf 1.566; entonces CR,G 0.935, CY/B=0.064, C5 0.152 y, por tanto, ese campo de
color elicita la percepción de 93.5% de rojo, 6.4% de amarillo y con 15.2% de
saturación, es decir, se percibe rojo muy claro o rosa claro.
El material auxiliar contiene un programa de Excel (CIE1931.xls) para calcular los valores
de las respuestas cromáticas y acromática y los coeficientes cromáticos y acromático,
con el fin de evitar operaciones tediosas a los alumnos, sobre todo cuando el estímulo de
color viene definido con una función discreta o discretizada con muchos valores.
360
lumínica actúa como iluminante. La columna C, etiquetada como "Reflectancia", ha de
contener lo valores de la reflectancia del objeto. Cuando se trata de fuentes lumínicas,
todos sus valores son idénticamente iguales de la unidad. Cuando se trata de objetos,
debe ser rellenada con los valores correspondientes de la función de reflectancia. En la
columna D se calculan los valores de la función de distribución espectral de la energía
radiante ("Energía") que llega a los ojos del observador. En las columnas P, Q y R
aparecen sucesivamente los valores de la valencia para cada longitud de onda y para cada
uno de los tres mecanismos oponentes y-b, r-g, w-bl, respectivamente, y en las columnas
K, L y M, el producto de la energía por esos valores para cada longitud de onda. En la
parte inferior aparecen calculados los valores de las respuestas cromáticas y acromática
indicadas con los respectivos símbolos en color, así como los valores de los coeficientes
cromáticos y acromático.
La labor del experimentador en esta Práctica se reduce a guiar a los alumnos en los
difentes cálculos a realizar.
3. Resultados: Ejemplo
I.Fuentes lumínicas
CUADRO 12.1.
361
II. Objetos
CUADRO 12.2.
362
Figura 12.6. Las flores y los pétalos de la Figura 12.4 en color. [Eckert, M. P. & Carter,
G. A. (2000). Flowers produce variations in color saturation by arranging petals at
oblique and varying angles. Journal of the Optical Society of America A, 17, 825-830.
Figura 1. © Copyright OSA 2000. Figura reproducida con permiso].
Sujeto experimental:
NOMBRE.......................................................................................
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde).
RESULTADOS [3]
363
donde E es la composición espectral de la luz que llega al ojo del observador. Los
coeficientes cromáticos y el coeficiente de saturación son:
1. Fuentes lumínicas
[CUADRO 12.1]
364
II. Objetos
[CUADRO 12.2]
1. Fuentes lumínicas
365
366
Funciones de radiancia, P(A), de las fuentes lumínicas cuyos coeficientes cromáticos han
de ser calculados con el fin de inferir su apariencia cromática. [FIGURA 12.2]
Fuente lumínica Ll
367
Fuente lumínica L2
Fuente lumínica L3
368
Fuente lumínica L4
Fuente lumínica L5
369
Fuente lumínica L6
370
Distribución de irradiancia espectral, P(A), normalizada de una lámpara con filamento de
tungsteno (Wyszecki y Stiles, 1982, Figura 5(1.2.2)). En la Práctica es la fuente lumínica
J. [FIGURA 12.3]
[CUADRO 12.1]
371
II. Objetos
372
Funciones de reflectancia, p(A), de los pétalos de un clavel. La función que se utiliza en
la Práctica es la correspondiente a la curva exterior. [Eckert, M. P. & Carter, G. A.
(2000). Flowers produce variations in color saturation by arranging petals at oblique and
varying angles. Journal of the Optical Society of America A, 17, 825-830. Figura 4. ©
Copyright OSA 2000. Figura reproducida con permiso]. [FIGURA 12.5A]
[CUADRO 12.2A]
373
Objeto 02: pétalo de una margarita.
[CUADRO 12.2B]
374
Objeto 03: pétalo de una rosa.
375
Funciones de reflectancia, pOL) de los pétalos de una rosa. La función que se utiliza en
la Práctica es la correspondiente a la curva discontinua exterior. [Eckert, M. P. & Carter,
G. A. (2000). Flowers produce variations in color saturation by arranging petals at
oblique and varying angles. Journal of the Optical Society of America A, 17, 825-830.
Figura 6. © Copyright OSA 2000. Figura reproducida con permiso]. [FIGURA 12.5C]
[CUADRO 11.2C]
376
377
378
1. Introducción
La Agudeza Visual humana (AV), en miri-', en ciclos por grado de ángulo visual (c/gav),
o en dioptrías, es una medida de la capacidad del Sistema Visual Humano (SVH) para
percibir los detalles de alto contraste que existen en las imágenes. Normalmente esa
medida basta para caracterizar la función visual y sus posibles déficits. A veces, sin
embargo, es necesario conocer la capacidad del SVH para percibir características
espaciales en otros tamaños o escalas y en todo el rango de contrastes, es decir, la
capacidad de percibir otras características espaciales además de los detalles. Así por
ejemplo, en un día de niebla en el que el entorno se ve difuminado, los detalles de una
escena son irrelevantes, mientras que lo importante son los grandes objetos presentes en
ella. La medida que nos aporta información acerca de la capacidad (o rendimiento) del
SVH para percibir objetos en diferentes escalas y tamaños es la Función de Sensibilidad
al Contraste espacial (FSCe).
379
causados por disfunciones del sistema retina+córtex.
380
luminancia media. Los umbrales de contraste, con los que se obtuvo la Sensibilidad al
contraste (círculos) fueron determinados mediante escaleras adaptativas Bayesianas y
una tarea 2AFC con presentación temporal. La línea curva continua de cada panel
corresponde a la FSCe ajustada a los datos experimentales mediante el criterio de
mínimos cuadrados. La función genérica utilizada para el ajuste es SC(u)=buexp(-au),
siendo SC, la sensibilidad al contraste, u la frecuencia espacial del enrejado en c/gav y a
y b parámetros que hay que determinar mediante regresión no lineal (utilizando, en este
caso, métodos de minimización numérica) a partir de los datos experimentales.
[Resultados adaptados de Serrano-Pedraza (2005) y Serrano-Pedraza & V.Sierra-
Vázquez (2006). The effect of white-noise mask leve) on sinewave contrast detection
thresholds and the critical-band-masking model. Spanish Journal of Psychology, 9, 249-
262. Figura 3].
La FSCe típica del ser humano adulto con visión normal tiene una forma
cualitativamente similar a las respectivas FSCs típicas de bebés de diferentes edades
(Figura 13.2) o a las de otras especies animales (Figura 13.3), aunque difiere de ellas en
parámetros tales como la agudeza visual, el rango de frecuencias espaciales de los
enrejados visibles o la frecuencia espacial del enrejado sinusoidal al que se es más
sensible.
381
Figura 13.2. A.Sensibilidad al contraste de bebés de 1, 2 y 3 meses (símbolos) y sus
correspondientes FSCe-1D (líneas poligonales). B.FSCe para una persona adulta
obtenida en las mismas condiciones experimentales que las de los bebés. (La línea curva
discontinua representa una extrapolación ideal de la FSC estándar de un adulto obtenida
en condiciones experimentales similares). [Banks, M. S., Salapatek, P. (1978). Acuity
and contrast sensitivity in 1-, 2-, 3-month-old human infants. Investigative OphtaImology
and Visual Science, 17, 362-365. Figuras 1 y 2. Figuras reproducida con permiso ©
Copyright ARVO 1978.1.
382
Figura 13.3. Sensibilidad al Contraste relativa para diferentes especies animales
(símbolos) y sus correspondientes FSCe-1 D (líneas poligonales). Para cada especie, los
datos han sido normalizados de modo que la máxima SC sea igual a la unidad en la
frecuencia espacial en la que la sensibilidad es máxima. Nótese la forma cualitativamente
similar de las FSCs a pesar de su desplazamiento en el eje de la frecuencia espacial.
Datos de Northmore & Dvorak (1979) (carpa dorada), Blake et al. (1974) (gato), Jacobs
(1974) (mono nocturno), De Valois et al. (1974) (macaco), Fox et al. (1976) (halcón).
4.Comparar los resultados con la FSCe estándar de una persona adulta con visión
383
normal.
2. Método
2.1. Estímulos
2.2. Procedimiento
Para la determinación del umbral de contraste de cada uno de los enrejados, estos se
presentarán en tres escalas descendentes de quince pasos cada una, disminuyendo el
384
contraste con relación al anterior (contraste en unidades logarítmicas (logia)) en 0.2
unidades logarítmicas: 0,-0.2,-0.4,-0.6,-0.8,-1,-1.2, -1.4,-1.6,-1.8,-2.0,-2.2,-2.4,
-2.6,-2.8). Cada presentación tendrá una duración de 1 segundo. Antes y después de
cada presentación aparecerá ruido blanco visual (luminancia con fdp Gaussiana) durante
1 segundo, cuyo objetivo es eliminar posibles post-efectos de contraste.
2.3. Tarea
El sujeto tiene que contar el número de presentaciones en las que percibe las franjas
horizontales para cada enrejado sinusoidal con la misma frecuencia espacial.
En esta Práctica se utilizarán siete archivos con extensión avi (uno para cada frecuencia
espacial), suponiendo además que el dispositivo de presentación de imágenes no está
calibrado. La calibración de la luminancia de las imágenes de enrejados se ha realizado
con el mismo procedimiento descrito en la Práctica #3, §2.4 y §2.5.
Cada archivo contiene una serie descendente de quince pasos o presentaciones del
enrejado sinusoidal con la frecuencia espacial indicada en su nombre y cuyo contraste va
disminuyendo con los valores enumerados en §2.2. Cada presentación está separada por
una imagen de ruido blanco. Cada serie (es decir, cada archivo avi) será presentada tres
veces. En cada serie, el experimentador indicará a los sujetos la frecuencia espacial
correspondiente para que recojan los datos en la columna adecuada del Cuadro 13.1.
a) Práctical3esp2.avi
b) Práctical3esp4.avi
385
c) Práctical3esp8.avi
d) Práctical3esp16.avi
e) Práctical3esp32.avi
Práctical3 esp64.avi
g) Práctical3esp128.avi
-Estos son los estímulos que hay que detectar. [Elexperimentador presenta las
imágenes contenidas en el subdirectorio PRACTICA13
-Para cada enrejado de una determinada frecuencia espacial hay tres series de quince
presentaciones cada una.
- En cada serie vuestra tarea consiste en indicar las presentaciones en las que veis
cada enrejado e indicarlo con una cruz en la casilla correspondiente del Cuadro
13.1 de la hoja de respuestas.
386
decir:
donde a es el ángulo visual en grados subtendido por cualquiera de los lados de la imagen
(cuadrada) de la pantalla de presentación. [Atención: La función arco tangente (are tg,
arctan o tan) tiene que devolver el ángulo en grados; si lo devuelve en radianes hay que
hacer la conversión a grados].
En la Figura 13.5 aparecen resultados estándar para una persona adulta con visión
normal Figura 13.5A), así como la posibilidad de comprobar de modo inmediato la forma
aproximada de la propia FSCe-ID (Figura 13.5B). Con visión normal o corregida, una
387
forma parecida a la curva de la Figura 13.5A debe ser obtenida con los datos
experimentales si al reescalar los c/i en c/gav resulta, por su rango, una escala comparable
a la de estas gráficas.
388
Figura 13.5. La Función de Sensibilidad al Contraste espacial (FSCe-1D) humana. A.
Sensibilidad al Contraste (círculos) y FSCe-1D de una persona adjulta con visión normal
(línea curva continua). La Sensibilidad al Contraste de enrejados sinusoidales (i.e., el
recíproco del umbral de contraste obtenido experimentalmente) y la FSCe-1D se han
representado, en escala log-log, en función de la frecuencia espacial del enrejado
sinusoidal (La=500 cd/m2). [Campbell, F. W., Maffei, L. (1974). Contrast and spatial
frequency. Scientific American, Noviembre. p. 111. Figura reproducida con permiso ©
1974 Scientific American, Inc. Todos los derechos reservados].B. Demostración
inmediata de la forma de la propia Función de Sensibilidad al Contraste en escala log-log.
[Imagen original de I. Serrano Pedraza y V.Sierra Vázquez según idea de Campbell y
Maffei (1974)]. La imagen representa un enrejado sinusoidal modulado en frecuencia
espacial y contraste de modo logarítmico. La frecuencia espacial aumenta de izquierda a
derecha. El contraste decrece de abajo a arriba pero en la misma cantidad en todas las
frecuencias; es decir, en una misma línea horizontal todas las frecuencias espaciales
tienen físicamente el mismo contraste (salvo distorsiones introducidas por el proceso de
reproducción). Sitúese aproximadamente a 40 cm de la imagen y observará un contorno
curvo ilusorio en forma de U invertida asimétrica (parecida en forma a la curva del panel
A) que separa la región uniforme superior de la región inferior con textura. Ese perfil
ilusorio es precisamente la forma de la propia FSCe. Nótese que la altura de las franjas,
i.e. la sensibilidad al contraste, es mayor dentro del rango entre 2 y 5 c/deg. Para
frecuencias espaciales inferiores y superiores a este rango la sensibilidad al contraste se
reduce considerablemente. Nótese además que el lado derecho de la U invertida cae más
y de forma más abrupta que el lado izquierdo. Si se tiene la visión corregida y se observa
la imagen sin la prótesis de corrección, la forma del perfil de la U invertida ilusoria se
altera en función del tipo de déficit visual.
3. Resultados: Ejemplo
CUADRO 13.1.
389
En la fila etiquetada PT del Cuadro 13.1 existen a su vez tres filas (1,2, 3) en las que
han indicado los puntos de transición para la serie correspondiente, en la siguiente fila
(Media) aparecen el umbral de contraste de cada frecuencia espacial y en la siguiente
(SC), la sensibilidad al contraste. El punto de transición (PT) para cada columna
(escalera descendente) se obtiene tomando el valor medio del contraste de la última
presentación que es detectada y la siguiente que no es detectada. El umbral de contraste
(mT) para cada frecuencia espacial se obtiene calculando la media aritmética de los PT
de las tres series. (Véase §2.7 anterior).. Sean k la frecuencia espacial y s el número de la
serie (1, 2, 3) para cada frecuencia espacial. Entonces,
390
Por ejemplo, la Sensibilidad al Contraste para la frecuencia espacial igual a 2 e/i,
SC(2), se calcula así:
donde:
391
k, frecuencia espacial en c/i del estímulo visual
1, longitud del lado vertical de la imagen utilizada como estímulo visual en la pantalla
de presentación.
[Atención: La función arco tangente (arc tg, arctan o tan) tiene que devolver el ángulo
en grados; si lo devuelve en radianes hay que hacer la conversión a grados].
(Hágase la conversión para cada frecuencia espacial en c/i y rellénense las casillas
correspondientes del Cuadro 13.2).
En el Cuadro 13.2 aparecen resumidos los valores del umbral de contraste (mT) y de la
Sensiblidad al Contraste (SC) para cada enrejado en función de su frecuencia espacial en
c/i (k) y en c/gav (u) (de acuerdo con la distancia y tamaño).
CUADRO 13.2.
392
3.3. Representación gráfica de la SC en función de la frecuencia espacial del enrejado y
estimación de la propia FSCe-1D
3.4. Comparación con la FSCe-1D estándar (500 cd/m2) (Campbell y Maffei, 1974)
El máximo (4.6 c/gav) se encuentra dentro del rango de frecuencias espaciales (de 2 a
5 c/gav) de la FSCe1D estándar.
393
Figura 13.6. Sensibilidad al contraste (círculos negros) de enrejados sinusoidales que
varían en frecuencia espacial, manteniendo fijas su orientación y fase, y estimación de la
FSCe-1D (línea poligonal). La frecuencia espacial u, en c/gav, correspondiente a la
frecuencia espacial k, en c/i, es:
394
donde es el ángulo visual en grados subtendido por el lado vertical de la imagen utilizada
como estímulo visual, 1=12cm, longitud del lado vertical de la imagen en la pantalla de
presentación y d=100cm, distancia del sujeto experimental a la pantalla de presentación.
La línea poligonal que une los círculos es una estimación de la FSCe-1D.
iii. Una forma clara en U invertida ligeramente distinta a la forma de las FSC de los
bebés.
iv. Mayor sensibilidad para todas las frecuencias espaciales del rango.
Sujeto experimental:
NOMBRE.......................................................................................
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde).
395
RESULTADOS [3]
[CUADRO 13.1]
Longitud del lado vertical de las imágenes de los enrejados en la pantalla de presentación:
396
Distancia del sujeto experimental a la pantalla de presentación:
donde:
1, longitud del lado vertical de las imagen utilizada como estímulo visual en la pantalla de
presentación.
(Hágase la conversión para cada frecuencia espacial en c/i y rellénense las casillas
correspondientes del Cuadro 13.2).
[CUADRO 13.2]
397
Representación gráfica de la SC en función de la frecuencia espacial del enrejado y
estimación de la propia FSCe - 1 D [3.3]
398
donde es el ángulo visual en grados subtendido por el lado vertical de la imagen utilizada
como estímulo visual, 1= cm, longitud del lado vertical de la imagen y d= cm, distancia
del sujeto experimental a la pantalla de presentación. La línea poligonal que une los
círculos es una estimación de la FSCe-1D. [FIGURA 13.6]
Comparación con la FSCe-1D estándar (500 cd/m2) (Campell y Maffei, 1974) [3.4]
399
400
401
Adelson, E. H. (1995). http://web.mit.edu/persci/people/adelson/checkershadow
illusion.html
Ades, D. (2004) (ed.). Dalí. Catálogo de la exposición producida por Palazzo Grassi con
la Fundació Gala-Salvador Dalí con motivo del Centenario del Nacimiento de
Salvador Dalí. Madrid: La Esfera de los Libros.
Banks, M. S., Salapatek, P. (1978). Acuity and contrast sensitivity in 1-, 2-, 3-month-
o1d human infants. Investigative Ophtalmology and Visual Science, 17, 362-365.
Blake, R., Cool, S. J., Crawford, M. L. (1974). Visual resolution in the cat. Vision
Research, 14, 1211-1217.
Campbell, F. W., Maffei, L. (1974). Contrast and spatial frequency. Scientifzc American,
Noviembre.
402
gratings. The Journal of Physiology, 197, 551-566.
Egam, J. P. (1975). Signal Detection Theory and ROC Analysis. N.Y.: Academic Press.
Fant, G. (1960). Acoustic Theory of Speech Production. The Hague: Mouton & Co.
Fox, R., Lehmkuhle, S. W., Westendorf, D. H. (1976). Falcon visual acuity. Science,
192, 263-265.
403
edición.
Heffner, H. E. (1983). Hearing in large and small dogs. Absolute thresholds and size of
the tympanic membrane. Behavioral Neuroscience, 97, 310-318.
Heffner, R. S., Heffner, H. E. (1985). Hearing in mammals: The least weasel. Journal of
Marnmalogy, 66, 745-755.
Heffner, H. E., Masterton, R. B. (1980). Hearing in glires: Domestic rabbit, cotton rat,
feral house mouse, and kangaroo rat. Journal of the Acoustical Society of America,
68, 1584-1599.Hermann, L. (1870). Eine Erscheinung simultanen Kontrastes. Pflüg.
Arch. ges. Physiol., 3. 13-15.
404
Hurvich, L. M. (1981) Color Vision. Sunderland, MA.: Sinauer Associates Inc.
Jacobs, G. H. (1977). Visual capacities of the owl monkey (Aotus trivirgatus). II. Spatial
contrast sensitivity. Vision Res. 17: 821-825.
Jastrow, J. (1899). The mind's eye. Popular Science Monthly, 54, 299-312.
Julesz, B. (1964). Binocular depth perception without familiarity cues. Science, 145,
356363.
405
Kanizsa, G. (1986). Gramática de la Visión. Percepción y pensamiento. Madrid: Paidós.
Mach, E. (1865). Über die Wirkung der raumlichen Vertheilung des Lichtreizes auf die
Netzhaut. Sitzungsberichte der mathematisch-naturwissenshaftlichen Klasse der
Kaiserlichen Akademie der Wissenschaften, Wien 52/2, 303-322.
MacKay, D. M., & MacKay, V. (1974) The time course of the McCollough effect and its
physiological implications. Journal ofPhysiology (London) 237, 38-39.
Magic Eye Inc. (1993). The Magic Eye: A New Way of Looking at the World. Boston:
N. E.Thing Enterprises. [El Ojo Mágico. Barcelona: Ediciones B].
406
Moore, B. C. J. (2003). An Introduction to the Psychology of Hearing. N. Y.: Academic
Press, 5.a edición.
Navon, D. (1977). Forest before trees: the precedence of global features in visual
perception. Cognitive Psychology, 9, 353-383.
Northmore, D. P., Dvorak, C. A. (1979). Contrast sensitivity and acuity of the goldfish.
Vision Research, 19, 255-261.
Oliva, A., Torralba, A., Schyns, P. G. (2006). 11ybrid images. ACM Transactions on
Graphics (SIGGRAP 2006 issue) 25, 527-532. http://cvcl.mit.edu/hybrid/
OlivaTorralb_Hybrid_Siggraph06.pdf.
Patterson, R. D. (1976) Auditory filter chapes derived with noise stimuli. Journal of the
Acoustical Society of America, 59, 640-654. (doi:10.1121/1.380914).
Peirce, J. W., Solomon, S. G., Forte, J. D., Lennie, P. (2008). Cortical representation of
color is binocular. Journal of Vision, 8 (3):6, 1-10.
Peterson, W. W., Birdsall, T. G., Fox, W. C. (1954). The theory of signal detectability.
IRE Transactions, PGIT-4, 171-212.
Pinna, B., Brelstaff, G. (2000). A new illusion of relative motion. Vision Research, 40,
2091-2096.
Plomp, R., Levelt, J. M. (1965). Tonal Consonance and Critical Bandwidth. Journal of
the Acoustical Society of Anierica, 38, 548-560.
407
Pokomy, J. & Smith, V. C. (1986). Colorimetry and color discrimination. En K.R.Boff,
Kaufman, L. & Thomas. J. P. (eds.), Handbook of Perception and Human
Performance. Vol 1. Sensory Processes and Perception. N. Y.: Wiley & Sons, 1986.
Cap. 8. Pp. 8-15.
Popper, K. (1959). The Logic of Scientific Discovery. London: Hutchinson & Co. [La
lógica de la investigación científica. Madrid: Tecnos].
Poulton, E. C., Stevens, S. S. (1953). On the halving and doubling of the loudness of
white noise. Journal of the Acoustical Society of America, 27, 329-331.
Ratliff, F. (1965). Mach Bands: Quantitative Studies on Neural Networks in the Retina.
San Francisco: Holden-Day Inc.
Roederer, J. G. (2008). The Physics and Psychophysicis of Music (4'h ed.). New York:
Springer.
Rossing, T. D. (1990). The Science of Sound (2nd Ed.). Reading, MA: Addison Wesley.
408
Crofts, Inc., figura 36.
Schyns, P., Oliva, A. (1999). Mr. angry and mr. smile: when categorization flexibility
modifies the perception of faces in rapid visual presentations. Cognition, 69, 243-265.
Serrano-Pedraza, L, Manjunath, V., Osunkunle, 0., Clarke, M. P., Read, J.C.A. (2011)
Visual suppression in intermittent exotropia during binocular alignment. Investigative
Ophthalmology and Visual Science, 52, 2352-64.
409
Sierra-Vázquez, V., Serrano-Pedraza, L, Luna, D. (2006). The effect of spatial-
frequency filtering on the visual processing of global structure. Perception, 35, 1583-
1509.
Stevens, S. S. (1962). To honor Fechner and repeal his law. Science, 133, 80-86.
Stevens, S. S. (1970). Neural events and the psychophysical law. Science, 170,
10431050.
410
Tanner, W. P., Swets, J. A. (1954). A decision-making theory of visual detection.
Psychological Review, 61, 401-409.
Thompson M., Burr, D. (2009). Visual aftereffects. Current Biology, 19, Rl1-R14.
Traunmüller, H. (1990). Analytical expressions for the tonotopic sensory scale. Journal of
the Acoustical Society ofAmerica, 88, 97-100.
Uhlarik, J. J., Osgood, A. G. (1974). The role of some spatial parameters of gratings on
the McCollough effect. Perception and Psychophysics, 15, 524-528.
Wheatstone, C. (1838). Contributions to the physiology of visión. Part the first, on some
remarkable and hitherto unobserved phenomena of binocular vision. Philosophical
Transactions of the Royal Society, 148, 371-394.
Wyszecki, G., Stiles, W. S. (1982). Color Science: Concepts and Methods, Quantitative
Data and Formulae. N. Y.: Wiley.
Young, T. (1802). On the theory of light and colours. Philosophical Transactions of the
Royal Society London, 92, 12-48.
-Figura Demostración #15. Figura reimpresa de Harmon, L. & Julesz, B. (1973), Figura
1, Science, 180, 1194-1197. © Copyright AAAS 1973. Figura reproducida con
permiso.
411
-Figura 10.1. Figura reimpresa de Thompson, M. & Burr, D. (2009). Visual Aftereffects.
Current Biology 19 (1), Rll-R14. © Copyright Elsevier 2009. Figura reproducida con
permiso.
-Figuras 11.6 y 12.4. Figura reimpresa de Eckert, M. P. & Carter, G. A. (2000). Flowers
produce variations in color saturation by arranging petals at oblique and varying
angles. Journal of the Optical Society of America A, 17, 825-830. © Copyright OSA
2000. Figura reproducida con permiso.
-Figura 13.2A y B.Figuras reimpresas de Banks, M. S., Salapatek, P. (1978). Acuity and
contrast sensitivity in 1-, 2-, 3-month-o1d human infants. Investigative Ophtalmology
and Visual Science, 17, 362-365. © Copyright ARVO. Figuras reproducidas con
permiso.
-Figura 13.5 Figura reimpresa de Campbell, F. W., Maffei, L. (1974). Contrast and
spatial frequency. Scientifzc American, Noviembre. Reproducida con permiso © 1974
Scientific American, Inc. Todos los derechos reservados.
412
Índice
Prólogo 23
1. Demostraciones de fenómenos sensoriales y perceptivos 28
2. Método 30
2.2. Instrucciones para el experimentador 31
2.3. Instrucciones a los sujetos experimentales 32
3.2. Fenómenos de la percepción no verídica 51
4. Recogida y análisis de datos 62
2. Determinación experimental de los parámetros de la Ley de
67
Stevens para la percepción de la sonori
1.2. Objetivos de la Práctica 69
2.1. Estímulos 70
2.2. Procedimiento y tarea 72
2.3. Aparatos 73
2.6. Instrucciones a los sujetos experimentales 74
2.7. Cálculo de los parámetros a y b de la ley de Stevens 75
3. Resultados: Ejemplo 77
3.3. Representación gráfica de los resultados experimentales y de la
79
función potencial
4. Aplicaciones: Problemas 81
4.2. Cantidad en la que hay que disminuir la presión sonora en dB
82
SPL para que la sensación sonora s
5. Recogida y análisis de datos 84
3. Determinación experimental de los parámetros de la Ley de
91
Stevens para la percepción del brillo
2.4. Instrucciones para el experimentador 97
2.5. Material audiovisual 98
2.7. Estimación de los parámetros a y b de la ley de Stevens 99
3.1. Estimación de brillo. Resultados experimentales 100
413
3.2. Cálculo del valor de los parámetros de la ley de Stevens 101
correspondiente al sujeto experimental
4. Teoría de la Detección de la Señal (TDS). Verificación
111
experimental del modelo Normal-Normal con
2.3. Condiciones experimentales 116
2.5. Aparatos 117
2.8. Instrucciones a los sujetos experimentales 118
2.9. Algoritmo para el cálculo de d' y Í supuesto el modelo N-N
119
con varianzas iguales
3.1. Obtención y representación gráfica de los resultados de los
121
experimentos de detección
3.2. Cálculo de los valores de d' y Í correspondientes al sujeto
125
experimental en la Parte 1
3.3. Verificación del modelo N-N con varianzas iguales 127
3.4. Curva ROC teórica 128
3.5. Representación gráfica de la sensibilidad y del criterio o sesgo
128
de respuesta del sujeto experi
4. Método 131
4.5. Aparatos 132
4.8. Instrucciones a los sujetos experimentales 134
5.2. Cálculo de los valores de d' y (3 correspondientes al sujeto
140
experimental en la Parte II
5.3. Verificación del modelo N-N con varianzas iguales 141
5.4. Curva de isocriterio teórica 142
5.5. Representación gráfica de la discriminabilidad de la señal y del
143
criterio o sesgo de respuesta
6. Recogida y análisis de datos 144
5. Medida de la Curva de Audibilidad humana 164
2.2. Procedimiento 170
2.4. Tarea 171
2.6. Material audiovisual 172
414
2.7. Instrucciones a los sujetos experimentales 173
3.2. Representación gráfica del umbral de audibilidad de cada tono
174
en función de su frecuencia tempo
3.3. Determinación de la Curva de Audibilidad Humana 175
415