Libro de Practicas Percepcion

4
5
6
7
Ignacio Serrano Pedraza
Vicente Sierra Vázquez
Luis Enrique López Bascuas
8
9
Prólogo
1. Demostraciones de fenómenos sensoriales y perceptivos
1. Introducción
1.1. El problema de la percepción
1.2. Objetivos de la Práctica
2. Método
2.1. Aparatos
2.2. Instrucciones para el experimentador
2.3. Instrucciones a los sujetos experimentales
2.4. Material audiovisual
3. Demostraciones
3.1. Fenómenos de la percepción verídica
3.2. Fenómenos de la percepción no verídica
4. Recogida y análisis de datos
2. Determinación experimental de los parámetros de la Ley de Stevens para la percepción

de la sonoridad
1. Introducción
1.1. La ley de Stevens para la percepción de la sonoridad
2. Método
10
2.1. Estímulos
2.2. Procedimiento y tarea
2.3. Aparatos
2.7. Cálculo de los parámetros a y b de la ley de Stevens
3. Resultados: Ejemplo
3.1. Estimación de la sonoridad. Resultados experimentales
3.2. Cálculo del valor de los parámetros de la ley de Stevens correspondiente al

sujeto experimental
3.3. Representación gráfica de los resultados experimentales y de la función potencial
4. Aplicaciones: Problemas
4.1. Decrementos en presión sonora (escala absoluta) desiguales, razón ¿fija o

variable? entre sensaciones
4.2. Cantidad en la que hay que disminuir la presión sonora en dB SPL para que la
sensación sonora se reduzca en un factor multiplicativo k (O<k<1)
3. Determinación experimental de los parámetros de la Ley de Stevens para la percepción

del brillo
1. Introducción
1.1. La ley de Stevens para la percepción del brillo
11
2. Método
2.1. Estímulos
2.3. Aparatos
2.7. Estimación de los parámetros a y b de la ley de Stevens
3.1. Estimación de brillo. Resultados experimentales
3.2. Cálculo del valor de los parámetros de la ley de Stevens correspondiente al

sujeto experimental
4. Teoría de la Detección de la Señal (TDS). Verificación experimental del modelo

Normal-Normal con varianzas iguales
1. Introducción
1.1. Índices de la sensibilidad (/discriminabilidad) y del criterio y predicciones de la

Teoría de la Detección de la Señal (TDS)
2. Método
2.1. Estímulos
12
2.3. Condiciones experimentales
2.4. Predicciones
2.5. Aparatos
2.9. Algoritmo para el cálculo de d' y Í supuesto el modelo N-N con varianzas
iguales
3.1. Obtención y representación gráfica de los resultados de los experimentos de

detección
3.2. Cálculo de los valores de d' y Í correspondientes al sujeto experimental en la

Parte 1
3.3. Verificación del modelo N-N con varianzas iguales
3.4. Curva ROC teórica
3.5. Representación gráfica de la sensibilidad y del criterio o sesgo de respuesta del

sujeto experimental en cada una de las dos condiciones experimentales
4. Método
4.1. Estímulos
4.4. Predicciones
4.5. Aparatos
13
5. Resultados. Ejemplo

detección
5.2. Cálculo de los valores de d' y (3 correspondientes al sujeto experimental en la

Parte II
5.4. Curva de isocriterio teórica
5.5. Representación gráfica de la discriminabilidad de la señal y del criterio o sesgo

de respuesta del sujeto experimental en cada una de las tres condiciones
experimentales
5. Medida de la Curva de Audibilidad humana
1. Introducción
1.1. La Curva de Audibilidad (CA) humana
2. Método
2.1. Estímulos
2.2. Procedimiento
2.3. Aparatos
2.4. Tarea
14
3.1. Determinación de umbrales de audibilidad para tonos puros de diferente

frecuencia temporal
3.2. Representación gráfica del umbral de audibilidad de cada tono en función de su

frecuencia temporal
3.3. Determinación de la Curva de Audibilidad Humana
3.4. Comparación con los umbrales de audibilidad estándar (ISO, 1961 y ANSI
2004)
3.5. Representación del audiograma
6. Demostración experimental de la existencia de Bandas Críticas en audición y medida

de su anchura
1. Introducción
1.1. Concepto de banda crítica
1.2. Paradigma de enmascaramiento de un tono puro por ruido basado en la

existencia de bandas críticas o modelo del espectro de potencia para el
enmascaramiento auditivo
1.3. Predicción de resultados del experimento de Prácticas y justificación del

procedimiento de estimación de la anchura de la banda crítica, B
1.4. Predicciones experimentales
1.5. Anchura de la banda crítica en función de la frecuencia central
2. Método
15
2.1. Estímulos
2.2. Procedimiento
2.3. Tarea
2.4. Aparatos
3.1. Umbrales de audibilidad de un tono puro enmascarado por ruido paso-banda
3.2. Representación gráfica de los resultados experimentales y determinación de la

anchura de la banda crítica
3.3. Comparación con las estimaciones estándar de Múnich y Cambridge
7. Síntesis y percepción de vocales
1. Introducción
1.1. Percepción de las vocales
2. Método
2.1. Estímulos
16
3. 1. Especificación de la relación que existe entre los parámetros articulatorios de la

producción de vocales y sus consecuencias acústicas
3.2. Síntesis, utilizando una implementación del sintetizador por formantes de Klatt,
de las cinco vocales del español atendiendo a las consecuencias acústicas que tiene
la articulación diferencial de los distintos segmentos vocálicos
3.3. Comprobación experimental de que los parámetros de síntesis usados generan

vocales perceptivamente compatibles con las categorías fonológicas del español
3.4. Mostrar cuáles son los parámetros físicos que usa nuestro sistema perceptivo
para codificar las distintas vocales del idioma
8. Percepción categórica del habla y Bandas Críticas en audición
1. Introducción
1.1. Percepción categórica
1.2. Bandas críticas y distancia tonotópica
2. Método
2.1. Estímulos
17
3.1. Especificación de los valores de los parámetros de síntesis de los nueve
estímulos utilizados
3.2. Obtención experimental de los porcentajes de identificación para cada estímulo

del continuo
3.3. Obtención de la función de identificación asociada al continuo anterior
3.4. Cálculo de la frontera entre categorías (FC)
3.5. Obtención experimental de los porcentajes de discriminación correcta para cada

par de estímulos del continuo
3.6. Representación de la función de discriminación asociada al continuo anterior
3.7. Cálculo del valor aproximado donde se localiza el máximo de las funciones de
discriminación
3.8. Justificación de que las funciones obtenidas cumplen con los criterios (a), (b) y
(c) que se han propuesto como definición parcial de percepción categórica
3.9. Justifíquense las ventajas de utilizar una representación psicoacústicamente

motivada en la construcción de los estímulos experimentales
9. Percepción de la música y Bandas Críticas en audición
1. Introducción
1.1. Percepción de la consonancia/disonancia en la música
2. Método
2.1. Estímulos
2.2. Predicciones
18
3.1. Evaluación del grado de consonancia de distintos pares de tonos puros
3.2. Verificación de si los grupos perceptivos obtenidos se corresponden con las

predicciones que se derivan de la Figura 9.1
3.3. Verificación de si el par percibido como máximamente disonante se corresponde

con el predicho por la gráfica de la Figura 9.2
3.4. Verificación de si el par percibido como máximamente consonante se

corresponde con lo predicho por la gráfica de la Figura 9.2
3.5. Inspeccionar y describir los resultados obtenidos para el Estímulo 5 (E5). ¿Por
qué es particularmente interesante el análisis de los resultados obtenidos con este
estímulo?
3.6. Aplicaciones
4. Recogida y análisis de Datos
10. Demostración del efecto McCollough
1. Introducción
1.1. Descripción del efecto McCollough
1.2. Variables de las que depende el efecto
1.3. Explicación del efecto
2. Método
2.1. Estímulos
19
2.2. Variables independiente y dependiente utilizadas en la Práctica
2.3. Procedimiento de estimación
2.4. Aparatos
2.5. Procedimiento de adaptación
3.1. Descripción del efecto
3.2. Estimación y representación gráfica de la fuerza del efecto (FE) en función del
tiempo desde el cese de la adaptación
11. Colorimetría
1. Introducción
1.1. Concepto de Colorimetría
1.2. Procedimiento general para caracterizar psicofísicamente el estímulo cromático
2. Método
2.1. Estímulos
2.2. Procedimiento de cálculo de los valores triestímulo y de las coordenadas

cromáticas
2.3. Material auxiliar
20
3.1. Cálculo de los valores triestímulo modificados y de las coordenadas de

cromaticidad
3.2. Relaciones entre algunas de las fuentes lumínicas
3.3. Representación de esas luces y objetos en el diagrama de cromaticidad CIE

1931 e inferencia de su color
3.4. Comparación con los resultados originales obtenidos por Eckert & Carter (2000)
en el caso de pétalos de flores
12. Teoría de los Procesos Oponentes y la apariencia del color
1. Introducción
1.1. Apariencia de color y Teoría de Procesos Oponentes
1.2. Procedimiento general para determinar la apariencia de color
2. Método
2.1. Estímulos
2.2. Procedimiento de cálculo de los coeficientes cromáticos
3.1. Cálculo de las respuestas de los mecanismos oponentes y de los coeficientes

cromáticos
21
3.2. Predicción de la apariencia de color
13. Medida de la Función de Sensiblidad al Contraste espacial humana
1. Introducción
1.1. La Función de Sensibilidad al Contraste espacial (FSCe-1D)
2. Método
2.1. Estímulos
2.2. Procedimiento
2.3. Tarea
2.7. Elaboración y análisis de los resultados
3.1. Determinación de los umbrales de contraste para enrejados sinusoidales de

diferentes frecuencias espaciales
3.2. Cálculo de la Sensibilidad al Contraste (SC) para cada frecuencia espacial
3.3. Representación gráfica de la SC en función de la frecuencia espacial del

enrejado y estimación de la propia FSCe - 1D
3.4. Comparación con la FSCe-1D estándar (500 cd/m2)
3.5. Comparación con los resultados obtenidos en bebés
22
3.6. Comparación con resultados obtenidos en otras especies animales
Referencias bibliográficas
23
24
Este manual de Psicología de la percepción. Prácticas, recoge el contenido de algunas de
las clases prácticas impartidas por la cátedra de Psicología de la Percepción en la
Facultad de Psicología de la Universidad Complutense de Madrid durante los últimos
veinticinco años. Las prácticas de este manual se refieren a fenómenos visuales y
auditivos que son fáciles de presentar sin ayuda de instrumentos complicados y en las
que las respuestas de los sujetos se pueden registrar mediante papel y lápiz. Utilizar
procedimientos de registro más complejos hubiera asegurado la obtención de resultados
más precisos en algunas prácticas, pero al precio de limitar la generalidad de su
aplicación.
Este manual contiene tanto demostraciones, en las que los estímulos se han diseñado
con los valores de los parámetros fijados de modo preciso para producir precisamente el
fenómeno (es el caso de las demostraciones de la Práctica #1 o el efecto McCollough de
la Práctica #10), como prácticas propiamente dichas en las que se varían los parámetros
pertinentes para obtener un resultado conocido y firmemente establecido en la disciplina
(por ejemplo, la medida de las Curvas de Audibilidad de la Práctica #5 o de Sensibilidad
al Contraste espacial de la Práctica #13). Sólo en algunos casos nos hemos arriesgado a
presentar experimentos (manipulación de una variable independiente para registrar su
efecto en una variable dependiente con el objeto de encontrar una relación funcional
entre ellas y/o de probar una hipótesis) como en el caso de la TDS de la Práctica #4 o la
percepción categórica del habla de la Práctica #8.
A riesgo de presentar un texto repetitivo, cada Práctica es autónoma de modo que

pueda realizarse independiente del resto. Además salvo la Práctica #l, todas las demás
han sido elaboradas con un formato común. Cada una consta de una sección de
Introducción, en la que se exponen los conceptos básicos que enmarcan y dan sentido a
la Práctica, una sección de Método, con los apartados convencionales de cualquier
artículo científico en el área de la Psicología de la Percepción (incluido un apartado en el
que se describe el material audiovisual para cada Práctica) y finalmente una sección de
Resultados, en la que se proporciona un ejemplo real desarrollado, con los mismos
apartados que aparecen en las hojas de recogida de datos y análisis de resultados que
usarán los sujetos experimentales. A cada Práctica le sigue el documento de recogida y
análisis de los datos para los alumnos, diseñado de tal modo que la numeración de los
apartados y de las figuras es idéntica a la de la sección de Resultados del texto principal
de manera que al alumno le sea fácil cotejar los suyos propios con los del ejemplo.
25
Los conocimientos de cálculo que se requieren para la resolución de algunos ejercicios
y representaciones gráficas son los adquiridos en los cursos de Matemáticas del
Bachillerato español. No hemos creído pertinente hacer uso de contrastes estadísticos
para un análisis ulterior de los resultados.
El manual se completa con material audiovisual que puede descargarse desde

www.sintesis.com, lo que posibilita que el alumno pueda actuar como experimentador
consigo mismo y con personas de su entorno. Salvo en algunas demostraciones de la
Práctica #1, todo el material audiovisual es original y ha sido diseñado específicamente
para acompañar a este Manual. En el apartado correspondiente del Método de cada
práctica se ofrecen indicaciones precisas acerca de las características de los estímulos
utilizados. Pese a su aparente simplicidad, en el diseño y generación de esos estímulos se
han utilizado técnicas bastante sofisticadas procedentes de la Teoría de la Señal
implementadas en Matlab (MathWorks, Natick, MA) combinadas con los conocimientos
propios de la Psicofisica Sensorial.
Aunque hemos sido muy cuidadosos en evitarlos en el manuscrito original, es

inevitable que un manual de estas características contenga errores. Por favor, si se
encuentran errores, envíese un mensaje a iserrano a,ucm.es.
Agradecemos a Paula Blanco Bercial la cesión de su voz para las instrucciones de la

Práctica #4 correspondiente a TDS, a los responsables de Editorial Síntesis por su
paciencia y a los miles de estudiantes de Psicología de la UCM que con sus
observaciones han contribuido a hacer más inteligibles, accesibles y próximas estas
Prácticas. Nuestro deseo es que este manual sea útil al profesor de Psicología de la
Percepción para transmitir a los alumnos el estilo propio de la Psicología Experimental.
Ignacio Serrano Pedraza
Vicente Sierra Vázquez
Luis Enrique López Bascuas
Imagen de cubierta
Nota sobre la imagen de la cubierta: Enmascaramiento selectivo de una imagen original

(fila superior a la izquierda, imagen del rostro de Hermann von Helmholtzl) por ruido
visual, demostración intuitiva de la existencia de bandas críticas y canales en la visión
espacial y relevancia de la representación espectral (espacial) en el estudio de la visión.
26
En general, el ruido visual (máscara) añadido a una imagen dificulta el reconocimiento
de ésta. De modo contraintuitivo, sin embargo, no todo ruido visual añadido a una
imagen enmascara su reconocimiento. Empíricamente el enmascaramiento perceptivo
sucede sólo cuando el ruido visual tiene su espectro de Fourier273 solapado con la banda
de frecuencias espaciales del espectro de la imagen original (fila superior a la derecha) o
adyacente a él, es decir, dentro de la banda crítica para enmascarar la 6. Sin embargo
cuando el ruido visual añadido (con la misma energía) tiene su espectro situado 1.5 a 2
octavas por debajo (fila inferior a la izquierda) o por encima (fila inferior a la derecha), es
decir, fuera de la banda crítica correspondiente a la imagen original, ésta se reconoce
fácilmente ya que no resulta preceptivamente enmascarada 4-6 y se observa, además,
que ambos, imagen original y ruido máscara, se perciben por separado. (Para observar
esos efectos, las imágenes de la portada deben contemplarse a una distancia de 20 cm
aproximadamente). Una explicación plausible de esta falta de enmascaramiento, aún con
la imagen y el ruido superpuestos espacialmente, es que la imagen original y el ruido
máscara no solapados espectralmente son codificados de modo separado e independiente
por distintos canales visuales selectivos a la frecuencia espacial de modo que no se
interfieren perceptivamente6'8. Por el contrario, cuando la imagen original y el ruido
máscara tienen sus espectros de Fourier solapados o adyacentes existe enmascaramiento
porque ambos son codificados por los mismos canales o filtros visuales en los que se
interfieren6 Nótese que ni la descripción del enmascaramiento selectivo ni su explicación
son posibles sin acudir a las características del espectro de Fourier de la imagen original y
del ruido visual, lo que sugiere que la representación espectral, imprescindible en el
estudio de la audición y de la visión del color, es también relevante para el estudio de la
visión espacial. [Demostración de ISP & VSV según idea original de Harmon y Julesz6]
Referencias:
1.Boring, E. G. (1942). Sensation and Perception in the History of Experimental

Psychology. N. Y.: AppletonCentury-Crofts, Inc.
2.Papoulis, A. (1962). The Fourier Integral and its Applications. N. Y.: McGraw-Hill.
3.Bracewell, R. N. (1978). The Fourier Transform and its Applications. N.Y.: McGraw-
Hi11.
4.Stromeyer, C. F., Julesz, B. (1972). Spatial-frequency masking in vision: Critical band

and spread of masking. Journal of the Optical Society ofAmerica, 62, 1221-1232.
5.Harmon, L. D. (1973). The recognition of faces. Scientific American, 229 (5), 70-82.
27
6.Harmon, L, D., Julesz, B. (1973). Masking in visual recognition: Effect of two-
dimensional filtered noise. Science, 180, 1104-1197.
7.Campbell y Robson (1968). Application of Fourier analysis to the visibility of gratings.

Journal of Physiology, 197, 551-566.
8.Sierra-Vázquez, V. (1992). Procesamiento visual temprano: Aspectos biológicos,

psicofisicos y computacionales del análisis espacial de imágenes por el sistema visual
humano. En J.Mayor, J & J.L.Pinillos (eds. del Tratado), J.L.Fernández Trespalacios
& P.Tudela Garmendia (eds. del Volumen), Tratado de Psicología General. Volumen
3. Atención v Percepción. Madrid. Alhambra Universidad. Pp. 163-322.
28
29
1. Introducción
1.1. El problema de la percepción
La percepción, a diferencia de otros procesos psicológicos como el aprendizaje o la

memoria, es tan inmediata, tan automática y tan sin esfuerzo que no es fácil darse cuenta
de la complejidad de los procesos implicados en ella. Apreciar que la percepción es un
problema no es algo trivial sino que constituye en sí mismo un problema que requiere, en
palabras de Irvin Rock, una "elaborada autoconsciencia" (Rock, 1984, p. viii). Las
demostraciones de esta Práctica intentan facilitar la elaboración de esa autoconsciencia
para hacer caer en la cuenta al estudiante del problema que es, sin más, el percibir. Por
su facilidad de presentación, en esta Práctica se mostrarán fenómenos sensoriales y
perceptivos correspondientes a la visión. La mayoría de ellos son explicados por teorías
de la visión humana actualmente vigentes.
Los objetivos generales de esta Práctica son:
1.Mostrar diferentes fenómenos de la percepción verídica y no verídica que ayuden a

comprender la complejidad de la percepción (véase Cuadro 1.1).
2.Realizar una descripción precisa, aunque no técnica, de los mismos.
3.Transmitir la idea de que en la descripción verbal o escrita de cualquier fenómeno

perceptivo es necesario distinguir entre la descripción (lo más neutra posible) del
estímulo y la descripción de la experiencia perceptiva y que ambas conjuntamente
constituyen precisamente la descripción (trivial o técnica) del fenómeno.
4.Transmitir la idea de que cualquier fenómeno de la percepción no verídica es

consecuencia natural del funcionamiento normal de los sistemas sensoriales y
30
perceptivos y que para su explicación no son pertinentes las teorías adhoc, sino
que su explicación debe seguirse de las mismas teorías que explican los fenómenos
de la percepción verídica. Dicho de otro modo, cualquier explicación de la
percepción no verídica debería seguirse naturalmente de las operaciones de los
mecanismos que subyacen a la percepción en general. Este enfoque es original de
William James, uno de los fundadores de la Psicología como ciencia, que en The
Principies of Psychology escribe: "Between normal perception and illusion...there
is no break, the process being identically the same in both" (William James,
1890/1981, p. 757) [las cursivas son del propio WJ] y es compartido, entre otros
muchos, por Michael Bach el creador de la exhaustiva página web sobre ilusiones
visuales (http://michaelbach.de/ot/).
5.Mostrar, siquiera intuitivamente, la capacidad de las teorías vigentes de la visión

humana para generar fenómenos perceptivos novedosos.
En el Cuadro 1.1 se enumeran los fenómenos sensoriales y perceptivos mostrados en

esta Práctica.
2. Método
Las demostraciones muestran fenómenos de la percepción visual verídica y no verídica.

Se utiliza el método fenomenológico. Es decir, en cada caso, se muestra la imagen
estimular y la tarea del sujeto experimental es realizar la descripción del fenómeno, es
decir, la descripción física del estímulo y, junto a ella y a la vez, la descripción de su
experiencia perceptiva.
2.1. Aparatos
Para la realización de esta práctica no es necesaria la utilización de aparatos sofisticados

de presentación de estímulos. En principio, esta Práctica se puede llevar a cabo
observando simplemente las imágenes que aparecen más adelante. En cualquier caso el
experimentador puede utilizar la presentación en PowerPoint que se incluye en el
Material de la Práctica #1 y mostrarla utilizando bien proyectores o bien pantallas de
ordenador. Para algunas de las imágenes relativas a fenómenos de la visión
estereoscópica será necesario el uso de gafas con filtros de colores rojo-verde o rojo-
azul.
CUADRO 1.1.
Fenómenos sensoriales y perceptivos mostrados en la Práctica #1
31
En todas las demostraciones el experimentador debe:
1.Describir físicamente el estímulo.
2.Describir la experiencia perceptiva correspondiente.
El experimentador presentará las imágenes el tiempo necesario para que el observador
32
pueda percibir el fenómeno visual concreto. En algunos casos el experimentador deberá
orientar al observador para que este caiga en la cuenta del fenómeno visual y de este
modo entender la complejidad que tiene la percepción.
El experimentador debe indicar al sujeto experimental que su tarea es observar las

imágenes y describir su experiencia perceptiva. Cuando se trate de ilusiones perceptivas,
es importante que el experimentador insista en el hecho de que lo percibido no coincide
con la realidad física del estímulo y que esa discrepancia plantea un problema.
Es importante que el alumno entienda que la existencia de ilusiones perceptivas es una

herramienta fundamental para el estudio de los sistemas sensoriales y perceptivos, puesto
que las ilusiones revelan que esos sistemas no son pasivos sino que realizan operaciones
sobre los estímulos para obtener la experiencia perceptiva.
Por último, el sujeto experimental debe comprender que las ilusiones perceptivas son
la consecuencia natural del funcionamiento normal de nuestros sistemas sensoriales y
perceptivos, del mismo modo que lo son los fenómenos de la percepción verídica. Es
decir, aunque es cierto que en muchas ocasiones los sistemas sensoriales y perceptivos
fracasan en recoger ciertas propiedades de la realidad (percepción no verídica), esto no
se debe a ningún engaño deliberado por parte de los mismos, toda vez que dichos
sistemas se limitan en todos los casos (percepción verídica y no verídica) a ejecutar las
operaciones que los caracterizan.
En el directorio MATERIAL PRÁCTICA 1 se encuentra un fichero

Prácticademostraciones.ppt que contiene presentaciones en PowerPoint de las
demostraciones que siguen.
3. Demostraciones
3.1. Fenómenos de la percepción verídica
3.].]. Visión estereoscópica
Objetivo: Mostrar intuitivamente que la percepción no está causada solo por el

estímulo sino que es sobre todo una construcción mental.
Comentario: El funcionamiento automático y no consciente de los sistemas sensoriales
33
y la inmediatez de la propia e irreductible experiencia perceptiva son dos de las causas
que hacen que la gente no se dé cuenta de que su percepción es construida por la
actuación de múltiples procesos actuando directamente sobre el estímulo próximo o sobre
representaciones mentales derivadas. Una demostración psicológica convincente de la
existencia de procesos que median en la percepción es la visión de la profundidad con
estímulos artificiales como los estereogramas, anaglifos y autoestereogramas que carecen
de claves monoculares de profundidad como la oclusión, el tamaño relativo, o la textura.
En las respectivas demostraciones se describen los estímulos sintéticos con que los se
logra la visión en profundidad y que muestran que la percepción (en este caso, la visión
3D) es una construcción mental. Esos estímulos visuales proporcionan a los ojos del
espectador dos imágenes diferentes, cada una de las cuales presenta la misma perspectiva
del objeto pero con una pequeña desviación horizontal (o disparidad) entre ellas, de
modo similar a las dos perspectivas que de forma natural reciben los ojos en la visión
binocular. Así se replica artificialmente el par de imágenes bidimensionales que se forman
naturalmente en ambas retinas al mirar una única escena y que son el origen de la
percepción 3D. Cada estímulo se compone de un par de imágenes (bien separadas -
estereogramas-, bien superpuestas espacialmente - anaglifos) o de un patrón visual
repetitivo (autoestereogramas), y de lo que se trata, como sucede naturalmente con la
visión de la escena que se tiene ante sí, es que una de las imágenes del par se proyecte en
un ojo y la otra, en el otro ojo. Lo relevante para estas demostraciones es que (en
algunos casos) se necesita un cierto tiempo para percibir la imagen 3D en todos esos
estímulos, por lo que cabe concluir que algo está pasando hasta construir la visión en
profundidad. Nótese que si el observador padece algún tipo de estrabismo es probable
que carezca de visión estereoscópica. En cada demostración se describe el estímulo y se
indica el procedimiento para percibir en ellos la tercera dimensión.
Demostración #1. Estereograma o par estéreo de una escena natural. El estereograma

consiste en un par de imágenes de la misma escena tomadas desde dos puntos de vista,
34
uno con un pequeño desplazamiento horizontal con respecto del otro, con el fin
reproducir artificialmente las dos perspectivas de la escena que, de forma natural, reciben
los ojos en la visión binocular. Aunque el procedimiento estándar para ver la imagen 3D
en este y en cualquier estereograma es utilizar un estereoscopio (Wheatstone, 1838), se
sugiere que para ver la imagen 3D se utilice el procedimiento de fusión libre,
procedimiento en el que el observador debe cruzar los ojos de tal manera que la imagen
de la izquierda sea proyectada en el ojo derecho y viceversa.
Demostración #2. Estereogramas o par estéreo de puntos situados aleatoriamente. El

estereograma de puntos aleatorios de una escena natural o artificial es un estereograma
sintético en el que cada imagen miembro del par se ha generado muestreando
aleatoriamente la escena y desplazando horizontalmente los puntos de una zona en una
de las imágenes respecto a los de la misma zona en la otra (Julesz, 1960, 1964). Nótese
que en este tipo de estereogramas es imposible ver ningún objeto en cada miembro del
par y que no existe ni perspectiva ni ninguna otra clave monocular para recuperar la
profundidad. Para ver la imagen 3D en este y en cualquier estereograma se usan los
35
procedimientos reseñados en la demostración #1.
Demostración #3. Anaglifo de una escena natural (http://yellowishhaze.

deviantart.com). Un anaglifo (http://es.wikipedia.org/wiki/Anaglifo) es un estereograma
en el que cada imagen del par se ha representado con un color diferente (usualmente,
rojo o verde) y las imágenes resultado se han sobrepuesto espacialmen te en una única
imagen con un cierto desplazamiento horizontal de la una respecto de la otra. Para ver la
imagen 3D en los anaglifos se utilizan unas gafas con dos filtros de diferente color (rojo y
verde o rojo y azul para este anaglifo) para cada ojo. La función de estos filtros es hacer
llegar a cada ojo únicamente la imagen que le corresponde.
Demostración #4. A la izquierda, anaglifo de puntos aleatorios (Serrano- Pedraza et

al., 2011); a la derecha la superficie 3D que se percibe con el procedimiento adecuado.
36
Un anaglifo de puntos aleatorios es un estereograma de puntos aleatorios en el que como
en cualquier anáglifo, cada imagen del par se ha representada con un color diferente y
luego han sido superpuestas en una única imagen. Utilizando el procedimiento adecuado
en el anaglifo de la izquierda se ve la superficie en relieve de la derecha. Para ver la
imagen 3D en este y en cualquier otro anáglifo de puntos aleatorios se usa el
procedimiento reseñado en la demostración #3.
Demostración #5. Autoestereograma compuesto de imágenes naturales (El Ojo

Mágico, 1993). Un autoestereograma es una forma de estereograma que consiste en una
única imagen con la que se logra la visión 3D sin un estereoscopio o cualquier otra
prótesis para lograr la fusión binocular. Está compuesto por patrones repetitivos para
lograr imágenes en relieve similares a las que elicita la llamada ilusión del papel de pared
descubierta por Sir David Brewster, en 1844. A diferencia del estereograma o del
anaglifo, en el autoestereograma solo existe una única imagen y no dos imágenes en
distintas perspectivas. La parrilla de Hermann (véase más adelante, en las ilusiones
visuales de contraste), además de su particular ilusión de contraste, elicita también la
visión 3D, puesto que comparte con los autoestereogramas el mismo principio de
generación. Un método personal para conseguir la visión 3D en autoestereogramas es el
siguiente: acérquese la imagen del autoestereograma a la cara hasta casi tocarla con la
punta de la nariz; teniendo la mirada fija, pero relajada, en la imagen, aléjese después
muy lentamente la imagen, manteniendo paralela la dirección de la mirada de ambos ojos
y como si cada ojo estuviera mirando a un punto lejano más allá de la página; detenga la
página a la distancia de lectura (de veinte a treinta centímetros). Normalmente se tarda
unos segundos en percibir la profundidad. La dificultad para percibir 3D en los
autoestereogramas reside en que el observador tiene que enfocar la imagen cerca pero la
37
posición de los ojos corresponde a la visión de un objeto lejano. Enfocar un objeto
cercano sin que se produzca vergencia de los ojos de modo automático requiere práctica
por lo que algunos observadores encontrarán la tarea muy difícil.
Demostración #6. Autoestereograma de puntos aleatorios (Tyler & Clarke, 1990). En

1979, Christopher Tyler combinó la ilusión del papel de pared con los estereogramas de
puntos aleatorios y comenzó a diseñar estereogramas de una única imagen o
autoesterogramas de puntos aleatorios (Tyler 1994). La imagen (original de Tyler) es uno
de los primeros autoestereogramas de puntos aleatorios. El procedimiento para ver la
imagen 3D es el descrito para la demostración #5. Siguiendo ese método normalmente se
tarda unos segundos en percibirse una imagen en relieve que es un vórtice en espiral.
3.1.2. Visión espacial
Figuras multiestables
(también reciben los nombres de reversibles o ambiguas)
Objetivo: Normalmente la experiencia perceptiva suele ser unívoca y estable. El

objetivo de esta demostración es mostrar que, debido a la neutralidad de los
componentes del estímulo, la experiencia perceptiva se convierte en ambigua e inestable.
Comentario: La distribución espaciotemporal de energía que recogen los órganos

sensoriales ni distingue las partes significativas del entorno, ni, en general, privilegia la
información relevante sobre la irrelevante. Por ello, puede interpretarse de muchos
38
modos: es, en definitiva, ambigua. La imagen formada en la retina, por ejemplo, es, en
principio, solo un agregado neutro de intensidades lumínicas en el que los puntos vecinos
pertenecientes al mismo objeto no tienen entre sí mayor afinidad que la que tienen los
puntos que pertenecen a objetos diferentes o al ruido visual. (Se dice "en principio"
porque la estadística de las imágenes naturales muestra una cierta correlación de las
luminancias en el entorno de cada pixel). A pesar de ello, la percepción del entorno es
unívoca y estable, ya que en la mayoría de los casos o la propia configuración de la
estimulación sesga la interpretación en una única dirección o los sistemas sensoriales y
perceptivos aplican reglas para conseguir esa interpretación única. Sin embargo, cuando
debido a la propia configuración se ofrecen varias interpretaciones igualmente plausibles,
esas interpretaciones parecen competir y entonces la percepción se vuelve ambigua o,
como se dice en Psicología de la Percepción, multiestable. Los estímulos visuales de la
demostración #7 son figuras multiestables (propiamente biestables) utilizadas para
mostrar que la percepción es naturalmente inestable, ambigua y reversible. Debe notarse
que en una figura multiestable la representación sensorial suele ser única y que lo múltiple
son las representaciones resultantes de los procesos perceptivos.
Demostración #7. Figuras multiestables. A.Copa de Rubin (versión de la figura

original de Rubin c. 1915) (Boring, 1942). Figura multiestable en la que se percibe una
39
copa (si se mira a su seno) o alternativamente dos rostros enfrentados (si se mira al tallo
de la copa). B.La anciana y la joven o figura de Boring (versión de la figura de una
tarjeta postal alemana anónima de 1888 creada por el dibujante W.E.Hill en 1915 y
estudiada por Boring en 1930) (Hill, 1915; Boring, 1930). Figura multiestable en la que
se percibe o el rostro de perfil de una anciana o la cabeza de una mujer joven vuelta de
espalda. Si se percibe en principio una mujer anciana, fíjese la mirada en su nariz e
inténtese ver en ella el contorno de la mejilla de una mujer joven vuelta de espaldas; si se
percibe a una joven, fíjese la mirada en la cinta de su cuello e inténtese ver el ella la boca
de una anciana. C.Cubo de Necker (imagen publicada en 1832 por el cristalógrafo suizo
L.A.Necker). Figura multiestable que puede verse hacia delante o hacia atrás. Con una
cierta práctica se puede hacer oscilar mentalmente la figura. D.Figura pato-conejo
(versión de la original de Jastrow, 1899). Figura multiestable en la que si se mira a la
izquierda de la figura, se percibe la cabeza de un pato; si se mira a la derecha, la cabeza
de un conejo.
Imágenes compuestas
Objetivo: Mostrar que la forma percibida es construida a partir de sus partes

componentes, que no es reducible al agregado de esas partes y que los sistemas
perceptivos derivan representaciones globales del entorno basándose en información
discreta y fragmentaria.
Comentario: Puesto que la percepción de la forma es inmediata, la gente no se suele

dar cuenta de que las entidades del mundo real suelen estar compuestas por partes
relativamente pequeñas e inconexas con una cierta estructura espaciotemporal y que la
forma percibida es una propiedad emergente que no es reducible a la agregación de las
partes componentes. Las demostraciones #8 a #12 muestran precisamente que la
percepción de la forma no es reducible a sus partes componentes. Esos estímulos
muestran imágenes sintéticas en las que es ostensible que las entidades locales que las
componen son fragmentarias y, en algunos casos, diferentes de las que habitualmente las
componen en el mundo real. Pese a ello, el reconocimiento de la forma global es
inmediato con los procedimientos indicados con cada estímulo. La percepción de la
forma global, independientemente de (y no reducible a) sus partes componentes en las
imágenes de las demostraciones #8 a #12 es un fenómeno perceptivo explicado por la
teoría unicanal de la visión espacial humana. La percepción inmediata de las letras C y U
grandes en los estímulos de la demostración #12 se explica mediante la teoría multicanal
de la visión espaciotemporal humana.
40
Demostración #8. Imagen compuesta: Perro dálmata (Fotografía de R.C.James). En
la imagen degradada puede verse la figura de un perro dálmata hozando en el suelo de un
parque y al fondo, un alcorque con el tronco de un árbol. Las personas que ven por
primera vez esa figura la perciben como un patrón aleatorio de manchas irregulares.
Nótese que el contorno del animal no existe físicamente; de hecho existe continuidad
física entre partes que se perciben separadas, como la mancha del suelo y la cabeza del
perro hozando. Además, los cambios de luminancia que permiten trazar los contornos
son localmente indistinguibles de otros cambios no significativos e incluso en algunos
lugares de la imagen son contornos ilusorios (véase la demostración #23). El
procedimiento para percibir la forma global en este y en las cuatro demostraciones que
siguen es intentar verla borrosa, bien desenfocándola de cerca o alejando la imagen. De
cerca, la imagen debe mirarse con visión central entrecerrando los párpados (lo que
modifica la función de dispersión del punto del ojo) para desenfocar a imagen;
alternativamente, la imagen debe alejarse hasta verla borrosa. Esas dos acciones tienen
como resultado eliminar las altas frecuencias espaciales o detalles que dificultan el
reconocimiento de la forma global.
41
Demostración #9. Imagen compuesta. Rostro de un icono de la izquierda socialista
compuesto por logos de empresas capitalistas. De cerca y en detalle se perciben los logos
de conocidas compañías multinacionales; de lejos o en la imagen desenfocada se percibe
el rostro de Ernesto Che Guevara.
42
Demostración #10. Estímulos visuales jerárquicos congruentes (primero y tercero por
la izquierda) e incongruentes (segundo y cuarto) utilizados para estudiar la primacía de la
percepción de la forma global. Nótese que las letras C y U grandes se perciben de forma
inmediata y automática, sin tener en cuenta los micropatrones que las componen (Sierra-
Vázquez, Serrano-Pedraza, & Luna, 2006, Figura 1 según idea original de Navon
(1977)).
Pixelado de imágenes
Objetivo: Mostrar los fenómenos perceptivos producidos por una clase de imágenes
sintéticas muy popular.
Comentario: Una imagen pixelada es una imagen sintética obtenida dividiendo la

imagen original en bloques o regiones regulares (rectangulares o cuadrados) y otorgando
a los píxeles dentro de cada bloque el valor promedio (cuantizado al entero positivo más
próximo) de la luminancia de ese bloque. En la demostración #11 se presenta pixelada la
imagen del rostro de Hermann von Helmholtz y en la demostración #12 versiones
pixeladas de la imagen de La Cibeles con regiones de promediado cada vez de mayor
tamaño. El reconocimiento de esas imágenes pixeladas utilizando los procedimientos
descritos en el demostración #11 es explicado por las teorías un¡- y multicanal de la
visión espacial humana y por la teoría multicanal de la visión espaciotemporal humana.
43
Demostración #11. Pixelado de imágenes: La imagen del rostro de Hermann von
Helmholtz (Boring, 1942) pixelada en 1024 cuadrados. [Imagen original de Serrano-
Pedraza & Sierra-Vázquez]. Para reconocer la imagen original en una imagen pixelada
sirve cualquier procedimiento para verla borrosa. Los procedimientos sugeridos por la
teoría unicanal de la visión espacial humana son (1) de cerca, las personas con visión
normal o corregida deben intentar desenfocar la imagen pixelada, entrecerrando los
párpados; también de cerca, las personas con miopía deben desenfocarla mirando la
imagen sin las prótesis de corrección; y (2) alternativamente, se debe alejar la imagen
hasta situarla a la distancia adecuada para verla borrosa. El procedimiento basado en la
geometría y topología de la retina humana y sugerido por la teoría multicanal de la visión
espacial humana es (3) mirarla de reojo. El procedimiento sugerido por la teoría
multicanal de la visión espaciotemporal humana es (4) mover la cabeza mientras se mira
de cerca la imagen o alternativamente (5) presentar la imagen pixelada por un tiempo
muy breve. La causa de que con todos estos procedimientos se reconozca la imagen
original es la siguiente: el pixelado de una imagen introduce ruido visual de alta frecuencia
espacial que enmascara el reconocimiento de la imagen original; con cualquiera de los
cinco procedimientos mencionados, el Sistema Visual Humano (SVH) elimina las altas
frecuencias espaciales de la imagen pixelada (es decir, el ruido visual) y selecciona las
frecuencias espaciales relativamente más bajas que son las que contienen la información
sobre la figura original, permitiendo así el reconocimiento de la imagen. [Esos cinco
44
procedimientos se encuentran ya tempranamente enumerados por Harmon (1973),
aunque sin citar las teorías de la visión espacial en los que se basan].
Demostración #12. Pixelado de imágenes: Imágenes pixeladas de La Cibeles (un

monumento icónico de la ciudad de Madrid). [Imágenes originales de SerranoPedraza &
Sierra-Vázquez]. La imagen de la fila superior (a) ha sido pixelada en regiones o bloques
de 8x8 (b), 16x16 (c) y 32x32 (d) pixeles (fila inferior) (imágenes originales de Serrano
Pedraza & Sierra Vázquez). Cuanto mayor es el tamaño de la región de promediado,
más difícil es reconocer de cerca la imagen. Nótese que con un cierto grado de suavizado
(imágenes desenfocadas o a una cierta distancia) las cuatro imágenes son indistinguibles.
Cuando borroso se reconoce mejor que nítido
Objetivo: Mostrar un fenómeno visual contraintuitivo explicado por las teorías

vigentes de la visión espacial.
Comentario: Las teorías científicas tienen mayor valor de verdad cuando explican (y
45
predicen) fenómenos contrarios al sentido común (Popper, 1959). Relacionado con el
pixelado de imágenes, aparece el fenómeno contraintuitivo de que una imagen borrosa se
reconoce mejor que una imagen nítida. En efecto, si se miran muy de cerca las imágenes
presentadas en la demostración #15, de modo que los bordes del pixelado aparezcan
totalmente nítidos, con seguridad no se reconocerá los rostros de cuatro personas muy
conocidas y populares. En cambio, si se procede como en el caso del pixelado y se
perciben borrosas, se reconocerán con facilidad los rostros de los Presidentes Obama,
Rodríguez Zapatero, Bush y Aznar. El hecho de que en esas imágenes se reconozcan
mejor los rostros cuando borrosas que cuando nítidas es un fenómeno contraintuitivo
explicado por la teoría unicanal de la visión espacial humana.
Demostración #13. Cuando borroso se reconoce mejor que nítido: pixelado de las
imágenes de los rostros de B.H.Obama, J.L.Rodríguez Zapatero (fila superior), G.
W.Bush y J.M.Aznar (fila inferior). [Imágenes originales de Serrano Pedraza & Sierra
Vázquez]. Imágenes de 512 x 512 píxeles y 8 bits y regiones o bloques de promediado de
46
32x32 píxeles. Para reconocer los rostros, las imágenes deben verse borrosas utilizando
uno cualquiera de los procedimientos descritos en la demostración #11. Véase también en
la descripción de esa demostración la razón del reconocimiento de estos rostros cuando
se suavizan las imágenes.
Cuando de lejos se ve más que de cerca y mucho más lejos deja de verse
Objetivo: Mostrar un fenómeno visual contraintuitivo predicho por teoría unicanal de

la visión espacial humana.
Comentario: La forma en U invertida con las ramas asimétricas de la Función de

Sensibilidad al Contraste (FSC) en escala log-log (véase la Figura 13.5A en Práctica 13),
predice que existe una distancia óptima para ver una imagen: a una distancia menor no se
perciben las entidades gruesas de la imagen y a una distancia mayor no se perciben los
detalles.
Demostración #14. Cuando de lejos se ve mejor que de cerca y mucho más lejos deja
de verse [Imagen original de Serrano-Pedraza & Sierra-Vázquez según idea de Campbell
& Maffei (1974)]. La imagen muestra un enrejado sinusoidal cuyo contraste se va
reduciendo progresivamente de abajo a arriba hasta que las franjas son imperceptibles. Si
se observa muy de cerca la imagen, la longitud percibida de las franjas (desde la base
hasta que dejan de percibirse) se reduce considerablemente; al alejarse la longitud se va
47
incrementando hasta una distancia a partir de la cual la longitud de las franjas comienza
nuevamente a reducirse; de lejos las barras dejarán de ser percibidas de tal modo que la
imagen se percibirá enteramente gris.
Enmascaramiento selectivo por ruido visual (Harmon & Julesz, 1973) (Fenómeno
perceptivo que revela la existencia de bandas críticas en la visión espacial humana)
Objetivo: Mostrar intuitivamente la existencia de canales visuales selectivamente

sensibles a la frecuencia espacial, uno de los descubrimientos más relevantes de la
psicofísica visual de la segunda mitad del s. XX.
Comentario: En los emocionantes días de la década de los setenta del pasado siglo ("in
the heady days of the 1970s") (las palabras son Thompson & Burr, 2009) uno de los
acontecimientos más relevantes en psicofisica visual fue el descubrimiento de la
existencia de mecanismos (o canales) visuales sensibles a la frecuencia espacial de las
imágenes (del mismo modo que ya se conocía la existencia de filtros auditivos
sintonizados a las frecuencias temporales de los sonidos). En las demostraciones de #8 a
#13 el hecho de que la eliminación de todo el ruido visual facilite el reconocimiento
puede hacer pensar que para enmascarar perceptivamente una imagen es necesario todo
el ruido introducido por el pixelado. Sin embargo, la eliminación selectiva de parte del
espectro del ruido permite revelar cuáles son las frecuencias espaciales más efectivas
para enmascarar una imagen. Como puede apreciarse en las imágenes de la demostración
#15, las frecuencias espaciales del ruido más efectivas para el enmascaramiento son las
adyacentes al espectro de la imagen original (e) mientras que las frecuencias espaciales
dos octavas más altas tienen poco efecto sobre la imagen (d). La teoría multicanal de la
visión espacial humana proporciona una explicación plausible de estos hechos, basada en
la codificación de esas imágenes por los canales visuales de frecuencia espacial
descubiertos mediante métodos psicofisicos. En el caso (d) no existe enmascaramiento
perceptivo, aún con la imagen y el ruido superpuestos espacialmente, porque imagen
original y ruido máscara son codificados de modo separado e independiente por distintos
canales visuales de frecuencia espacial. Sin embargo, cuando la imagen original y el ruido
máscara tienen sus espectros de Fourier solapados o adyacentes como en (e) existe
enmascaramiento porque ambos son codificados por los mismos canales visuales en los
que se interfieren. [Se ha utilizado la figura original de Harmon y Julesz (1973) solo por
razones históricas y como homenaje a estos dos autores. La portada de este Manual de
Prácticas es un ejemplo de que ahora es fácil replicar la demostración original con
cualquier imagen].
48
Demostración #15. Enmascaramiento selectivo con ruido visual y demostración de la
existencia de canales de frecuencia espacial en la visión humana [Harmon, L. & Julesz,
B. (1973), Masking in visual recognition: Effect of two-dimensional filtered no¡se.
Science, 180, 1194-1197. Figura 1. © Copyright AAAS 1973. Figura reproducida con
permiso]. a. Retrato de Abraham Lincoln pixelado en 20x20 regiones o bloques. La
máxima frecuencia espacial de la imagen original es de aproximadamente 12
ciclos/anchura de la imagen (c/i), sin embargo el pixelado introduce ruido visual con
frecuencias espaciales superiores a 12 c/i. b. Filtrado paso-bajo numérico de la imagen
pixelada que mejora el reconocimiento. El filtrado ha eliminado todas las frecuencias
espaciales superiores a 12 c/i. Precisamente el efecto de cualquiera de los procedimientos
mencionados en la demostración #11 para reconocer la figura original es realizar
biológicamente un filtrado paso-bajo análogo a este filtrado numérico. c. Resultado de
49
eliminar las frecuencias espaciales superiores a 40 c/i. Las frecuencias espaciales
adyacentes entre 12 c/i y 40 c/i no han sido eliminadas. La percepción del rostro mejora
solo ligeramente. d. Resultado de eliminar las frecuencias espaciales del ruido solo entre
12 c/i a 40 c/i. El rostro de Lincoln es fácilmente reconocible. Nótese que a una cierta
distancia las imágenes b y d son indistinguibles, mientras que a esa misma distancia en las
imágenes a y c se sigue percibiendo el pixelado.
Cuando lo percibido depende de la distancia del observador a la imagen estimular: Las

imágenes híbridas
Objetivo: Mostrar una predicción derivada del análisis multiescala de la imagen

estimular postulado por la teoría multicanal de la visión espacial humana.
Comentario: Si, como se deduce del comentario de la demostración anterior, el SVH

codifica por separado bandas de frecuencias espaciales, será posible construir imágenes
sintéticas en las que diferentes bandas espectrales (espaciales) transporten diferentes
imágenes que no se enmascaren entre sí. Las imágenes híbridas (Oliva, Torralba &
Schyns, 2006; Schyns & Oliva, 1999) son, en general, imágenes sintéticas construidas
combinando en un único espectro de Fourier las bajas frecuencias espaciales (escalas
gruesas) de una imagen con las altas frecuencias espaciales (escalas finas) de otra imagen
diferente, generando una única nueva imagen cuya interpretación cambia con la distancia
de visión. El resultado visible son imágenes como la de la demostración #16 en las que en
una única imagen se superponen espacialmente dos imágenes, cada una en una escala
diferente (una en escala relativamente fina, otra en escala gruesa). Al contrario de lo que
puede pensarse, no es necesario utilizar la técnicas de la Teoría de la Señal (transformada
de Fourier, filtrado paso-bajo y paso-alto) para construir imágenes híbridas con las
características indicadas. El pintor español Salvador Dalí creó analógicamente muchas
figuras híbridas de ese tipo, como el conocido Mercado de esclavos con el busto invisible
de Voltaire (Ades, 2004). En todas las imágenes híbridas sintetizadas de ese modo
(incluidas las creadas por Salvador Dalí), de cerca se percibe la información espacial
contenida en la región de las altas frecuencias espaciales del espectro de Fourier (o
escalas finas) de la imagen, mientras que de lejos se percibe la información contenida en
la región de las bajas frecuencias espaciales (o escalas gruesas). Esta selección subjetiva
de la información espacial con la distancia al estímulo es un fenómeno perceptivo
explicado por el procesamiento multiescala de la imagen estimular que realiza el sistema
visual humano, tal como sugiere la teoría multicanal de la visión espacial humana. [Una
temprana imagen híbrida construida con las imágenes de la palabra "Madrid" y el busto
de la Cibeles y su codificación por los canales visuales basados en datos psicofísicos
puede verse en Sierra-Vázquez (1992), Figura 33].
50
Demostración #16. Imagen híbrida: Aznar y Rodríguez Zapatero. [Imagen original de
Serrano Pedraza & Sierra Vázquez]. De cerca se percibe el rostro de J. L. Rodríguez
Zapatero, de lejos el de J.M.Aznar.
3.2. Fenómenos de la percepción no verídica
3.2.1. Visión espacial
Ilusiones visuales geométricas
Objetivo: Mostrar que la experiencia perceptiva no es una copia del entorno y que,
aunque la mayoría de las veces esa experiencia recoge de modo fidedigno las propiedades
físicas del mundo real, algunos patrones estimulares dan lugar a una experiencia
perceptiva errónea. Este objetivo es común a todas las demostraciones que siguen.
Comentario: Por definición, en Psicología de la Percepción, ilusión es la percepción

de un patrón que aun siendo físicamente posible no se corresponde con las características
físicas del estímulo. Con esta definición (y de acuerdo con Sutherland, 1996) quedan
fuera del campo de las ilusiones, fenómenos como las figuras multiestables o las figuras
imposibles, que muchos textos incluyen como tales. En particular, ilusión visual es la
percepción de un patrón que aun siendo físicamente posible no se corresponde con el
estímulo visual, bien porque se haya alterado perceptivamente la geometría de la imagen
estimular, su contraste o ambos. Ilusiones visuales geométricas son aquellas en las que la
51
alteración perceptiva afecta a la geometría de la imagen (es decir, a su forma, tamaño,
longitud, u orientación). Ilusiones de este tipo son las de Müller-Lyer, Ponzo, Delboeuf,
Poggendorff, Hering, Ehrenstein, Zóllner, entre muchas otras, y cuyas versiones más
corrientes se representan en la demostración #17 [Véase Robinson, 1972, para un listado
exhaustivo de ilusiones visuales geométricas].
52
Demostración #17. Ilusiones visuales geométricas. A.Versiones estándar de las
ilusiones visuales geométricas más conocidas: Müller-Lyer, Ponzo, Delboeuf,
Poggendorff, Hering, Ehrenstein. [Véanse las referencias a los trabajos originales en
Sierra-Vázquez y Serrano-Pedraza (2011)]. La ilusión de Müller-Lyer (a), la más famosa
de todas las ilusiones geométricas, consiste en que dos segmentos de igual longitud, se
perciben con longitud diferente (más largo el que está limitado por las puntas de flecha
hacia adentro que el limitado por puntas de flecha hacia fuera). La ilusión de Ponzo (b)
consiste en que dos segmentos paralelos de igual longitud entre líneas convergentes se
perciben con distinta longitud. La ilusión de Delboeuf (c) consiste en que un círculo de
igual tamaño rodeado y rodeando otros círculos, se percibe con tamaño distinto. La
ilusión de Poggendorf (d) consiste en que dos segmentos oblicuos colineales separados
por dos líneas paralelas se perciben como pertenecientes a líneas rectas diferentes. La
ilusión de Hering (e) consiste en que dos líneas rectas paralelas insertas en un patrón de
líneas radiales se perciben curvadas hacia afuera en el centro (en la versión de Wundt las
líneas radiales divergen y las líneas paralelas se perciben curvadas hacia adentro). En la
ilusión de Ehrenstein (f) un cuadrado inserto en un patrón radial se percibe o como un
trapecio o como un cuadrado girado en profundidad. B.Versión estándar de la Ilusión de
Zóllner. La ilusión de Zóllner consiste en que líneas paralelas oblicuas cortadas por
segmentos horizontales y verticales se perciben como convergentes y divergentes.
Ilusiones visuales de contraste
Comentario: Ilusiones visuales de contraste son aquellas en las que la alteración

ilusoria sucede en el contraste de la imagen. Ilusiones de este tipo muy conocidas son las
de contraste simultáneo acromático, ilusión de Adelson, parrilla de Hermann, bandas de
Mach, ilusión de Craik-Cornsweet-O'Brien y los contornos ilusorios o contornos
cognitivos (como el triángulo de Kanizsa), cuyas versiones estándar aparecen en las
53
demostraciones que siguen [Véase Robinson (1972) para un listado exhaustivo de
ilusiones visuales de brillo o de contraste].
Demostración #18. Ilusión visual de contraste: Contraste simultáneo acromático

(imagen original de Serrano Pedraza & Sierra Vázquez). Los círculos centrales se
perciben con distinta claridad), aunque físicamente ambos círculos poseen idéntico nivel
de gris, como puede fácilmente comprobarse si se cubre el fondo.
Demostración #19. Ilusión visual de contraste: Ilusión de Adelson (© Adelson, 1995).

Las casillas A y B se perciben con distinta claridad, aunque físicamente tienen idéntico
nivel de gris. Véanse más detalles y una explicación en
http://web.mit.edu/persci/people/adelson/checkershadow_illusion.html.
54
Demostración #20. Ilusión visual de contraste: Parrilla de Hermann (Hermann, 1870).
Si se mira fijamente al centro de la imagen, aparecen puntos negros ilusorios en las
intersecciones de las bandas claras. La ilusión es más intensa en las regiones periféricas
que en el punto de fijación.
Demostración #21. Ilusión visual de contraste: Bandas de Mach (Mach, 1865; Ratliff,
55
1965, 1972). [Figura original de Serrano-Pedraza & Sierra-Vázquez]. Las bandas de
Mach son las estrechas franjas ilusorias (una más oscura, la otra más clara) que se
perciben en los lugares en los que el perfil de luminancia en forma de rampa (dibujado en
la parte superior) se une con las áreas uniformes oscura y clara. En la figura, la posición
de cada banda ilusoria está señalada con una flecha.
Demostración #22. Ilusión visual de contraste: Ilusión de Craik-CornsweetO'Brien.

(Cornsweet, 1979). [Figura original de Serrano Pedraza & Sierra Vázquez]. Ambas
mitades se perciben con distinta claridad, aunque si se tapa el borde vertical central, se
hará patente que las dos partes de la imagen tienen, salvo en esa estrecha región central,
el mismo nivel de gris. (El perfil de luminancia se ha representado en la parte superior).
56
Demostración #23. Ilusión visual de contraste: Contornos ilusorios o contornos
cognitivos Triángulo de Kanizsa (Kanizsa, 1986). El triángulo de Kanizsa está compuesto
por los contornos ilusorios que forman los lados de un triángulo también ilusorio, más
claro (a la izquierda) o más oscuro (a la derecha) que el fondo, aunque la superficie de la
figura triangular ilusoria es físicamente uniforme con el fondo. Nótese que, a diferencia
de las ilusiones de contraste anteriormente descritas, en este caso, la ilusión de contraste
se produce sin que existan cambios físicos de luminancia.
Post-efectos acromáticos
Comentario: Cuando la percepción ilusoria sucede después de un tiempo de

exposición a un estímulo, los fenómenos perceptivos correspondientes reciben el nombre
de post-efectos. En cualquier modalidad sensorial, la exposición durante un tiempo
relativamente no muy largo (adaptación) a un estímulo de alta intensidad (estímulo
adaptador) afecta a la percepción de otro estímulo (estímulo test), parecido o no al
adaptador, presentado inmediatamente después. En particular, mirar fijamente durante un
cierto tiempo (un minuto aproximadamente) a una imagen de alto contraste tiene como
consecuencia la pérdida de sensibilidad a imágenes test parecidas y/o la alteración
perceptiva de su geometría, su contrate, la figura total, el color o el movimiento. En lo
que sigue aparecen versiones estándar de los estímulos visuales para provocar las post-
imágenes y post-efectos visuales acromáticos y cromáticos más conocidos. Así, en estas
demostraciones se muestran estímulos adaptadores para producir en otro estímulo
parecido el post-efecto de orientación (Demostración #24), y en superficies acromáticas
uniformes, el post-efecto acromático de figura o post-imagen acromática (Demostración
#25).
57
Demostración #24. Post-efecto acromático: Post-efecto de orientación (Stromeyer,
1978, Figura 4 A). [Thompson, M. & Burr, D.(2009).Visual aftereffects. Current
Biology, 19 (1), R11-R14. Figura 2. © Copyright Elsevier, 2009. Figura reproducida con
permiso]. En su versión estándar, el post-efecto de orientación consiste en que la
adaptación a franjas paralelas inclinadas (estímulo adaptador) en una dirección tiene
como efecto que franjas verticales de un estímulo test se perciban inclinadas en la
dirección opuesta a la del estímulo adaptador. El procedimiento para lograr el postefecto
es el siguiente: compruébese que la mitad derecha de la imagen tiene líneas rectas
verticales (estímulo test); tápese esa mitad; mírese durante treinta segundos a la mitad
izquierda de la imagen (estímulo adaptador que tiene líneas inclinadas paralelas)
moviendo los ojos a lo largo de la línea horizontal central; destápese la parte derecha y
mírese a la línea horizontal del estímulo test. Por un breve tiempo se percibirá ahora las
líneas rectas (antes percibidas como verticales) inclinadas en direcciones opuestas a las
del estímulo adaptador.
58
Demostración #25. Post-efecto acromático: Post-efecto acromático de figura o post-
imagen acromática. Imagen posterizada (estímulo visual adaptador) para producir una
post-imagen acromática negativa (es decir, con el contraste invertido) de la imagen de
Sta. Teresa de Lisieux. Como prueba de la popularidad de este tipo de fenómenos
perceptivos, la imagen procede de una estampa muy difundida editada en el año 1940
para ayudar a las Misiones de la Iglesia Católica y que fue adquirida en un puesto
ambulante del Rastro de Madrid. La imagen, estática, toscamente dicotomizada en sus
niveles de gris y con el contraste invertido, es óptima para producir la postimagen
negativa correspondiente. Además, las instrucciones insertas en la propia estampa son
absolutamente precisas (e inteligibles por todos) para producir la postimagen: "Maravilla
de Optica//Advertencia sobre esta lmaen/ Fije Vd. la vista sobre los tres pequeños puntos
blancos del rostro, cuente (/despacio/) hasta 60; mire al cielo o a una pared, - cuente
hasta cinco con la vista fija y verá la imagen de la Santa subir". Al mirar fijamente al
estímulo adaptador procúrese no parpadear. Durante un tiempo breve, lo que se percibe
en el campo uniforme después de la adaptación es una imagen en escala de grises, con el
contraste de la imagen original y dinámica.
3.2.2. Visión del color
Post-efectos cromáticos
59
Comentario: En los post-efectos cromáticos la adaptación a un estímulo cromático
tiene como consecuencia la percepción del mismo color (post-efecto homocromático) o
del color complementario (post-efecto heterocromático) en una superficie blanca
uniforme. En la demostración #26 se consigue el post-efecto de color heterocromático.
Cuando, como en la demostración #25, el estímulo adap tador tiene categoría de figura,
el post-efecto cromático correspondiente recibe el nombre de post-imagen cromática
(demostración #27).
Demostración #26. Post-efecto de color heterocromático. La imagen cromática es el

estímulo visual adaptador para producir cuatro post-efectos heterocromáticos (matices
oponentes, uno por panel). La adaptación a uno cualquiera de los estímulos cromáticos
tiene como consecuencia la percepción del color complementario en una superficie
blanca uniforme. Para obtener los post-efectos, procédase como se describe en la
Demostración #25, mirando fijamente al centro de la imagen y a continuación a una
superficie uniforme blanca. En la superficie uniforme se percibirán los colores
complementarios con baja saturación (rojo y verde, en la parte superior y amarillo y azul,
en la inferior). [Atención!: dependiendo de las condiciones de presentación pueden
percibirse otros colores ilusorios que los mencionados].
60
Demostración #27. Post-imagen cromática. Imagen (estímulo visual adaptador) para
producir como post-imagen cromática la actual bandera constitucional de España, cuyo
diseño y colores fueron elegidos por Carlos III en 1785 con el objetivo de distinguir a lo
lejos los buques de la Armada española. Para obtener la post-imagen, procédase como se
describe en la demostración #25, mirando a la cruz central durante aproximadamente un
minuto y a continuación fijando la mirada en una superficie uniforme blanca.
3.2.3. Visión del movimiento
Ilusión visual de movimiento
Comentario: La siguiente demostración ilustra el hecho de que se puede percibir

movimiento incluso en una imagen estática. Al acercarse o alejarse de una imagen, se
percibe la imagen estática aunque su tamaño varíe en la retina. Sin embargo,
dependiendo de la configuración espacial del estímulo visual puede ocurrir que nuestro
movimiento induzca la percepción de movimiento ilusorio en la imagen estática, como
sucede en la Demostración #28.
61
Demostración #28. Ilusión visual de movimiento: Ilusión de Pinna-Brelstaff. En la
imagen (Pinna & Brelstaff, 2000) aparecen dos anillos concéntricos compuestos por
elementos con forma romboidal. Todos esos elementos están estáticos. Sin embargo, si
se mueve la cabeza hacia la imagen o se aleja de ella, se produce una fuerte impresión de
movimiento circular en el que los anillos se mueven en sentidos opuestos.
3.2.4. Visión espacial, sensibilidad visual temporal, del color y del movimiento
Comentario: Hasta aquí, se ha clasificado cada demostración de la percepción no

verídica (fundamentalmente, ilusiones visuales) de acuerdo con un solo tipo de visión
(espacial, color o movimiento). Pero la visión (como cualquier otra modalidad sensorial)
es única y los diferentes tipos no van por separado en la percepción visual sino formando
un todo integrado. La ilusión de Hinton (Hinton, 2005; véase http://michaelbach.de/ot/co-
lilacChaser/index.html) que aparece en la Demostración #29, aunque clasificada por
M.Bach en las ilusiones de color, muestra la interacción de la visión espacial, sensibilidad
visual temporal, visión del color y del movimiento, para dar lugar a una de las ilusiones
visuales más fascinantes y sorprendentes.
Demostración #29. Ilusión de Hinton (también llamada Lilac Chaser illusion o ilusión
de los perseguidores del lila) (J.L.Hinton & M.Bach, ©2005-2010;
http://michaelbach.de/ot/col_lilacChaser/index.html). El estímulo se compone de once
discos borrosos (como manchas) de color magenta (o lila) dispuestos en un círculo sobre
un fondo de color gris, cada uno de los cuales aparece y desaparece físicamente sin
cambiar de posición y sucesivamente (o sea, en presentación estroboscópica) y en la
dirección de las agujas del reloj. Cuando se mira fijamente a la cruz central, sucede lo
siguiente: primero se percibe un hueco gris moviéndose con los discos de color magenta
62
presentes, después se percibe un disco de color verde muy saturado que se mueve, en
lugar del hueco, con los discos de color magenta y finalmente (aproximadamente a los
veinte segundos), los discos de color magenta desaparecen y solo se percibe la mancha
de color verde (¡algo que no está físicamente presente en el estímulo!) moviéndose
alrededor del punto de fijación. Cuando se desplaza la mirada de la cruz de fijación, las
manchas de color magenta reaparecen otra vez y se percibe el hueco gris moviéndose. La
ilusión de Hinton es un fenómeno perceptivo muy complejo consecuencia de la
combinación del movimiento aparente, la existencia de postefectos de color
heterocromáticos y el efecto o desvanecimiento de Troxler (efecto que consiste en que
cuando se mantiene fija la mirada en un punto particular, después de unos veinte
segundos, estímulos alejados de ese punto, en la periferia del campo visual, se van
desvaneciendo hasta desaparecer).
Sujeto experimental:
NOMBRE.......................................................................................
1. Fenómenos de la percepción verídica
1.1. Describa el par estéreo de la Demostración #1.
El par estéreo o estereograma consiste en dos imágenes de la misma escena tomadas

desde puntos de vista dife rentes, uno con un pequeño desplazamiento horizontal con
respecto del otro, con el fin reproducir artificialmente las dos imágenes de la escena que,
de forma natural, reciben los ojos en la visión binocular.
1.2. Describa el anaglifo de la Demostración #3 y la consiguiente experiencia 3D.
1.3. Describa una cualquiera de las figuras multiestables de la Demostración #7 y la
63
consiguiente experiencia perceptiva.
1.4. Describa una cualquiera de las figuras de las demostraciones #8 a #12 y la

consiguiente experiencia perceptiva.
1.5. Defina imagen pixelada y describa uno cualquiera de los fenómenos perceptivos
relacionado con ellas.
1.6. Enumere los cinco procedimientos reseñados en la demostración #11 para reconocer
la imagen global en una imagen pixelada (asócielos con la correspondiente teoría de
la visión humana).
64
1.7. Describa el fenómeno perceptivo que sucede cuando ve la imagen de la
demostración #14 muy, muy cerca y la va alejando progresivamente.
1.8. Indique una condición suficiente para que una imagen ruidosa enmascare
perceptivamente a otra.
1.9. Indique la causa, según la teoría multicanal de la visión espacial humana, por la que
ruido visual cuyo espectro de Fourier se solapa con el de la imagen original o es
adyacente a él, enmascara a esa imagen.
65
1.10. Defina imagen híbrida y describa el fenómeno perceptivo relacionado con esa clase
de imágenes.
2. Fenómenos de la percepción no verídica
2.1. Describa una cualquiera de las ilusiones visuales geométricas de la demostración

#17.
2.2. Describa una cualquiera de las ilusiones visuales de contraste de las demostraciones
#18 a #23.
66
2.3. Describa el post-efecto acromático de figura de la demostración #25.
2.4. Describa la ilusión de movimiento de la demostración #29.
67
68
1. Introducción
1.1. La ley de Stevens para la percepción de la sonoridad
Desde un punto de vista clásico, el problema psicofísico consiste en encontrar una

función que relacione la magnitud física del estímulo con la magnitud de la sensación que
provoca. La solución de S.S.Stevens al problema psicofísico se conoce con el nombre de
Ley (potencial) de Stevens (Stevens, 1957, 1962), formulada así:
siendo S, la magnitud de la sensación, en unidades subjetivas, E, magnitud del estímulo,

en unidades físicas, b, constante arbitraria determinada por las unidades de medida, y a,
a>O, exponente, constante, propio de la modalidad sensorial, atributo sensorial,
condiciones de estimulación e independiente de la escala de medida.
Sonoridad o volumen sonoro es la sensación producida por la intensidad física (en

sentido amplio) del sonido. También se define como el atributo de la sensación auditiva
de acuerdo con el cual los sonidos pueden ser ordenados en una escala que va de débil a
fuerte. Pues bien, para la percepción de la sonoridad la versión de la ley potencial de
Stevens es:
donde L, es la sonoridad, P, presión sonora en dinas/cm2, b, constante arbitraria

determinada por las unidades de medida, y a, exponente, constante propia para la
percepción de la sonoridad, siendo los valores estándar a=0.60 para un tono de 1000 Hz
69
y ruido blanco, en el rango 0.60-1 (Poulton & Stevens, 1955) y a=0.67 para un tono de
3000 Hz (Stevens, 1970 y 1975). Nótese que tomando logaritmos en ambos miembros,
resulta:
lo que indica que en escala log-log la relación es lineal.
La ley de Stevens estándar para la percepción de la sonoridad (en sones) en escala

lineal (Figura 2.1 A) es:
donde P es la presión sonora medida en dinas/cm2, ecuación que se puede simplificar

como:
Esta ecuación también se puede expresar del siguiente modo (Figura 2.1B):
donde N es el nivel de presión sonora medido en dB SPL.
Los objetivos concretos de esta Práctica son:
1.Registrar la estimación de la sonoridad de un conjunto de sonidos por una persona

(sujeto experimental).
2.Calcular del valor de los parámetros a y b para cada persona del grupo.
3.Representar gráficamente los resultados experimentales y la función potencial

correspondiente para cada persona.
70
Figura 2.1. Representación gráfica de la ley potencial de Stevens para la percepción de la
sonoridad A.Gráfica en escala lineal de la ley potencial de Stevens para la percepción de
la sonoridad, en sones, en función de la presión sonora en dinas/cm2 (b=10 a=0.60).
B.Gráfica que representa la ley potencial de Stevens para la sonoridad (en sones) en
función del nivel de presión sonora en dB SPL utilizando los mismos valores para los
parámetros b y a que en el gráfico A.Nótese que el eje de ordenadas está graduado en
escala logarítmica.
2. Método
2.1. Estímulos
71
Se utilizarán 27 estímulos sonoros. Cada estímulo es un ruido blanco Gaussiano, es decir,
un sonido cuyo espectro de amplitud es uniforme, con nivel No en dB y cuyo espectro
de fase es aleatorio con fdp uniforme entre los valores (-ir,ir). Los sonidos son originales
y han sido generados utilizando MATLAB dentro del ran go 1-22050 Hz. La frecuencia
de muestreo utilizada para generar los estímulos fue de 44100 Hz. Los ruidos se han
generado con 9 niveles de presión sonora No=0, ±5, ±10, ±15, ±20 dB con relación al
nivel depresión sonora del ruido de referencia. Cada nivel se presentará tres veces.
Se utilizará el procedimiento de estimación de magnitudes. Se estimará la sonoridad de

27 estímulos (9 niveles x 3 presentaciones cada uno) de ruido blanco relativo a la
sonoridad producida por un ruido blanco de referencia. En cada ensayo o presentación se
oirá una pareja de ruidos: el primer ruido es el de referencia (o estímulo de referencia)
que tendrá siempre la misma sonoridad, e inmediatamente después se oirá el segundo
ruido (estímulo test) que tendrá una sonoridad variable respecto al ruido de referencia.
La tarea del sujeto experimental será estimar la sonoridad del estímulo test respecto a la
sonoridad percibida en el estímulo de referencia. La secuencia temporal de cada ensayo o
presentación aparece en la Figura 2.2.
Figura 2.2. Secuencia temporal de cada ensayo o presentación. En el ejemplo se muestra

un ensayo donde el estímulo test tiene un nivel de presión sonora 20 dB mayor que el
estímulo de referencia. El sujeto experimental tiene que estimar la sensación sonora
72
producida por el estímulo test teniendo en cuenta la sensación sonora producida por el
estímulo de referencia.
2.3. Aparatos
Para la presentación de los estímulos solamente es necesario un sistema de reproducción

de archivos mp3 conectado a unos altavoces. Dado que es una tarea de estimación de la
sonoridad del estímulo test respecto al de referencia, el volumen de los altavoces tiene
que ajustarse de tal manera que el ruido test más débil (-20 dB) sea perfectamente
audible.
El experimentador ha de tener en cuenta las siguientes advertencias:
1.El nivel de cada estímulo test está fijado de modo que su nivel de presión sonora en
dB con relación al sonido de referencia es el adecuado, sea cual sea el valor de la
presión sonora absoluta en dinas/cm2 del estímulo de referencia en la
presentación. Por ello, la relación entre estimación y nivel de presión sonora en dB
será siempre lineal, sean dB sin más o dB SPL (véase más adelante).
2.Como el exponente de Stevens, a, es independiente de la escala de medida, para la

determinación de su valor no es necesario medir el nivel de presión sonora
particular en dB SPL para el estímulo de referencia.
3.Sin embargo, para comparar los resultados obtenidos en esta Práctica con los
resultados estándar, se pueden seguir dos estrategias:
a)Usar un sonómetro para medir la presión sonora (dB SPL) del estímulo de
referencia, siendo el valor recomendado 30 dB SPL. [Véase la columna N del
Cuadro 2.2].
b)Usar el estímulo de calibración calibracion.wav", véase 2.5 Material audiovisual).

Este estímulo se presentará de modo que sea apenas audible. El estímulo de
calibración es 30 dB inferior al estímulo de referencia. Una vez que este
estímulo es apenas audible, fíjese el volumen del equipo y asígnese 30 dB al
nivel de presión sonora del estímulo de referencia. [Véase la columna N del
Cuadro 2.2].
73
En el directorio MATERIAL PRACTICA 2 se encuentran dos archivos de audio con
extensión wav con el siguiente contenido:
1. Practica2Mínimo.wav. Archivo de audio que contiene tres sonidos: el ruido de

referencia que aparece en todas las parejas, el ruido que es el estímulo test con el
nivel de presión sonora máximo y el ruido que es el estímulo test con el nivel de
presión sonoro mínimo.
2. Practica2 Archivo de audio que contiene las veintisiete parejas de ruido blanco. En
todas las parejas, el primer ruido tiene el nivel de presión sonora de referencia y el
segundo es el estímulo test cuya sonoridad hay que estimar respecto a la del ruido
de referencia.
3.Practica2 calibracion.wav. Archivo de audio que contiene un sonido que es ruido

blanco con un nivel de presión sonora 30 dB inferior al nivel del ruido de
referencia.
A los sujetos experimentales se les impartirán las siguientes instrucciones:
-Solo en caso de no utilizar sonómetro para la calibración del volumen del equipo:
Ahora vais a escuchar un ruido al que voy a bajar el volumen hasta que sea
apenas audible. Decidme cuando dejáis de oírlo. [El experimentador presenta el
fichero de audio Practide
-Primero escucharéis el sonido de referencia y el sonido test más intenso y el menos

intenso. [El experimentador presenta el fichero de audio Practica2Maximo
-A continuación escucharéis la secuencia compuesta de las veintisiete parejas de ruido

blanco acústico. En todas las parejas, el primer ruido es el estímulo de referencia y
el segundo ruido es el estímulo test (véase el ejemplo de un ensayo en la Figura 1).
-Vuestra tarea consiste en estimar la sonoridad del estímulo test respecto a la

sonoridad producida por el estímulo de referencia.
-Al ruido de referencia le asignaréis un valor de 100.
-Si consideráis que el ruido test se oye con el doble de sonoridad escribiréis 200, si se
oye con la mitad, 50.
74
- No os preocupéis demasiado por la precisión, ni en intentar cálculos mentales
complicados, solo escribid la respuesta que os venga espontáneamente a la cabeza.
-Anotad la respuesta en la casilla correspondiente de las filas Lesti_m del Cuadro 2.1.
Estáis todos preparados. Empezamos. [El experimentador presenta el fichero de
audio Practica2 Experimento.wavl.
2.7. Cálculo de los parámetros ay b de la ley de Stevens
La ley potencial de Stevens relaciona la sonoridad con una medida absoluta de la presión
sonora, no con la medida relativa en dB, que es como vienen expresados los estímulos en
esta Práctica. El objetivo de la deducción siguiente es expresar la estimación general de la
sonoridad (L) en función de la presión sonora en dB SPL (N). Luego, tomando
logaritmos en ambos miembros de la expresión resultante, se obtendrá una relación lineal
que permitirá aplicar los procedimientos conocidos de regresión lineal para la estimación
de los parámetros.
Así pues, se sabe que:
y que:
por lo que:
Sustituyendo P en la primera ecuación se tiene:
que expresa la sonoridad, L, en función de la presión sonora en dB SPL, N (donde Pro

0.0002 dinas/cm2). Tomando logaritmos decimales en ambos miembros, se obtiene:
75
Haciendo:
se obtiene:
que pone de manifiesto la relación lineal entre log L y N.
Puesto que los valores de N (nivel de presión sonora en dB SPL) y L (sonoridad

estimada) son conocidos, A y B pueden estimarse por procedimientos elementales de
regresión lineal. Haciendo:
se tiene (Amón, 1978) que:
Recordando que:
se obtiene finalmente:
En el ejemplo siguiente en el Cuadro 2.1 aparece la sonoridad estimada (Lestim) en

cada presentación por una persona con audición normal (sujeto experimental ejemplo) y
76
en el Cuadro 2.2 el proceso del cálculo del valor de los parámetros de la propia ley de
Stevens para la estimación de la sonoridad. Para que las estimaciones de los parámetros
de la ley de Stevens sean comparables con los valores estándares, los valores de la
sonoridad estimada en unidades relativas, Le1tim hay que transformarlos en sonoridad
medida en sones, L, mediante la ecuación:
donde 0.48 es el valor en sones correspondiente a un ruido blanco de 30 dB utilizando la

ley de Stevens con los parámetros estándar y que se supone es el nivel de presión sonora
del estímulo de referencia y 100 es el valor que el sujeto experimental tiene que asignar
cuando el estímulo test se percibe igual de sonoro que el estímulo de referencia.
En la Figura 2.3 A se representan gráficamente los resultados experimentales en

función del nivel de presión sonora en dB SPL y la línea recta obtenida por regresión
lineal. En la Figura 2.3 B se representan los resultados en función de la presión sonora en
dinas/cm2 y la curva de la función potencial de Stevens que relaciona la presión sonora y
la estimación de la sonoridad.
3.1. Estimación de la sonoridad. Resultados experimentales
En el Cuadro 2.1 se registra la sonoridad estimada por la persona ejemplo (sujeto

experimental) en cada presentación.
CUADRO 2.1.
Sonoridad estimada (Les,;,, en cada presentación (n) por el sujeto experimental
3.2. Cálculo del valor de los parámetros de la ley de Stevens correspondiente al sujeto
experimental
En el Cuadro 2.2 aparece el proceso de cálculo del valor de los parámetros de la ley de
77
Stevens correspondiente al sujeto experimental.
CUADRO 2.2.
Cálculo del valor de los parámetros de la ley de Stevens
78
En el Cuadro 2.3 aparecen los valores de los parámetros de la ley de Stevens
correspondientes al sujeto experimental del ejemplo.
CUADRO 2.3.
Valores de los parámetros de la ley de Stevens para el sujeto experimental
Por ello, la ley de Stevens para la percepción de la sonoridad, en sones, para el sujeto
experimental es:
Análisis:
Nótese los valores de b y del exponente a próximos a los valores estándar.
Los resultados de este experimento se muestran en la Figura 2.3.
Función representada en la Figura 2.3A:
La Figura 2.3A muestra la estimación de la sonoridad en función de la presión sonora

en dB (círculos). La línea recta del panel superior (la obtenida por regresión lineal)
corresponde a la siguiente ecuación en escala logarítmica:
con b=11.37, Pré 0.0002 dinas/cm2, a=0.618. Puesto que la gráfica es una línea recta,
para representarla basta encontrar las coordenadas de dos puntos; por ejemplo, para
N=10, L=0.12 y para N=50, L=2.06. [Por favor, trácese la recta en todo el gráfico, ¡no
utilice como límites los puntos que han servido para trazarla!].
Función representada en la Figura 2.3B:
La Figura 2.3B muestra en escala lineal la sonoridad (en sones) en función de la

presión sonora en dinas/cm2 (círculos). La línea continua muestra la gráfica de la ley
potencial de Stevens para la percepción de la sonoridad, en sones, para esa persona, es
decir, la gráfica de:
79
Figura 2.3. Representación gráfica de los resultados experimentales y de la ley potencial
de Stevens para la ercepcións de la sonoridad. A.En el panel se muestran la estimación
de la onoridadpen sones (círculos) en función del nivel de presión sonora en dB SPL y la
gráfica (línea recta) de la función que ajusta esos datos obtenida por regresión lineal.
B.En el panel se muestran, en escala lineal-lineal, la estimación de la sonoridad en sones
(círculos) en función de la presión sonora en dinas/cm2 y la curva de la función potencial
(ley de Stevens) para el sujeto experimental que relaciona la estimación de la sonoridad
80
en sones y la presión sonora (b= 11.37, a=0.618).
4. Aplicaciones: Problemas
4.1. Decrementos en presión sonora (escala absoluta) desiguales, razón aja o variable?
entre sensaciones
Demonstration #4, The decibel scale. Houtsma, A.J.M., Rossing, T. D., Wagenaars,
W.M. (1987). Tracks #8-11.
Instrucciones de experimentador a los sujetos experimentales
-Escucharéis ruido blanco de banda ancha cuya potencia sonora se reduce en pasos
de 6, 3 y 1 db SPL. Las demostraciones para cada paso se presentan dos veces.
-Primera serie (reducción de la potencia sonora en pasos de 6 dB SPL).
-Segunda serie (reducción de la potencia sonora en pasos de 3 dB SPL).
-Tercera serie (reducción de la potencia sonora pasos de 1 dB SPL).
-Indicad (a) si percibís que la reducción (o el decrecimiento) es fija o variable y (b) si

percibís que el decrecimiento es fijo, estimad, por favor, para la tercera serie, con,
al menos, tres cifras decimales, en cuánto te parece que disminuye constantemente
la sonoridad de un ruido con respecto al anterior.
Problema
Para la tercera serie, una vez decidido si la reducción o decrecimiento es fijo y

estimada la magnitud del decrecimiento, utilícese la ley de Stevens para la percepción de
la sonoridad correspondiente al sujeto experimental y (a) demuéstrese que, teóricamente,
la reducción o razón estimada entre los volúmenes sonoros de cualesquiera dos ruidos
sucesivos de la tercera serie ha de ser fija o constante y (b) compruébese si la estimación
empírica de la reducción es parecida a la predicción teórica.
Resultados
VSV percibe el decrecimiento o razón como fijo.
Para VSV el decrecimiento o razón de la sonoridad de un ruido con respecto al
81
anterior es aproximadamente igual a 0.90, es decir percibe los ruidos casi con la misma
sonoridad, pero un poquito más débiles.
Solución: Predicción teórica de la razón estimada en la tercera serie y consistencia con la

estimación numérica del exponente
Sea N la potencia inicial en dB SPL, sea 8 el decremento o reducción constante, en

dB SPL, en cada paso, k8 el decremento total en el paso k y (k+l)8 el decremento total
en el paso siguiente. Sea L la sonoridad estimada para el ruido en el paso k y L para el
ruido en el paso ksiguiente o k+l. Supongamos a como exponente de §tevens de la
persona. Si se calcula la razón entre ellos, se obtiene:
por ello:
Resulta que si a=0.60 como valor estándar y 8=1 dB SPL, como en la tercera serie de
la demostración, entonces:
lo que significa que (i) aunque físicamente el factor de decrecimiento en presión sonora
(dinas/cm2) es variable de un ruido al siguiente, la ley potencial predice que
subjetivamente el decrecimiento se ha de percibir como fijo y (ü) que en el caso de
8=1dB SPL, el siguiente ruido se oye con casi igual sonoridad que el anterior, pero un
poquito más débil en sonoridad ¡confirmando la experiencia fenoménica! [Nota
importante: Para cada sujeto experimental se debe usar su propio exponente y comprobar
si sus estimaciones empírica y teórica son consistentes].
4.2. Cantidad en la que hay que disminuir la presión sonora en dB SPL para que la
sensación sonora se reduzca en un factor multiplicativo k (O<k<1).
Disminución del nivel de potencia de fuentes sonoras y su efecto en la sonoridad
82
En una noticia aparecida en un diario de difusión nacional (El País) se informa de que
un grupo de científicos de diversas instituciones españolas, incluidas Universidades y
CSIC, se reunieron para elaborar un reglamento acerca de la potencia sonora de señales
acústicas urbanas. El encabezado de la noticia es que "Las sirenas de alarmas tendrán
que reducir en un 10% su potencia". La noticia precisa que "La Comisión ha llegado a la
conclusión de que rebajando en 10 dB la potencia sonora (de las sirenas) `la función de
señales de alerta se cumple perfectamente y la sensación sonora de las personas se
reduce a la mitad'". Las informaciones periodísticas de una noticia científica o
tecnológica raras veces la recogen de modo fidedigno. Se supone que ese grupo de
científicos y técnicos se reunirían para algo más sofisticado que para alcanzar la
conclusión que aparece destacada en la nota, puesto que, conocida la ley de Stevens para
la percepción de la sonoridad junto con el valor del exponente, el cálculo de la solución
es, como se verá, casi trivial. A continuación se generaliza el problema y se plantea el
caso general.
Problema
Calcúlese la cantidad en que hay que rebajar o disminuir la presión sonora en dB SPL
para que la sonoridad se reduzca en un factor multiplicativo k ,0<k<l. (Nótese que en el
caso de la noticia k=1/2).
Solución
Sea D la cantidad en dB SPL que hay que disminuir la presión sonora N, en dB SPL,
para que la sonoridad se reduzca en un factor k. La ley de Stevens relaciona la
sonoridad, L, con la presión sonora P, en dinas/cm2; por lo tanto, es necesario calcular la
expresión que relaciona la sonoridad con la presión sonora, en dB SPL, N.Se sabe que:
y que:
Sustituyendo P en la primera ecuación:
que expresa, la sonoridad, L en función de la presión sonora en dB SPL, N.
83
Ahora es posible enunciar formalmente el problema. En efecto, el objetivo es
encontrar D tal que:
Desarrollando el exponente:
Tomando logaritmos decimales en ambos miembros, se obtiene:
de donde, finalmente se obtiene la fórmula general:
En el caso de la noticia k=1/2 y suponiendo a=0.60:
Así pues, con un exponente estándar igual a 0.60 hay que reducir la presión sonora en
10 dB SPL aproximadamente para que la sensación sonora se reduzca a la mitad, que es
la conclusión a la que llegó la Comisión según la nota aparecida en el diario.
Nota importante: Al calcular el decremento se debe usar el exponente propio de cada

sujeto experimental.
NOMBRE.......................................................................................
84
(Nota: Se indica entre corchetes la numeración del apartado anterior con el que se
corresponde).
RESULTADOS [3]
Estimación de la sonoridad. Resultados experimentales [3.1]:
Sonoridad estimada (L,n„) en cada presentación (n) por el sujeto experimental

[CUADRO 2.1]
Cálculo del valor de los parámetros de la ley de Stevens correspondiente al sujeto

experimental [3.2]
[CUADRO 2.2.]
85
Valores de los parámetros de la ley de Stevens para el sujeto experimental
[CUADRO 2.3.]
Por ello, la ley de Stevens para la percepción de la sonoridad, en sones, para el sujeto
experimental es
Análisis:
Representación gráfica de los resultados y la función potencial correspondiente para cada

persona. [3.3]
Función representada en la Figura 2.3A:
86
Función representada en la Figura 2.3B:
87
Representación gráfica de los resultados experimentales y de la ley potencial de Stevens
para la percepción de la sonoridad. A.En el panel se muestran la estimación de la
sonoridad en sones (círculos) en función del nivel de presión sonora en dB SPL y la
gráfica (línea recta) de la función que ajusta esos datos obtenida por regresión lineal.
B.En el panel se muestran, en escala lineal-lineal, la estimación de la sonoridad en sones
(círculos) en función de la presión sonora en dinas/cm2 y la curva de la función potencial
(ley de Stevens) para el sujeto experimental que relaciona la estimación de la sonoridad
en sones y la presión sonora (b=.......... a=..........). [FIGURA 2.3.]
APLICACIONES: RESULTADOS [4]
88
Decrementos en presión sonora (escala absoluta) desiguales, razón ¿fija o variable? entre
sensaciones [4.1]
Una vez decidido si la reducción o decrecimiento es fijo o constante y estimada la

magnitud del decrecimiento, utilícese la ley de Stevens para la percepción de la sonoridad
correspondiente al sujeto experimental y (a) demuéstrese que, teóricamente, la reducción
o razón estimada entre los volúmenes sonoros de cualesquiera dos ruidos sucesivos de la
tercera serie ha de ser fija o constante y (b) compruébese si la estimación empírica de la
reducción es parecida a la predicción teórica.
Resultados
Solución:
Cantidad en la que hay que disminuir la presión sonora en dB SPL para que la sensación
sonora se reduzca a la mitad [4.2]
89
Calcúlese la cantidad en la que hay que reducir la presión sonora en dB SPL para que
la sonoridad se reduzca a la mitad. Compárese el resultado con la conclusión de la
comisión de técnicos e indíquese la causa del acuerdo o de la discrepancia. [Nota:
Resuélvase el problema directamente y no mediante la fórmula final encontrada en el
texto principal. Utilícese esa fórmula solo para verificar la solución propia].
Solución:
90
91
92
1. Introducción
1.1. La ley de Stevens para la percepción del brillo
Desde un punto de vista clásico, el problema psicofísico consiste en encontrar una

función que relacione la magnitud física del estímulo con la magnitud de la sensación que
provoca. La solución de S.S.Stevens al problema psicofísico se conoce con el nombre de
Ley (potencial) de Stevens (Stevens, 1957, 1962) formulada así:
donde S es la magnitud de la sensación, en unidades subjetivas, E, magnitud del estímulo

(en unidades físicas), b, constante arbitraria determinada por las unidades de medida y a,
a>O, exponente, constante propia de la modalidad sensorial, atributo sensorial,
condiciones de estimulación e independiente de la escala de medida.
Brillo es la sensación producida por la luminancia de un estímulo visual. También se

define como el atributo de la sensación visual de acuerdo con el cual un estímulo visual
parece ser más o menos intenso (Wyszecki & Stiles, 1982). Las variaciones de brillo
pueden ordenarse en un rango que va de poco brillante a muy brillante. Pues bien, para
la percepción del brillo la versión de la ley potencial de Stevens es:
siendo Br, el brillo, en unidades subjetivas, L, la luminancia, en cd/m2, b, una constante

arbitraria determinada por las unidades de medida, exponente a, a>0, una constante
propia para la percepción del brillo. Para un círculo de 5 grados de ángulo visual (gav) en
93
la oscuridad el exponente estándar es a=0.33 y para un estímulo que es un punto brillante
es a=0.5 (Stevens, 1970 y 1975, Stevens & Stevens, 1963). Nótese que tomando
logaritmos en ambos miembros, resulta:
lo que indica que en escala log-log la relación es lineal.
La ley de Stevens estándar para la percepción del brillo (en brils) en escala lineal
(Figura 3.1A) es (Stevens & Stevens, 1963, Pokomy, & Smith, 1986):
donde L es la luminancia de cd/m2. Ecuación que se puede simplificar como:
Esta ecuación también puede ser representada utilizando una escala en dB:
donde N es el nivel de brillo en dB re 3.183x10-7 cd/m2.
En escala log-log, la ley de Stevens para la percepción del brillo (Figura 3.1B) es:
94
Figura 3.1. Representación gráfica de la ley potencial de Stevens para la percepción del
brillo A.Gráfica en escala lineal de la ley potencial de Stevens para la percación del brillo
en brils, en función de la luminancia, en cd/m2 (b=6.82, a=0.33). B.Gráfica de la misma
ley en escala log-log.
1.Registrar la estimación del brillo de un conjunto de imágenes por una persona
95
(sujeto experimental).
2.Calcular los valores de los parámetros a y b para cada persona del grupo.
3.Representar gráficamente los resultados experimentales y la función potencial

correspondiente a cada persona.
2. Método
2.1. Estímulos
Se utilizarán 27 estímulos visuales que son imágenes de círculos luminosos con diferentes
niveles de luminancia. Las imágenes son originales y han sido generadas con MATLAB.
Se utilizarán 9 niveles relativos de luminancia (niveles de gris) (L = 8, 16, 32, 64, 128,
192, 224, 240, 248) y se realizarán tres presentaciones por cada nivel de luminancia L.
Se utilizará el procedimiento de estimación de magnitudes. Se estimará la percepción del

brillo de 27 estímulos visuales (9 niveles de gris x 3 presentaciones cada uno) relativo al
brillo del estímulo de referencia. En la Figura 3.2 se presentan los dos casos extremos de
estímulos que aparecen en el experimento: en la Figura 3.2A aparece el círculo con el
brillo de referencia junto con el círculo con el brillo más débil y en la Figura 3.2B aparece
con el círculo con el brillo más intenso.
96
Figura 3.2. Ejemplos de imágenes usadas en el experimento. El círculo de la izquierda en
ambas imágenes muestra el estímulo con el brillo de referencia; el círculo de la derecha
de la imagen A muestra el estímulo con el brillo más débil de todos, el círculo de la
derecha de la imagen B muestra el estímulo con el brillo más intenso de todos.
En cada ensayo o presentación (véase la Figura 3.3A) aparecen simultáneamente dos

círculos: el de la izquierda siempre es el estímulo de referencia y tiene el mismo valor de
luminancia, el de la derecha (estímulo test) tiene una luminancia variable respecto al de
referencia. La tarea del sujeto experimental será estimar el brillo del estímulo test
respecto al brillo percibido en el estímulo de referencia con una escala numérica en la que
se asigna un valor de 100 al brillo del círculo de referencia. La duración de cada
presentación es de 2 s y con el objetivo de eliminar post-efectos de adaptación visual, la
presentación del estímulo es seguida por la presentación de un ruido blanco visual de
duración 4 s (véase la Figura 3.3B).
97
Figura 3.3. A.Ejemplo de un ensayo o presentación. A la izquierda de la imagen, círculo
con el brillo de referencia; a la derecha, círculo cuyo brillo hay que estimar con relación
al de referencia. B.Ejemplo de ruido blanco utilizado entre presentaciones para eliminar
posibles post-efectos no deseados.
2.3. Aparatos
Para la presentación de los estímulos será necesaria la utilización de proyectores o

pantallas de ordenador o de televisión.
Se ha creado un archivo (véase Material audiovisual en §2.5) que contiene una película
con extensión avi suponiendo que el dispositivo de presentación de imágenes no está
calibrado. En general, los dispositivos de presentación de imágenes vienen por defecto sin
calibrar por lo que la relación entre los valores (voltaje) de la imagen y la luminancia (en
cd/m2) emitida no es lineal. Para corregir la luminancia se utiliza un procedimiento
denominado corrección gamma y para el cual es necesario la utilización de un fotómetro
a fin de medir la relación real entre voltaje y luminancia. Como seguramente no se habrá
realizado la corrección gamma en el sistema de presentación de imágenes, el fichero
PracticaExperimento.avi se ha generado asumiendo un valor típico para el exponente
gamma de 2.3 de tal manera que al presentar esta película con un sistema de proyección
o en un monitor no calibrados la luminancia estará aproximadamente corregida (véanse
más detalles en el apartado siguiente).
El directorio MATERIAL PRACTICA 3 contiene dos imágenes con extensión .jpg y un

archivo de vídeo con extensión avi con el siguiente contenido:
1. Practica3Mínimojpg y Practica3Máximojpg. Archivos correspondientes a dos
98
imágenes, cada una con dos círculos: el círculo de la izquierda en ambas imágenes
muestra el estímulo con el brillo de referencia; el círculo de la derecha en la
primera imagen muestra el estímulo con el brillo más débil posible, el círculo de la
derecha de la segunda imagen muestra el estímulo con el brillo más intenso
posible.
2. Practica3 Archivo de vídeo que contiene una película con las 27 presentaciones,
que son imágenes con parejas de círculos. En cada presentación, el círculo de la
izquierda es el de referencia que tendrá siempre el mismo brillo y, al lado, un
segundo círculo cuyo brillo hay estimar con respecto al de referencia. Entre cada
presentación se presenta una imagen de ruido blanco. El nivel de gris de las
imágenes está modificado para que al presentarlas con un sistema de proyección o
en un monitor no calibrados (no linealizados) los niveles de luminancia (niveles de
gris) sean los adecuados (7=2.3 y corrección realizada usando el procedimiento
descrito por Pelli & Zang (1991) ecuaciones (9) y (10)).
-Primero veréis dos imágenes como las mostradas [El experimentador presenta los
ficheros Practica3Mínimo. jpg y Practica3Máximo. jpg]. Aquí veis el estímulo de
referencia junto con el estímulo test con luminancia más débil y el estímulo de
referencia junto con el test más intenso.
-A continuación veréis una secuencia compuesta de veintisiete presentaciones, que

son imágenes compuestas por parejas de círculos. En todas las parejas, el círculo
de la izquierda será el de referencia que tendrá siempre el mismo brillo y, a la
derecha, un segundo círculo cuyo brillo tenéis que estimar con respecto al de
referencia.
-Vuestra tarea es registrar en el Cuadro 3.1 el número que según vuestra opinión
refleja mejor la relación entreel brillo de la imagen de referencia y la otra imagen
de cada pareja.
-Al brillo del círculo de referencia le asignaréis un valor de 100.
-Si consideráis que el segundo círculo de la pareja se ve con el doble de brillo

escribiréis 200, si se ve la mitad de brillante, 50,...
99
-No os preocupéis demasiado por la precisión, ni en intentar cálculos mentales
complicados, solo escribid la respuesta que os venga espontáneamente a la cabeza.
-Anotad la respuesta en la casilla correspondiente de las filas Br del Cuadro 3.1 de la

hoja de respuesta. Estáis todos preparados.
-Empezamos [El experimentador presenta el fichero PracticaExperimento. avil.
2.7. Estimación de los parámetros ay b de la ley de Stevens
Se sabe que:
Por tanto, tomando logaritmos decimales en ambos miembros,
Haciendo:
se obtiene:
que pone de manifiesto la relación lineal entre log Br y log L.Puesto que L (luminancia) y
Br (brillo estimado) son conocidos, A y B pueden estimarse ahora por procedimientos
elementales de regresión lineal. Haciendo:
se tiene que (Amón, 1978):
100
Recordando que,
se obtiene finalmente que:
En el ejemplo siguiente, en el Cuadro 3.1 aparece el brillo estimado en cada

presentación para una persona con visión normal (sujeto experimental) y en el Cuadro
3.2 el proceso del cálculo del valor de los parámetros de la ley de Stevens para la
estimación del brillo. En la Figura 3.4 se representan gráficamente en escala log-log los
resultados experimentales y la línea recta obtenida por regresión lineal entre los
logaritmos de la estimación del brillo y de la luminancia. En la Figura 3.5 se representan
los resultados en escala lineal-lineal, así como la curva de la función potencial de Stevens
que relaciona la luminancia (en unidades relativas) y la estimación del brillo.
3.1. Estimación de brillo. Resultados experimentales
En el Cuadro 3.1 aparece el brillo estimado (Br) por la persona ejemplo (sujeto
experimental) en cada presentación.
CUADRO 3.1.
Brillo estimado (Br) en cada presentación (n) por el sujeto experimental
3.2. Cálculo del valor de los parámetros de la ley de Stevens correspondiente al sujeto
experimental
En el Cuadro 3.2 aparece el proceso de cálculo del valor de los parámetros de la ley de
Stevens correspondiente al sujeto experimental.
101
CUADRO 3.2.
En el Cuadro 3.3 aparecen los valores de los parámetros de la ley de Stevens

correspondientes al sujeto experimental.
102
CUADRO 3.3.
Valores de los parámetros para el sujeto experimental
Por ello, la ley de Stevens para la percepción del brillo, en unidades subjetivas
arbitrarias, para el sujeto experimental es:
Br = 9.078Lo.506
Análisis:
El valor obtenido para el exponente a es algo distinto del valor estándar. Ello puede ser
debido a que los estímulos utilizados en la Práctica subtienden un ángulo visual diferente
al de los estímulos utilizados para obtener el valor estándar.
Los resultados de este experimento se muestran en las Figuras 3.4 y 3.5.
Función representada en la Figura 3.4:
La Figura 3.4 muestra en escala log-log el brillo en función de la luminancia relativa. La

línea recta (obtenida por regresión lineal) corresponde a la siguiente ecuación en escala
log-log:
con b=9.078, a=0.506. Puesto que la gráfica es una línea recta, para representarla basta
encontrar las coordenadas de dos puntos, por ejemplo para L=8, Br=26 y para L=248,
Br=147.76. [Por favor, trácese la recta en todo el gráfico. ¡No utilice como límites los
puntos que han servido para trazarla!].
103
Figura 3.4. Representación gráfica en escala log-log de los resultados experimentales
obtenidos y de la recta de regresión. El gráfico muestra la estimación del brillo (círculos)
en función de la luminancia relativa y la gráfica (línea recta) de la función que ajusta esos
datos obtenida por regresión lineal. Nótese que los datos de luminancia son niveles de
gris y no valores en cd/m2.
La Figura 3.5 muestra en escala lineal el brillo en función de la luminancia relativa. La

línea continua muestra la ley de Stevens para la percepción del brillo, en unidades
arbitrarias, para esa persona, es decir,
104
Figura 3.5. Representación gráfica en escala lineal de los resultados experimentales
obtenidos y de la ley potencial de Stevens para la percepción del brillo. El gráfico
muestra la estimación del brillo (círculos) en función de la luminancia relativa y la curva
correspondiente a la función potencial para el sujeto experimental que relaciona el brillo
con la luminancia relativa (b=9.078, a=0.506). Nótese que los datos de luminancia son
niveles de gris y no valores en cd/m2.
NOMBRE....................................................................................
105
corresponde).
RESULTADOS [3]
Estimación del brillo. Resultados experimentales [3.1]:
Brillo (Br) estimado en cada presentación (n) por el sujeto experimental
[CUADRO 3.1]
Cálculo del valor de los parámetros de la ley de Stevens correspondiente al sujeto

experimental [3.2]
Cálculo del valor de los parámetros de la ley de Stevens [CUADRO 3.2]
106
Valores de los parámetros para el sujeto experimental [CUADRO 3.3]
Por ello, la ley de Stevens para la percepción del brillo, en unidades subjetivas arbitrarias,
para el sujeto experimental es:
107
Análisis:
Representación gráfica de los resultados experimentales [3.3]
108
Representación gráfica en escala log-log de los resultados experimentales obtenidos y de
la recta de regresión. El gráfico muestra la estimación del brillo (círculos) en función de la
luminancia relativa y la gráfica (línea recta) de la función que ajusta esos datos obtenida
por regresión lineal. Nótese que los datos de luminancia son niveles de gris y no valores
en cd/m2. [FIGURA 3.4]
109
Representación gráfica en escala lineal de los resultados experimentales obtenidos y de la
ley potencial de Stevens para la percepción del brillo. El gráfico muestra la estimación del
110
brillo (círculos) en función de la luminancia relativa y la curva correspondiente a la
función potencial para el sujeto experimental que relaciona el brillo con la luminancia
relativa (b=.........., a=..........). Nótese que los datos de luminancia son niveles de gris y
no valores en cd/m2. [FIGURA 3.5]
111
112
1. Introducción
1.1. Índices de la sensibilidad (/discriminabilidad) y del criterio y predicciones de la

Teoría de la Detección de la Señal (TDSS)
La Teoría de la Detección de la Señal (TDS) (Green & Swets, 1974; Laming, 1973;
Peterson, Birdsall & Fox, 1954; Swets, 1961; Tanner & Swets, 1954; véase Jáñez
(1992) para una exposición en castellano de la TDS) como teoría del comportamiento de
una persona en una tarea de detección distingue la sensibilidad de la persona o
discriminabilidad de la señal (d) del criterio o sesgo de respuesta (un índice del cual es /3)
y establece que (Swets, Tanner y Birdsall, 1961):
1.El criterio o sesgo de respuesta de la persona depende de las probabilidades a priori

de aparición de la señal y del ruido (P(s), P(n)), de las consecuencias de la
decisión (expresadas en la matriz de consecuencias, MC) y de las instrucciones.
2.Para una sensibilidad dada, la detectabilidad (o discriminabilidad) de la señal

depende solo de las características físicas de la señal y del ruido y, en particular,
de la razón entre la energía de la señal y la densidad de potencia del ruido (lo que
comúnmente se denomina razón señal/ruido o SNR, Signal-to-Noise Ratio).
Fijadas unas características físicas de la señal, la discriminabilidad de la señal
depende de la sensibilidad del sensor.
113
El modelo TDS N-N con varianzas iguales supone específicamente que las
distribuciones de los efectos sensoriales de la señal+ruido y del ruido son normales con
varianzas iguales.
Por lo tanto:
a)Si en una tarea sensorial de detección una persona se comporta de acuerdo con la
TDS N-N, al mantener fija la SNR, variando o las probabilidades a priori o la
matriz de consecuencias o las instrucciones, el índice de sensibilidad de la persona
se mantendrá constante, la persona variará su criterio y los resultados
experimentales se ajustarán a una curva teórica reglada, la curva de isosensibilidad
o curva ROC (cuya forma depende del supuesto gaussiano para los efectos
sensoriales del ruido y de la señal inserta en ruido, parametrizada por la distancia
d' entre las medias de las respectivas distribuciones).
b)Si en una tarea sensorial de detección una persona se comporta de acuerdo con la
TDS N-N, al variar solo la SNR, manteniendo fijas las probabilidades a priori, la
matriz de consecuencias y las instrucciones, variará la detectabilidad o
discriminabilidad de la señal, la persona mantendrá fijo su criterio y los resultados
se ajustarán a una curva teórica reglada, la curva de isocriterio (cuya forma
depende del supuesto gaussiano para las distribuciones de los efectos sensoriales
del ruido y de la señal inserta en ruido, parametrizada por el criterio ¡3).
El objetivo general de esta Práctica es comprobar experimentalmente si el

comportamiento de las personas en tareas de detección se ajusta al modelo de TDS NN
con varianzas iguales. Los objetivos particulares son:
1.Obtener y representar gráficamente resultados de experimentos de detección de una

persona (sujeto experimental). Calcular los parámetros e índices correspondientes
al sujeto experimental.
2.Decidir si en la tarea de detección se verifica la teoría de TDS N-N con varianzas

iguales.
3.Representar gráficamente la(s) curva(s) de isosensibilidad teórica(s) (o curva(s)

ROC) y la(s) curva(s) de isocriterio teórica(s) correspondiente al sujeto
experimental.
114
4.Representar gráficamente la sensibilidad y el criterio del sujeto experimental.
La Práctica consta de dos Partes: en la Parte 1 se pone a prueba la constancia del

índice de sensibilidad y la variación del criterio cuando se mantiene constante SNR y se
varían las probabilidades a priori; en la Parte II se pone a prueba la constancia del criterio
cuando se mantienen constantes las variables que le afectan y la variación de la
discriminabilidad de la señal con la variación de SNR. [¡Atención!: En TDS, sensibilidad
(o discriminabilidad) y criterio son dos parámetros independientes. El que en esta
Práctica se encuentre que uno de los parámetros se mantiene constante mientras que el
otro varía es debido a las respectivas condiciones experimentales de las Partes 1 y II].
PARTE I
Efecto de la variación de las probabilidades a priori de aparición de la señal sobre el

criterio de la persona
2. Método
2.1. Estímulos
Se utilizan dos tipos de estímulos: Estímulo 1 que es ruido solo (Figura 4.la) y Estímulo 2
que se compone de la señal inserta en ruido (Figura 4.1b). El ruido acústico es ruido
blanco Gaussiano (véase Método de la Práctica 2) dentro del rango 1-22050 Hz, y la
señal es un tono puro de 1000 Hz. La frecuencia de muestreo utilizada para generar los
estímulos fue de 44100 Hz. La duración de los estímulos es de 1.6 segundos y se
presentan utilizando una ventana temporal Butterworth de orden 30 (González y Wintz,
1977). Ambos sonidos son originales y han sido generados utilizando MATLAB.
115
Figura 4.1. Realizaciones de los estímulos utilizados en los experimentos. a. Estímulo 1,
ruido blanco Gaussiano de un segundo de duración. El panel de la izquierda representa el
estímulo en función del tiempo o dominio temporal y el panel de la derecha representa su
espectro de amplitud. En el histograma se representa la distribución de intensidades de la
señal. Nótese la forma aproximada de función Gaussiana. b. Estímulo 2, señal+ruido,
tono puro de 1000 Hz inserto en ruido gaussiano. El panel de la izquierda muestra el
estímulo en el dominio temporal. Nótese que, para hacer evidente la forma sinusoidal de
la señal, solo se representa un trozo de 10 milisegundos de duración. El panel de la
derecha muestra en escala log-lineal el espectro ideal de la señal inserta en el ruido.
Se utiliza el Paradigma SINO. La tarea consiste en detectar un tono puro inserto en

ruido. En cada ensayo primero se oye una voz que indica el número del ensayo, a
continuación se presenta o el ruido solo o la señal inserta en ruido, después la persona
emite la respuesta: SI, si percibe la señal, NO, si no percibe la señal. La secuencia
temporal de un ensayo aparece en la Figura 4.2.
116
Figura 4.2. Secuencia temporal de cada ensayo. El estímulo es presentado
temporalmente dentro de una ventana de Butterworth de orden 30.
En el Cuadro 4.1 aparecen las condiciones experimentales de la Parte 1 de la Práctica.

En esta Parte 1, se mantienen fijas SNR, MC e instrucciones (neutras) y se varían las
probabilidades a priori de aparición de la señal y del ruido, P(n), P(s). En la condición A,
P(s)=0.30, P(n)=0.70 y en B, P(s)=0.70, P(n)=0.30.
CUADRO 4.1.
Condiciones experimentales de la Parte I
2.4. Predicciones
Dadas las condiciones experimentales (Cuadro 4.1), las predicciones para esta Parte 1 de
la Práctica son las siguientes:
iii.Acerca del índice de sensibilidad de la persona. El índice para la sensibilidad en

TDS N-N es d'. Puesto que SNR permanece constante, TDS predice que el índice
de sensibilidad de la persona permanecerá constante en ambas condiciones y por
tanto que el valor de dA será igual o parecido al de dB.
iii.Acerca del criterio o sesgo de respuesta. Un índice para el criterio en TDS NN es
117
su razón de verosimilitud P.Puesto que P(s) varía de una condición a otra, TDS
predice que el criterio de la persona variará de la condición A a la B.En particular,
y puesto que PA(s)<PB(s), se predice que /3A > /3B.
ni.¿Ajuste al modelo de TDS N-N con varianzas iguales? El instrumento conceptual

para comprobar si los resultados se ajustan a al modelo NN con varianzas iguales
es la curva ROC teórica parametrizada por el valor correspondiente de d'. Por ello,
en esa tarea de detección, el comportamiento de la persona se ajusta a TDS
modelo N-N con varianzas iguales si y solo si los resultados experimentales están
en la misma curva de isosensibilidad parametrizada por el valor correspondiente de
d'.
2.5. Aparatos

de archivos mp3 y wav conectado a unos altavoces. Dado que es una tarea de
discriminación de la señal sobre fondo ruidoso, el volumen de los altavoces tiene que
ajustarse de tal manera que los estímulos (señal+ruido y ruido solo) sean audibles.
Aunque la razón señal-ruido es constante, no debe manipularse el volumen de los

estímulos a lo largo del experimento. Como se ha indicado en el apartado anterior, el
volumen tiene que ser suficiente para que los estímulos sean audibles.
Puesto que las Tablas de la curva normal suelen ofrecer las probabilidades con cuatro
cifras decimales, es conveniente que el alumno calcule P(S~s+n) y P(Sin) con cuatro
cifras decimales con el fin de que el cálculo de d' y 0 sea lo más exacto posible. Dada la
forma geométrica de la curva normal el uso de solo dos cifras decimales para las áreas
bajo ella origina errores de importancia.
En el directorio MATERIAL PRACTICA 4 se encuentran dos subdirectorios, PARTE 1 y

PARTE II. El subdirectorio PRACTIC4_PARTE 1 consta a su vez de los directorios
CONDICIÓN A P(s) 0.3 y CONDICIÓN B P(s) 0. 7 cada uno con el siguiente
contenido:
1.CONDICIONA P(s) 0.3: Contiene dos archivos de audio con extensión .wav y mp3
y un archivo de Excel con extensión xls.
118
a)Practica4 Instrucciones.wav. Archivo de audio en el que imparten las
instrucciones para la realización del experimento.
b) Practica4 P(s) 0.3 Archivo de audio que consta de los cien ensayos en los que
se presenta bien el ruido solo, bien la señal inserta en ruido.
c)Practica4_Ensayos en los que aparece la señal TDS P(s)0.3.xls. Archivo gráfico

en el que figuran los ensayos en los que aparece la señal (aparecen también
enumerados en el Cuadro 4.3 más adelante).
2.CONDICIÓNB P(s) 0.7: Contiene también dos archivos de audio con extensión
wav y mp3 y un archivo de Excel con extensión xls.
a)Instrucciones.wav. Archivo de audio en el que se imparten las instrucciones para

la realización del experimento.
b) Practica4 P(s) 0.7 Archivo de audio que consta de los cien ensayos en los que
se presenta bien el ruido solo, bien la señal inserta en ruido.
e)Practica4_Ensayos en los que aparece la señal TDS P(s) B.xls. Archivo gráfico
en el que figuran los ensayos en los que aparece señal (aparecen también
enumerados en el Cuadro 4.5 más adelante).
Las instrucciones que se imparten a los sujetos experimentales son las siguientes:
[Se reproduce el archivo de audio Practica4
-La tarea que van a realizar es muy sencilla. Consiste en detectar una señal como
esta..., inserta en un fondo de ruido como este....
-Van realizar cien ensayos donde unas veces se presentará el ruido solo... y otras
veces se presentará la señal inserta en ruido....
-La secuencia temporal de los ensayos será siempre la misma: cada ensayo se iniciará
con una voz que indica rásu número; a continuación se presentará el ruido solo o
la señal con el ruido; y por último se le pedirá que emita la respuesta.
-Por ejemplo un ensayo sería: ciento uno..., respuesta, o también, ciento dos
...,respuesta....
119
-El tipo de respuesta se les indicará a continuación.
[En este momento el experimentador indica el tipo de respuesta: liberal o laxa,

neutral, conservadora o estricta].
-Al tratarse de una tarea de detección, cualquier ruido la dificultará.
-Si tiene Vd. alguna duda pregunte al experimentador. - Vamos a empezar.
-Indicad la respuesta en el Cuadro 4.2 (condición A) o Cuadro 4.4. (condición B) de

la hoja de respuesta rodeando con un círculo la letra S (SI) si oye la señal, o la
letra N (No) si no oye la señal.
[Se reproducen los archivos de audio Practica4 P(s) 0.3.mp3 y Practica4 P(s)
0.7.mp3 informando verbalmente a los sujetos de la condición experimental a la
que cada uno corresponde].
2.9. Algoritmo para el cálculo de d 'y %I supuesto el modelo N-N con varianzas iguales
Para calcular d' y /3, se siguen los pasos siguientes:
1.Identificar P(S n)y P(S s + n).
2.Encontrar z„ tal 'que P(z'z zJ= P(sin) utilizando la tabla de la distribución normal.
(Recuérdese: z, es la puntuación típica del criterio en la distribución de los efectos
sensoriales producidos por la presentación repetida del ruido).
3.Encontrar zs tal que P(z z zs) = P(S s + n) utilizando la tabla de la distribución

normal. (Recuérdese: zs es la puntuación típica del criterio en la distribución de los
efectos sensoriales producidos por la presentación repetida de la señal inserta en
ruido).
4. Calcular d', que por definición es:
mediante la fórmula d'= z, - zs (Coombs, Dawes & Tversky, 1970; Egam, 1975
120
ecuación 3.13) obtenida, suponiendo distribuciones normales con varianzas
iguales. En efecto, sean:
Entonces, siendo cs = ci~, = a,
5. Calcular /3, que por definición (Jáñez, 1992) es:
mediante la fórmula:
obtenida suponiendo distribuciones normales con varianzas iguales; así:
121
(Recuérdese que xc es el criterio o sesgo de respuesta en el eje de los efectos
sensoriales, fi, la razón de verosimilitud del criterio y exp[x] = ex).

detección
En el Cuadro 4.2 aparecen los resultados experimentales correspondientes a la condición

A, así como la matriz de respuestas directas y la matriz de probabilidades condicionales.
En el Cuadro 4.3 se enumeran los ensayos en los que la señal está presente en esta
condición. En el Cuadro 4.4 aparecen los resultados correspondientes a la Condición B,
así como la matriz de respuestas directas y la matriz de probabilidades condicionales. En
el Cuadro 4.5 se enumeran los ensayos en los que la señal está presente.
En la Figura 4.3 se representan, en el diagrama de la curva ROC, los resultados

experimentales correspondientes a la persona del ejemplo. Como ROC C [0,1] x[0,1], el
diagrama se suele representar convencionalmente mediante un cuadrado para poner
énfasis en el hecho de que la curva ROC está acotada entre 0 y 1 en la abscisa y en la
ordenada.
3.2.1. Parte I.Condición A
CUADRO 4.2.
Parte I.Resultados experimentales en la condición A
122
123
CUADRO 4.3.
Condición A: Ensayos en los que aparece la señal inserta en ruido
3.2.2. Parte 1. Condición B
CUADRO 4.4.
Parte I.Resultados experimentales en la condición B
124
CUADRO 4.5.
125
Condición B: Ensayos en los que aparece la señal inserta en ruido
Figura 4.3. Representación gráfica de los resultados del experimento de la Parte 1. En el

diagrama de la curva ROC se ha representado (círculos negros) la probabilidad de
aciertos (o tasa de aciertos) versus la probabilidad de falsas alarmas (o tasa de falsas
alarmas) obtenidas en cada una de las dos condiciones (A y B) de la Parte 1.
3.2. Cálculo de los valores de d 'y f correspondientes al sujeto experimental en la Parte I
3.2.1. Parte I.Condición A
126
3.2.2. Parte I.Condición B
CUADRO 4.6.
Valores de los parámetros de TDS en la Parte I
iii. Acerca de la sensibilidad del sujeto experimental: Puesto que SNRA=SNRB, TDS
predice que la sensibilidad de la persona será igual o parecida en ambas
condiciones experimentales. Resulta que d'A (1.535) es aproximadamente igual a
d'B (1.523) por lo que la sensibilidad de la persona es la misma en ambos
127
experimentos y, por tanto, se cumple el modelo de TDS N-N con varianzas iguales
respecto de la sensibilidad.
ni. Acerca del criterio del sujeto experimental: Puesto que PA (s) <PB (s), TDS
predice que l3A será mayor que /3B. Sucede que, en efecto, PA (=2.2) es mayor
que NB (=0.691) por lo que en esta persona se cumple el modelo de TDS N-N
(varianzas iguales) respecto del criterio. En particular, el criterio de la persona es
más conservador en la condición A que en la B (alt./el criterio en la condición B es
más liberal que en la condición A).
ni. ¿Ajuste al modelo de TDS N-N con varianzas iguales? Dadas las condiciones
experimentales, TDS predice que los resultados experimentales estarán en la
misma curva ROC o de isosensibilidad teórica. La Figura 4.4 muestra que, en
efecto, los resultados experimentales están en la misma curva ROC teórica
parametrizada por el valor de d', por lo que el comportamiento de esta persona en
la tarea de detección se ajusta al modelo de TDS N-N con varianzas iguales.
3.4. Curva ROC teórica
En la Figura 4.4 aparece representada la curva ROC (o de isosensibilidad) teórica para la

persona del ejemplo, es decir, la curva que se obtendría si la persona con una
determinada sensibilidad, varía su criterio y se comporta de acuerdo con TDS. [La curva
ROC teórica ha sido obtenida mediante cálculo numérico suponiendo distribuciones
normales (con varianzas iguales) de los efectos sensoriales de la señal+ruido y el ruido y
el valor numérico de d' obtenido experimentalmente (d'= 1.53)].
128
Figura 4.4. Curva ROC teórica (línea roja más gruesa) correspondiente al sujeto
experimental. La curva está basada en el supuesto de distribuciones normales (con
varianzas iguales) de los efectos sensoriales del ruido y de la señal+ruido (o modelo de
TDS N-N con varianzas iguales). Los círculos negros (A, B) representan los resultados
experimentales (tasa de aciertos versus la tasa de falsas alarmas) de la Parte I.
3.5. Representación gráfica de la sensibilidad y del criterio o sesgo de respuesta del sujeto
experimental en cada una de las dos condiciones experimentales
3.5.1. Supuesto que el comportamiento de la persona en la tarea de detección se ajusta al

modelo de TDS N-N con varianzas iguales: dA - dB y /3A > /3B
En la Figura 4.5 se representan los criterios adoptados por la persona conforme las
probabilidades a priori de la aparición de la señal y el ruido varíen.
3.5.2. Supuesto que no se ajusta al modelo de TDS N-N con varianzas iguales
Si las d' tuvieran valores diferentes, represéntense en la Figura 4.6 las fdp
correspondientes a los efectos sensoriales de la señal, teniendo en cuenta para su
129
localización relativa los valores de d' obtenidos, suponiendo que dichas fdp son
Gaussianas. En la misma gráfica, represéntese el criterio obtenido en cada caso.
Figura 4.5. El comportamiento de la persona en la tarea de detección se ajusta al modelo

TDS N-N con varianzas iguales. Representaciones gráficas de la sensibilidad d' (bajo el
supuesto de que la media de los efectos sensoriales del ruido es igual a 0 y su varianza
igual a 1) como distancia entre las medias (indicadas por las líneas verticales
discontinuas) de las dos distribuciones y de los respectivos criterios o sesgos de respuesta
x, (líneas verticales continuas). Nótese que conforme la probabilidad de ocurrencia de la
señal aumenta (de 0.30 a 0.70 en el experimento), el criterio de la persona se desplaza
hacia la izquierda.
130
Figura 4.6. El comportamiento de la persona en la tarea de detección no se ajusta al
modelo TDS N-N con varianzas iguales. Representaciones gráficas de la sensibilidad d' y
de los respectivos criterios o sesgos de respuesta xx para cada una de las dos condiciones
experimentales (A y B) de la Parte I.
PARTE II:
Efecto de la variación de SNR sobre la discriminabilidad de la señal
En la mayoría de las exposiciones sobre la TDS se insiste sobre todo en la curva ROC y
131
en el cambio del criterio de decisión de la persona con la variación de una cualquiera de
las variables que influyen sobre él. Sin embargo, para los estudios en psicofisica
sensorial, es mucho más interesante comprobar si una persona mantiene constante su
criterio de decisión en experimentos acerca de la detectabilidad o discriminabilidad de la
señal (Egam, Schulmann & Greenberg, 1959). Nótese que en muchos experimentos de
psicofisica visual y auditiva, sobre todo en los que la tarea es la detección de una señal
enmascarada por ruido de una densidad de potencia No constante, lo que se determina es
el umbral para detectar la señal, relacionado con su energía y por tanto con d'.
4. Método
4.1. Estímulos
Se utilizan dos tipos de estímulos: Estímulo 1 que es ruido solo y Estímulo 2 que se
compone de la señal inserta en ruido.
Se utiliza el Paradigma SI/NO y la tarea es idéntica a la de la Parte 1. La secuencia

temporal de cada ensayo es también idéntica a la utilizada en la Parte I.
En esta Parte II, se mantienen constantes P(n)=0.5, P(s)=0.5, MC e instrucciones

(neutras) y se varía la SNR. Como medida de la potencia de cada estímulo se utilizó el
índice denominado Root Mean Squared (RMS), definido como el cociente de la
desviación típica de los valores de cada estímulo y su valor promedio.
El ruido solo tiene un RMS de 0.1484, la señal en las condiciones A, B y C:

RMSA=0.0094, RMSB=0.0075 y RMSc=0.006, respectivamente, es decir, con una
diferencia de 2 dB entre las señales. Por lo tanto, en la Condición A SNR=0.06; en la
Condición B, SNR=0.05; y en la Condición C, SNR=0.04.
4.4. Predicciones
Dadas las condiciones experimentales (Cuadro 4.7), las predicciones para esta Parte II de
la Práctica son las siguientes:
üi. Acerca de la detectabilidad o discriminabilidad de la señal. El índice para la

discriminabilidad en TDS N-N es d'. Puesto que SNR varía de A a C, TDS
predice que d' variará. En particular, puesto que SNRA>SNRB>SNRc entonces
132
dA>dB>dc, es decir, que la señal A será más discriminable que la señal B y ésta
más que la señal C.
ni. Acerca del criterio o sesgo de respuesta. Un índice para el criterio en TDS N-N es
P.Puesto que las todas las variables de las que depende P permanecen fijas en las
tres condiciones, TDS predice que el criterio de la persona se mantendrá constante
en las tres condiciones, es decir, /3A, is y fic serán iguales o muy parecidas.
ni. ¿Ajuste al modelo de TDS N-N con varianzas iguales? El instrumento conceptual
para comprobar que los resultados se ajustan al modelo N-N con varianzas iguales
es la curva de isocriterio teórica parametrizada por el valor correspondiente de
P.Por ello, en esa tarea de detección el comportamiento de la persona se ajusta a
TDS modelo N-N con varianzas iguales si y solo si los resultados experimentales
están en la misma curva de isocriterio parametrizada por el valor correspondiente
de P.
CUADRO 4.7.
Condiciones experimentales de la Parte II
4.5. Aparatos
Los mismos que en la Parte I.
En esta parte de la Práctica es fundamental mantener el mismo volumen de los estímulos

a lo largo del experimento, ya que la SNR cambia entre condiciones. Como se ha
indicado en la Parte 1, el volumen tiene que ser suficiente para que los estímulos sean
audibles.
En el directorio MATERIAL PRACTICA 4 se encuentran dos subdirectorios, PARTE 1

Y PARTE II. El subdirectorio PRACTICA4_PARTE II consta a su vez de los directorios
CONDICIÓN A P(s) 0.5, CONDICIÓN B P(s) 0.5, CONDI CIÓN C P(s) 0.5. Cada
133
uno contiene dos archivos de audio con extensión wav y .mp3 y un archivo de Excel con
extensión xls
1.CONDICION A P(s) 0.5:
a)Practica4_Instrucciones.wav. Archivo de audio en el que se imparten las

instrucciones para la realización del experimento.
b) Practica4 P(s) 0.5 Archivo de audio que consta de los cien ensayos de la
condición A en los que se presenta bien el ruido solo, bien la señal inserta en
ruido.
c)Practica4 Datos experimento A.xis. Archivo gráfico en el que se especifica el

RMS de la señal y del ruido, respectivamente, y se enumeran los ensayos en los
que aparece la señal en la condición A (aparecen también enumerados en el
Cuadro 4.11 más adelante).
2.CONDICIÓN B P(s) 0.5:
a) PracticaInstrucciones. wav
b) Practica4 P(s)0.5 Ensayos de la condición B.
e)Practica4 Datos experimento B.xis. Archivo gráfico en el que se especifica el

que aparece la señal en la condición B (aparecen también enumerados en el
3.CONDICIÓN C P(s) 0.5:
a) PracticaInstrucciones.wav
b) Practica4 P(s) C.mp3. Ensayos de la condición C.
e)Practica4 Datos experimento C.xls. Archivo gráfico en el que se especifica el

que aparece la señal en la condición C (aparecen también enumerados en el
Las mismas instrucciones que en la Parte 1, con el cambio lógico en el material que se
134
presenta.
5. Resultados. Ejemplo

detección
En los Cuadros 4.8, 4.9 y 4.10 aparecen los resultados experimentales de la Parte II,
Condiciones A, B y C así como la matriz de respuestas directas y la matriz de
probabilidades condicionales o matriz de resultados. En el Cuadro 4.11 se enumeran los
ensayos en los que aparece la señal inserta en ruido en cada una de las tres condiciones
A, B y C.En la Figura 4.7 se representan, en el diagrama de la curva ROC, los resultados
experimentales de la persona en cada condición.
5.1.1. Parte II. Condición A
CUADRO 4.8.
Parte II. Resultados experimentales en la condición A
135
5.1.2. Parte II. Condición B
CUADRO 4.9.
Parte II. Resultados experimentales en la condición B
136
5.1.3. Parte 11. Condición C
CUADRO 4.10.
Parte II. Resultados experimentales en la condición C
137
CUADRO 4.11.
Ensayos en los que aparece la señal inserta en ruido en cada una de las tres
condiciones A, By C
138
Figura 4.7. Representación gráfica de los resultados del experimento de la Parte H. En el
139
diagrama de la curva ROC se ha representado (círculos negros) la probabilidad de
aciertos (o tasa de aciertos) versus la probabilidad de falsas alarmas (o tasa de falsas
alarmas) obtenidas en cada una de las tres condiciones (A, B y CJ de la Parte H.
5.2. Cálculo de los valores de d'y/1 correspondientes al sujeto experimental en la Parte II
5.2.1. Parte II. Condición A
5.2.2. Parte II. Condición B
5.2.3. Parte II. Condición C
140
CUADRO 4.12.
Valores de los parámetros de TDS en la Parte II
ni. Acerca de la discriminabilidad de la señal. Puesto que SNRA<SNRB<SNRc TDs

predice que El resultado es que d.4>ds>de, por lo que en esta persona se cumple
el modelo de TDS N-N (con varianzas iguales) respecto de la discriminabilidad de
la señal. En particular, la señal A es efectivamente más discriminable que la B y
esta que la señal C.
iii. Acerca del criterio del sujeto experimental. Puesto que las todas las variables de las
que depende R permanecen fijas en las tres condiciones, TDS predice que el
criterio de la persona se mantendrá constante, es decir, PA, RB y (3c serán iguales
o muy parecidas. El resultado es que, en efecto, los valores de PA, RB, Rc son
parecidos, por lo que en esta persona se cumple el modelo de TDS N-N (con
varianzas iguales) respecto del criterio.
141
ni. ¿Ajuste al modelo de TDS N-N con varianzas iguales? Dadas las condiciones
experimentales, TDS predice que los resultados experimentales estarán en la
misma curva ROC o de isocriterio. En la Figura 4.8 se muestra que, en efecto, los
resultados experimentales están prácticamente en la misma curva de isocriterio
teórica parametrizada por el valor de R, por lo que el comportamiento de esa
persona en la tarea de detección se ajusta al modelo de TDS N-N (con varianzas
iguales).
5.4. Curva de isocriterio teórica
En la Figura 4.8 aparece representada (línea negra más gruesa) la curva de isocriterio
teórica para el sujeto experimental del ejemplo. [La curva de isocriterio teórica ha sido
obtenida mediante cálculo numérico suponiendo distribuciones normales (con varianzas
iguales) de los efectos sensoriales de la señal+ruido y del ruido y el valor numérico de
(3=1.33 obtenido experimentalmente].
Figura 4.8. Curva de isocriterio teórica (línea roja más gruesa) correspondiente al sujeto
experimental. [Figura original de Serrano-Pedraza & Sierra-Vázquez]. La curva está
basada en el supuesto de distribuciones normales (varianzas iguales) de los efectos
142
sensoriales del ruido y de la señal+ruido o modelo de TDS N-N con varianzas iguales.
Los círculos grises (A, B y C) representan los resultados experimentales (tasa de aciertos
versus tasa de falsas alarmas) de la Parte H.Las curvas grises son las curvas ROC o de
isosensibilidad.
5.5. Representación gráfica de la discriminabilidad de la señal y del criterio o sesgo de

respuesta del sujeto experimental en cada una de las tres condiciones
experimentales.
En la Figura 4.9 se representa la discriminabilidad de la señal en cada una de las

condiciones conforme la SNR varía. Además se indica con una línea gris el criterio (casi
constante) adoptado por el sujeto experimental.
Parte II. Condición A:
Parte II. Condición B:
Parte II. Condición C:
143
Figura 4.9. Representaciones gráficas de la discriminabilidad d'y del criterio x, para cada
una de las tres condiciones experimentales (A, B y C) utilizadas en la Parte H.
NOMBRE.....................................................................................
corresponde).
PARTE 1: Efecto de la variación de las probabilidades a priori de aparición de la señal

sobre el criterio de la persona.
RESULTADOS [3]
Obtención y representación gráfica de los resultados de los experimentos de detección

[3.1]
Resultados experimentales en la condición A
[CUADRO 4.2]
144
Resultados experimentales en la condición B
[CUADRO 4.3]
145
Parte 1, Condición A:
Matriz de respuestas directas
146
Matriz de probabilidades condicionales o Matriz de resultados
Parte I, Condición 8:
Matriz de probabilidades condicionales o
Matriz de resultados
147
Representación gráfica de los resultados del experimento de la Parte I.En el diagrama de
la curva ROC se ha representado (círculos negros) la probabilidad de aciertos versus la
probabilidad de falsas alarmas obtenidas en cada una de las dos condiciones (Ay B) de la
Parte I. [FIGURA 4.3]
Cálculo de los valores de d' y 8 correspondientes al sujeto experimental en la Parte 1

[3.2]
Parte 1. Condición A [3.2.1]
148
Parte 1. Condición [3.2.2]
Valores de los parámetros de TDS para la Parte I
[CUADRO 4.6]
Verificación del modelo N-N con varianzas iguales [3.3]
(i) Acerca de la sensibilidad del sujeto experimental:
149
(ü) Acerca del criterio del sujeto experimental:
(üi) ¿Ajuste al modelo N-N con varianzas iguales?
Curva ROC teórica en coordenadas lineales [3.4]
En la Figura 4.4 se representa(n) la(s) curva(s) ROC (o de isosensibilidad) teórica(s)

correspondientes al sujeto experimental.
150
Curva(s) ROC teórica(s) (línea(s) negra(s) más gruesa(s)) correspondiente(s) al sujeto
experimental. La(s) curva(s) están basada(s) en el supuesto de distribuciones normales
(con varianzas iguales) de los efectos sensoriales del ruido y de la señal+ruido (o modelo
N-N con varianzas iguales). Los círculos negros (A y B) representan los resultados
experimentales (tasa de aciertos versus la tasa de falsas alarmas) de la Parte I. [FIGURA
4.4]
Representación gráfica de la sensibilidad y el criterio del sujeto experimental cada una de

las dos condiciones experimentales [3.5]
Supuesto que se ajusta al modelo de TDS N-N: da = d, y /3, > 13, [3.5.1]
151
El comportamiento de la persona en la tarea de detección se ajusta al modelo de TDS N-
N con varianzas iguales. Representaciones gráficas de la sensibilidad d' y de los
respectivos criterios o sesgos de respuesta xx. [FIGURA 4.5]
Supuesto que no se ajusta al modelo de TDS N-N [3.5.2]
Si las d' tuvieran valores diferentes, represéntense en la Figura 4.6 las fdp
correspondientes a los efectos sensoriales de la señal, teniendo en cuenta para su
localización relativa los valores de d' obtenidos, suponiendo que dichas fdp son
Gaussianas. En la misma gráfica, represéntese el criterio obtenido en cada caso.
152
El comportamiento de la persona en la tarea de detección no se ajusta al modelo TDS N-
N con varianzas iguales. Representaciones gráficas de la sensibilidad d' y de los
respectivos criterios o sesgos de respuesta xx para cada una de las dos condiciones
experimentales (A y B) de la Parte I. [FIGURA 4.6]
PARTE II: Efecto de la variación de la SNR sobre la discriminabilidad de la señal.
RESULTADOS [5]
Obtención y representación gráfica de los resultados de los experimentos de detección.

[5.1]
Parte II. Resultados experimentales en la condición A
[CUADRO 4.8]
153
Parte II. Resultados experimentales en la condición B
[CUADRO 4.9]
154
Parte III. Resultados experimentales en la condición C
[CUADRO 4.10]
155
Parte II, Condición A:
156
Parte II, Condición B: Matriz de respuestas directas
Parte II, Condición C.
157
Representación gráfica de los resultados del experimento de la Parte H.En el diagrama de
158
la curva ROC se ha representado (círculos negros) la probabilidad de aciertos versus la
probabilidad de falsas alarmas obtenidas en cada una de las tres condiciones (A, B y C)
de la Parte H. [FIGURA 4.7]
Cálculo de los valores de d' y 8 correspondientes al sujeto experimental en la Parte II.

[5.2]
Parte II. Condición A. [5.2.1]
Parte H.Condición B. [5.2.2]
Parte H.Condición C [5.2.3]
159
Valores de los parámetros de TDS para la Parte II
[CUADRO 4.12]
Verificación del modelo N-N con varianzas iguales [5.3]
(i) Acerca de la sensibilidad del sujeto experimental:
(ü) Acerca del criterio del sujeto experimental:
160
(üi) ¿Ajuste al modelo N-N con varianzas iguales?
Curva de isocriterio teórica [5.4]
En la Figura 4.8 se representan la (s) curva (s) de isocriterio teórica para el sujeto
experimental.
161
Curva(s) de isocriterio (línea(s) negra(s) más gruesa(s)) correspondiente(s) al sujeto
experimental [Figura original de Serrano-Pedraza & Sierra-Vázquez]. La(s) curva(s)
está(n) basada(s) en el supuesto de distribuciones normales (con varianzas iguales) de los
efectos sensoriales del ruido y de la señal+ruido o modelo N-N con varianzas iguales.
Los círculos negros (A, B y C) representan los resultados experimentales (tasa de
aciertos versus la tasa de falsas alarmas) de la Parte H.Las curvas grises son la curvas
ROC o de isosensibilidad. [FIGURA 4.81
Representación gráfica de la discriminabilidad de la señal y del criterio o sesgo de

respuesta del sujeto experimental en cada una de las condiciones experimentales
162
[5.5]
En la Figura 4.9 se representa la discriminabilidad de la señal en cada una de las

condiciones conforme la SNR varía.
Condición A:
Condición B:
Condición C:
163
Representaciones gráficas de los respectivos índices de discriminabilidad d' y criterios o
sesgos de respuesta xx para cada una de las tres condiciones experimentales (A, B y CJ
de la Parte H. [FIGURA 4.9]
164
165
1. Introducción
1.1. La Curva de Audibilidad (CA) humana
La función o curva de audibilidad (CA) expresa el umbral de audibilidad de cada tono

puro en función de la frecuencia temporal del tono. En particular, la CA humana típica
representa el nivel de presión sonora (en dB SPL) de cada tono puro (de larga duración
(>200 ms), que se propaga en condiciones de campo libre y en ausencia de cualquier otro
sonido) necesario para ser detectado por una población de sujetos adultos jóvenes (18-25
años) y audiológicamente normales (Cuadro 5.1 y Figura 5.1). [Véase una introducción a
la percepción del volumen sonoro o sonoridad en López-Bascuas (1999b)]. La CA se
obtiene mediante métodos numéricos de ajuste de una función a los umbrales de
audibilidad obtenidos experimentalmente para un rango amplio de frecuencias espaciales
Como es natural, la CA de una persona es una medida de su capacidad auditiva; por

ello, si se padece algún déficit auditivo, ese déficit se reflejará en la CA y se pone de
manifiesto mediante una gráfica derivada llamada audiograma. El audiograma representa
la diferencia de la CA de la persona respecto de la CA típica de un normoyente y expresa
el nivel auditivo (Hearing Level, HL), definido como la elevación del umbral de la
persona, en dBHL, respecto del umbral normal, en función de la frecuencia temporal del
tono puro.
CUADRO 5.1.
Umbrales de Audibilidad en campo libre (MAF) y con auriculares (MAP)
166
167
Figura 5.1. Curva de audibilidad (línea negra continua), en escala log-log, típica de una
persona adulta con audición normal que es el estándar internacional ISO R/226 (1961)
(MAF). Está basada en la determinación experimental de los umbrales de audibilidad
(cuadrados negros) de 51 personas entre 18 y 25 años (Robinson y Dadson, 1956). Los
círculos son los datos experimentales de Berger (1981) y la línea discontinua es la curva
teórica que ajusta esos datos. [Scharf, B. & Buus, S. (1986). Audition 1: Stimulus,
Physiology, Thresholds. En K.R.Boff, Kaufman, L. & Thomas. J. P. (eds.) Handbook
of Perception and Human Performance. Vol 1. Sensory Processes and Perception. N. Y.:
Wiley & Sons, 1986. Figura 14.23].
La CA típica del ser humano es análoga en su forma, aunque no en el rango de tonos

audibles ni en otros parámetros, a las respectivas CAs de otras especies animales (Figura
5.2).
1.Determinar los umbrales de audibilidad para tonos puros de diferente frecuencia

temporal.
2.Representar gráficamente el umbral de audibilidad en función de la frecuencia

temporal del tono.
168
3.Determinar la propia CA.
4.Comparar los umbrales de audibilidad obtenidos con los umbrales de audibilidad

estándar (ISO 1961 (MAF), ANSI, 2004).
5.Representar el audiograma.
Figura 5.2. Curvas de audibilidad, en escala log-log, de algunas especies animales. Las
curvas están basadas en datos de Heffner, 1983; Heffner y Heffner, 1980, 1985; Heffner
y Masterton, 1980. [Goldstein, 1999, Figura 12.13].
2. Método
El sujeto realizará un experimento auditivo de detección de tonos puros que varían en su

frecuencia temporal.
2.1. Estímulos
Se utilizarán ocho tonos puros con frecuencias temporales de 125, 250, 500, 1000, 2000,
4000, 8000 y 12000 Hz respectivamente. Cada tono puro tiene una duración de 400 ms
y serán presentados dentro de una ventana temporal en forma de función de Butterworth
de orden 30 (González y Wintz, 1977) (véase Figura 5.3), cada uno con amplitud
variable según se describe en el apartado siguiente. Los sonidos son originales y han sido
169
generados utilizando MATLAB.
Figura 5.3. Ejemplo de un tono puro de 125 Hz ventaneado temporalmente con una
función de Butterworth de orden 30.
2.2. Procedimiento
El método que se utilizará para la obtención experimental de los umbrales de audibilidad

es el método de los límites con escalas o series descendentes con una tarea SINO.
Aunque son conocidas las limitaciones del método con esta tarea (por ejemplo, la falta de
control del criterio de respuesta del observador) se utilizará porque permite una
aproximación rápida al valor del umbral y nos posibilita su aplicación a un grupo
numeroso de personas.
Para la determinación del umbral de audibilidad del tono, cada uno de los ocho tono
puros se presentará en tres escalas descendentes de 15 pasos o presentaciones cada una,
disminuyendo 5 dB SPL la amplitud del tono en cada paso con relación al anterior. Cada
presentación tiene una duración de 400 ms con intervalos de silencio de 500 ms entre
pasos (véase la Figura 5.4).
2.3. Aparatos
170
de archivos wav conectado a unos altavoces. Puesto que es una tarea de detección de
tonos puros, el volumen de los altavoces tiene que ajustarse antes del experimento. Véase
el procedimiento de calibración en el apartado 2.5. Instrucciones para el experimentador.
2.4. Tarea
La persona tiene que contar los pasos que oye para cada frecuencia temporal.
Figura 5.4. Ejemplo de las cinco primeras presentaciones de una escala descendente para
un tono puro de 125 Hz.
Para calibrar los aparatos de audio utilizados en esta Práctica el método óptimo es utilizar
un sonómetro. Ahora bien, si se carece de instrumentos de calibración en lo que sigue se
describe un método de calibración aproximado utilizando un tono puro de 4000 Hz (que
se encuentra en el archivo de audio del material audiovisual etiquetado como tono de
referencia ]Os.wav). Este tono se presentará durante 10 segundos. El experimentador
debe reproducir este sonido a la vez que pregunta a los sujetos experimentales si lo
perciben. En la primera presentación el tono puro tiene que ser perfectamente audible. Si
la respuesta es afirmativa, el experimentador reducirá el volumen del sistema de
reproducción hasta que la mayoría de los sujetos indiquen que el tono puro no es
perceptible. El tono puro de 4000 Hz es el que mejor se percibe en campo libre (ver
Tabla 1 columna ISO 1961), es decir, es el que menor presión sonora necesita para ser
171
justamente audible.
Esta calibración permite determinar el umbral para todos los tonos puros. Sin ella
podría ocurrir que algunos tonos puros se detectasen sin problemas en los quince pasos
(véase punto 2.2. Procedimiento). Esta calibración es útil también para normalizar la
escala. Supuesto que el sujeto tiene audición normal, se puede asignar el valor de 0 dB al
último paso que detecte para 4000 Hz y el resto de pasos se incrementará de 5 en 5 dB.
No obstante, en el peor de los casos, el único efecto de esta calibración sobre la curva de
audibilidad es que esta tendrá una forma parecida a la forma estándar, pero desplazada
hacia arriba o hacia abajo. [Véase la nota de cautela acerca de esta Práctica al final del
apartado 3.5]
En el directorio MATERIAL PRACTICA 5 se encuentran dos subdirectorios

PRACTICAS_EXPERIMENTO y PRACTICAS_TONOS PUROS con el siguiente
contenido:
1.PRACTICAS_EXPERIMENTO. Contiene dos archivos de audio con extensión.

wav:
a)Practicas tono de referencia 10s.wav. Archivo de audio con un tono de 4000 Hz

y 10 segundos de duración. Se utiliza para calibrar el sistema de reproducción.
b) Practica5155dB.wav. Archivo de audio con los ocho tonos puros utilizados

como estímulos, presentados cada uno en una serie de quince pasos o
presentaciones con nivel de presión sonora decreciente. Por lo tanto, si se
utiliza este archivo hay que presentarlo tres veces indicando a los sujetos la
frecuencia temporal del tono presentado en cada serie.
2. PRACTICASTONOS PUROS. Contiene ocho archivos de audio cada uno con la

serie correspondiente a cada tono:
a)125 15pasos
b)25015pasos
e)500
d)100015
172
e)2000
J)400015 pasos_5dB.wav
g)8000 15pasos
h)1200015pasos
Con estos archivos el experimentador puede disponer el orden de las series a su

elección, teniendo en cuenta que cada archivo (serie) ha de ser presentado tres
veces.
En cualquier caso, se ha de informar a los sujetos de la frecuencia temporal del

tono que está siendo presentado con el fin de que puedan recoger los datos en la
columna correspondiente del Cuadro 5.2.
-Ahora escucharéis un tono al que voy a bajar el volumen hasta que apenas lo oigáis.
[Se reproduce el archivo Tono de referencia 400010s.wav].
Acontinuación escucharéis secuencias compuestas por quince presentaciones o pasos

de tonos de diferentes frecuencias que van disminuyendo de volumen en cada
paso.
Para cada tono de una determinada frecuencia temporal hay tres secuencias de quince
pasos cada una.
-En cada secuencia vuestra tarea consistirá en contar los pasos que oís de cada tono e
indicarlo con una cruz en la casilla correspondiente del Cuadro 5.2 de la hoja de
respuestas.
-¿Estáis todos preparados?
-Empezamos. [Se reproduce tres veces el archivo Experiement15steps5dB.wav o

alternativamente se reproducen de modo ordenado o al azar los archivos del
directorio PRACTICAS_TONOS PUROS. En cada caso siempre hay que
informar verbalmente a los sujetos de la frecuencia temporal del tono que se está
presentando].
173
3.1. Determinación de umbrales de audibilidad para tonos puros de diferente frecuencia

temporal
En el Cuadro 5.2 aparecen los resultados del experimento de detección para la persona
del ejemplo (sujeto experimental) y se calculan los umbrales de audibilidad para cada
tono puro.
Nótese que en la primera columna se ha otorgado el cero de la escala de dB al paso

12 de la serie 2 del tono puro de 4000 Hz porque es la respuesta con el punto de
transición (PT) menor (resultado experimental indicado con el símbolo #). Después se ha
rellenado esa columna en pasos de 5 en 5 dB (tanto positivos como negativos). En las
casillas de las filas inferiores del Cuadro 5.2 se han indicado los puntos de transición
(PT) para cada serie (1, 2, 3) de cada tono y los umbrales de audibilidad obtenidos
(UAo). El punto de transición para cada columna (serie o secuencia descendente) se
obtiene tomando la media de los valores, en dB, de la última presentación que es
detectada y la siguiente que no es detectada. El umbral de audibilidad obtenido para cada
frecuencia temporal se obtiene calculando la media aritmética de los tres puntos de
transición.
CUADRO 5.2.
Resultados experimentales y cálculo del umbral de audibilidad para cada tono puro
174
3.2. Representación gráfica del umbral de audibilidad de cada tono en función de su
frecuencia temporal
El umbral de audibilidad para cada tono puro en función de su frecuencia temporal se ha

representado mediante los círculos negros en la Figura 5.5.
3.3. Determinación de la Curva de Audibilidad Humana
La Curva de Audibilidad (estimación aproximada) para la persona del ejemplo se

representa mediante la línea poligonal de la Figura 5.5.
Figura 5.5. Umbrales de audibilidad (círculos negros) binaural de los tonos puros en
función de la frecuencia temporal del tono para el sujeto experimental. La línea poligonal
que une los círculos que representan los umbrales obtenidos experimentalmente es una
aproximación de la CA de esa persona.
3.4. Comparación con los umbrales de audibilidad estándar (ISO 1961 y ANSI 2004)
CUADRO 5.3.
Comparación con los umbrales de audibilidad estándar
175
Análisis:
La CA obtenida es parecida en su forma a la CA estándar. Las desviaciones con respecto

a los valores estándar pueden ser debidas a las condiciones de presentación de los tonos
puros. Nótese, no obstante, que los valores en dB han sido asignados siguiendo el
procedimiento descrito en § 2.5 y no pueden ser comparados directamente con los
valores estándar.
3.5. Representación del audiograma
El audiograma representa el nivel auditivo para cada tono puro en función de la

frecuencia temporal del tono. El nivel auditivo para cada frecuencia temporal es la
diferencia en dB entre el umbral absoluto, en dB SPL, obtenido experimentalmente por
la persona para un tono de esa frecuencia temporal y el umbral absoluto, en dB SPL,
normal (estándar) para el tono de la misma frecuencia. Es decir:
Nivel auditivo (v) dB HL= Umbral obtenido (v) dB SPL (Uo)-Umbral estándar (v)
dB SPL(Ue)
En el Cuadro 5.4 se calcula el nivel auditivo del sujeto experimental para cada tono
puro suponiendo que los valores en dB obtenidos experimentalmente para los UA son
reales y no fruto del procedimiento de asignación utilizado. Un nivel auditivo positivo
significa que el umbral obtenido es mayor que el normal (pérdida auditiva) y un nivel
auditivo negativo, que es menor (ganancia auditiva). Por ello en la representación gráfica
utilizada, para indicar que un nivel auditivo positivo corresponde a una pérdida de
audición, los valores positivos se representan en la parte negativa del eje de ordenadas
(Figura 5.6).
CUADRO 5.4.
Cálculo del nivel auditivo
176
Figura 5.6. Audiograma (línea poligonal) correspondiente al sujeto experimental. El nivel
auditivo para cada tono (círculos negros) se representa en función de la frecuencia
temporal del tono. Nótese que para indicar que un nivel auditivo positivo corresponde a
una pérdida de audición, en la representación gráfica los valores positivos se representan
en la parte negativa del eje de ordenadas.
Análisis:
Lo habitual es que en adultos jóvenes con audición normal el audiograma sea

aproximadamente una línea po-ligonal casi recta paralela próxima a la línea base o
coincidente con ella, como es el caso, es decir que los niveles auditivos sean nulos o casi
nulos y apro-ximadamente iguales para todas las frecuencias temporales. Pequeñas
177
desviaciones de los valores estándar no son importantes ya que en los sujetos con
audición normal son debidas a variaciones estadísticas o al sistema de calibración
utilizado y no a un posible déficit auditivo.
[Nota importante: La medida de la capacidad auditiva se realiza para cada oído por
separado y no binaural, como se ha realizado en esta Práctica. Además, la audio-metría
tonal liminar realizada por audiometristas y otorrinos está calibrada respecto a otra
referencia. En esta Práctica se obtiene una estimación no calibrada de la pro-pia CA y los
resultados del audiograma no son válidos como medida de la función auditiva, que debe
de ser llevada a cabo por el profesional adecuado. Sin embargo, las características físicas
de los sonidos (incluido el modo de su presentación temporal) generados adhoc para ser
utilizados en esta Práctica están tan controladas como las de los sonidos utilizados de
modo estándar en la medida de la función auditiva por los profesionales antes citados].
NOMBRE.......................................................................................
corresponde).
RESULTADOS [3]
Determinación de umbrales de audibilidad para tonos puros de diferente frecuencia

temporal [3.1]
Resultados experimentales y umbral de audibilidad para cada tono puro
[CUADRO 5.2]
178
En la primera columna otórguese el cero de la escala de dB al paso de la serie del tono
puro de 4000 Hz con el punto de transición (PT) menor. Después, rellénese esa columna
en pasos de 5 en 5 dB (tanto positivos como negativos).
Representación gráfica del umbral de audibilidad de cada tono en función de su

frecuencia temporal [3.1] y
Determinación de la Curva de Audibilidad Humana [3.2]
179
Umbrales de audibilidad (círculos negros) en función de la frecuencia temporal de los
tonos puros para el sujeto experimental. La línea poligonal que une los círculos que
representan los umbrales obtenidos experimentalmente es una aproximación de la CA de
esa persona. [FIGURA 5.5]
Comparación con las Curvas de Audibilidad estándar (ISO 1961; ANSI 2004) [3.4]
Comparación con los umbrales de audibilidad estándar
[CUADRO 5.3]
Análisis:
180
Representación del audiograma [3.5]
Nivel auditivo (v) = Umbral obtenido (v) (Uo) - Umbral estándar (v) (Ue)
Cálculo del nivel auditivo
[CUADRO 5.4]
181
Aud¡ogramo (línea polígono¡) correspondiente al sujeto experimental. El nivel auditivo de
cada tono (círculos negros) se representa en función de la frecuencia temporal del tono.
Nótese que para indicar que un nivel auditivo positivo es una pérdida de audición, en la
representación gráfica los valores positivos se representan en la parte negativa del eje de
ordenadas. [FIGURA 5.6]
Análisis:
[Nota importante: La medida de la capacidad auditiva se realiza para cada oído por
separado y no binaural, como se ha realizado en esta Práctica. Además, la audiometría
tonal liminar realizada por audiometristas y otorrinos está calibrada respecto a otra
referencia. En esta Práctica se obtiene una estimación no calibrada de la propia CA y los
182
resultados no son válidos como medida de la función auditiva, que debe de ser llevada a
cabo por el profesional adecuado. Sin embargo, las características físicas de los sonidos
(incluido el modo de su presentación temporal) generados adhoc para ser utilizados en
esta Práctica están tan controladas como las de los sonidos utilizados de modo estándar
en la medida de la función auditiva por los profesionales antes citados].
183
184
1. Introducción
1.1. Concepto de banda crítica
En 1940 Harvey Fletcher sugirió, siguiendo a Helmholtz (1863), que el sistema auditivo
humano periférico consiste en un banco de filtros lineales, paso-banda, cuyas funciones
de transferencia de modulación (FTM) se solapan entre sí, suponiendo que la membrana
basilar es la base biológica de tales filtros. Fletcher también demostró mediante métodos
psicofísicos la existencia de esos filtros auditivos.
En efecto, Fletcher (1940) realizó un experimento de enmascaramiento auditivo en el

que midió el umbral de audibilidad para tonos puros de diferentes frecuencias temporales
en función de la anchura de banda en frecuencia temporal (o anchura espectral) de un
ruido paso-banda máscara. Cada tono puro fue presentado en presencia de ruido paso-
banda con densidad de potencia constante, centrado en la frecuencia temporal del tono
puro, pero variando la anchura espectral del ruido (de modo que la potencia del ruido
aumenta cuando aumenta su anchura de banda). Los resultados de este experimento, en
razones críticas, aparecen en la Figura 6.lA para diferentes tonos puros.
185
Figura 6.1. Demostración de la existencia de bandas críticas y determinación de su
anchura mediante enmascaramiento simultáneo con ruido paso-banda centrado en la
frecuencia temporal de la señal. A.Resultados de Fletcher (1940) para diferentes tonos
puros. La anchura de la banda está representada por la razón crítica (critical ratio).
B.Resultados de Schooneveldt & Moore (1989) (figura tomada de Moore (2003)).
Umbral de audibilidad de un tono puro de 2000 Hz en función de la anchura de banda
(en Hz) de un ruido máscara centrado en esa frecuencia temporal. Nótese que el umbral
del tono crece con el aumento de la anchura de banda del ruido hasta una determinada
186
anchura espectral (400 Hz aproximadamente) y luego se mantiene constante.
Los resultados muestran que los umbrales de audibilidad del tono puro aumentan con
la anchura de banda del ruido máscara hasta una "anchura de banda crítica" o punto de
transición; un incremento ulterior de la anchura de banda del ruido no afecta al umbral de
audibilidad del tono, que se mantiene constante; es decir, aunque la potencia del ruido
sigue aumentando, su poder enmascarador se mantiene constante. Véase más claramente
este resultado en la Figura 6.1B, en la que se muestran los umbrales de audibilidad de un
tono puro de 2000 Hz enmascarado por ruido (centrado en esa frecuencia temporal) en
función de la anchura espectral del ruido máscara (Schooneveldt y Moore, 1989).
Fletcher introdujo el concepto de banda crítica para denominar la banda limitada de

frecuencias temporales en un ruido de banda ancha que afecta a la audibilidad de una
señal dada (tono puro en el centro de esa banda), fuera de la cual los componentes
espectrales del ruido no tienen efecto enmascarados sobre la señal. Nótese que en la
concepción de Fletcher, por tratarse de una banda de frecuencias del ruido máscara, la
banda crítica, aunque es fijada por la persona, pertenece al dominio del estímulo. Para
explicar esos resultados experimentales, Fletcher (1940) supuso: (i) que existe una
especie de filtro interno paso-banda relativamente estrecho centrado en la frecuencia
temporal de la señal; (ü) que el enmascaramiento del tono puro está determinado
solamente por los componentes espectrales del ruido cuyas frecuencias temporales están
próximas a la frecuencia del tono, es decir, que se encuentran dentro de la banda del
filtro interno centrado en esa frecuencia temporal; y (iii) que la potencia del tono puro en
el umbral de audibilidad es directamente proporcional a la potencia del ruido que pasa a
través de la banda del filtro o banda crítica (Patterson and Moore, 1986).
De los supuestos de Fletcher se concluye que para cualquier frecuencia temporal

dada, la banda crítica del ruido en tomo a esa frecuencia es una estimación indirecta de la
anchura de banda del filtro auditivo paso-banda centrado en esa frecuencia temporal y,
por tanto, asumiendo una particular forma del filtro auditivo, el valor de la banda crítica
en tomo a un tono puro sería una estimación de la anchura de banda del filtro centrado
en ese tono. En efecto, solo los componentes espectrales del ruido que pasan por la
banda del filtro son críticos para enmascarar un tono puro de esa frecuencia; por lo tanto,
si enmascaran es porque están pasando por el filtro; una ulterior ampliación de la banda
del ruido hace que haya componentes que estén ya fuera de la banda del filtro y que, por
lo tanto, no tengan efecto sobre la señal. Por tanto, la anchura espectral del ruido paso-
banda que marca el punto de transición en los resultados experimentales o ancho de
banda crítico es una estimación razonable de la anchura de la banda efectiva del filtro
auditivo correspondiente.
187
Nótese que en la literatura sobre audición el término banda crítica se utiliza
indistintamente por lo menos con tres significados diferentes: como la banda espectral del
ruido estímulo que enmascara efectivamente la señal (y fuera de la cual, otros
componentes espectrales del ruido no tienen efecto sobre la señal), como la banda
espectral del filtro centrado en la frecuencia de la señal (es la definición popular en
Wikipedia http://en.wikipedia.org/wiki/Critical_band) y como el filtro auditivo
correspondiente.
El paradigma experimental dominante para el estudio de las características de esos

filtros auditivos es el paradigma de enmascaramiento basado en la existencia de bandas
críticas o modelo del espectro de potencia (power spectrum model of masking) (Moore,
1993, 2003; Patterson y Moore, 1986) que se expone a continuación.
1.2. Paradigma de enmascaramiento de un tono puro por ruido basado en la existencia de

bandas críticas o modelo del espectro de potencia para el enmascaramiento auditivo
(Moore, 1993, 2003, 2008; Patterson, 1976; véase la revisión de Patterson y
Moore, 1986).
[El lector que quiera obviar los detalles matemáticos puede prescindir de este apartado y
del siguiente y continuar en §1.4 dedicado a las predicciones experimentales].
Postulados (adaptados de Moore, 1993, p. 57-58; 2008, p. 947):
iii.Postulado 1: El sistema auditivo humano periférico se compone de un conjunto de

filtros lineales paso-banda (filtros auditivos) con FTM solapadas y anchuras de
banda efectivas iguales a la anchura de la respectiva banda crítica.
üi.Postulado 2: Se supone que para detectar un tono puro (señal) inserto en ruido
acústico (máscara), el oyente usa un único filtro auditivo centrado en la frecuencia
de la señal o en una frecuencia temporal próxima a la frecuencia de la señal.
iii.Postulado 3: Solo los componentes espectrales del ruido que pasan por el filtro de
detección (es decir, aquellos que por su frecuencia temporal caen dentro del ancho
de banda crítico) son efectivos para enmascarar al tono puro. Por lo tanto, la
potencia del ruido que pase fuera del filtro no tendrá efecto enmascarador.
iv.Postulado 4: La potencia de la señal en el umbral P, o umbral de audibilidad, es

determinada por la potencia del ruido que pasa a través del filtro auditivo
implicado en la detección. En particular, se supone que la potencia de la señal en el
umbral de audibilidad enmascarada por ruido, P, corresponde a una cierta razón
188
señal/ruido constante, K, a la salida del filtro.
Nótese que los estímulos son representados por el correspondiente espectro de

potencia, por lo que se supone que las fases relativas de los componentes o las
fluctuaciones de corta duración en la máscara no afectan significativamente a la
detección.
Ninguno de los postulados es estrictamente cierto ya que: a) los filtros auditivos,

aunque son bastante lineales (Hawkins y Stevens, 1959), no lo son estrictamente; b) los
oyentes pueden combinar la información de más de un filtro; y c) la detección de la señal
puede ser afectada por ruido fuera de la banda del filtro y por fluctuaciones en la
máscara. Sin embargo, tomados en conjunto, esos postulados proporcionan un modelo
teórico muy potente para la predicción e interpretación de resultados experimentales.
Supuestos adicionales: El Postulado 2 no especifica el filtro que detecta el tono puro.

Existen al menos dos modos de detectar la señal:
1.Modelo 1. La persona usa siempre la salida del filtro centrado en la frecuencia de la

señal.
2.Modelo 2. La persona usa la salida del filtro auditivo que maximiza la razón entre la
energía de la señal y la potencia del ruido a la salida del filtro.
En la deducción de las predicciones experimentales se utilizará el Modelo 1 (pasando

por alto el efecto de detección del tono puro por otro filtro que el sintonizado a su
frecuencia nominal o fenómeno de off-frequency listening). Esa decisión no se realiza
solo por simplicidad. En efecto, asumiendo que los filtros auditivos se comportan de
modo lineal, y dado que se utilizará ruido paso-banda centrado en la frecuencia temporal
de la señal, es posible demostrar que el filtro auditivo que maximiza la razón señal-ruido
es siempre el que está centrado en la frecuencia temporal de la señal (Serrano-Pedraza &
Sierra-Vázquez, 2006a, 2006b, Serrano-Pedraza, Sierra-Vázquez, & Derrington, 2013).
Por lo tanto, la banda crítica estimada pertenecerá precisamente al filtro centrado en la
frecuencia temporal del tono puro utilizado como señal.
Consecuencia: La potencia en el umbral de audibilidad del tono enmascarado por

ruido paso-banda, Ps, es directamente proporcional a la potencia del ruido que pasa por
el filtro auditivo.
Demostración:
189
En efecto, sean: v, la frecuencia temporal, en Hz; v., frecuencia temporal del tono
puro utilizado como señal; P, potencia en el umbral de audibilidad del tono puro de
frecuencia vo enmascarado por el ruido, la variable dependiente, fijada por la persona;
H(v,vo), la Función de Transferencia (FT) del filtro auditivo centrado en la frecuencia
temporal Yo que procesa el tono; la Función de Transferencia de Modulación (FTM) del
filtro auditivo; p(v), la función de densidad de potencia del ruido, fijada de antemano por
el experimentador.
Para simplificar la deducción y puesto que no se conocen de antemano las

características del ruido máscara, vamos a suponer que el filtro que media en la detección
de la señal (Postulados 1 y 2) es precisamente el filtro centrado en la frecuencia temporal
de la señal (Modelo 1). Puesto que el filtro auditivo es un filtro lineal (Postulado 1), la
potencia de salida Po„,,,,, de un tono vo de potencia P por el filtro es:
La potencia del ruido que pasa por el filtro es:
Entonces (por el Postulado 4) en el umbral de audibilidad del tono, P,, sucede que:
Supuesto que IH(vo;vo)1 sea igual a 1 (es decir que las FTM de los filtros estén
normalizadas a la unidad), entonces:
Así pues, la potencia en el umbral de la señal inserta en ruido es una medida indirecta
del área de solapamiento entre el ruido y el filtro auditivo, por lo que conocido de
antemano el espectro de amplitud del ruido se podría obtener la anchura y la forma de la
FTM del filtro auditivo. (La determinación de la forma del filtro auditivo no se realizará
en esta Práctica).
La fórmula general de la ecuación (1) sirve para cualquier tipo de ruido de los
190
utilizados en los experimentos de enmascaramiento: de banda ancha, paso-bajo, paso-
alto, paso-banda, ruido horadado o con muesca espectral. [Véase en LópezBascuas
(1999) la lógica del cálculo de la anchura de la banda crítica usando ruido de banda
ancha como máscara]. Manipulando el espectro del ruido máscara y midiendo los
cambios en P, es posible encontrar la forma de la FTM del filtro auditivo Hl y, por tanto,
estimar la anchura de la banda crítica. Nótese que, en principio, la ecuación (1) implica
que cuanta más potencia del ruido máscara pase por el filtro, mayor será el umbral de
audibilidad, P, necesario para detectar el tono puro usado como señal (Serrano-Pedraza
& Sierra-Vázquez, 2006; SerranoPedraza, Sierra-Vázquez, & Derrington, 2013). Si el
filtro auditivo es o no pasobanda es algo a determinar empíricamente.
El objetivo de la Práctica es medir experimentalmente la anchura de la banda crítica,

B, para dos frecuencias temporales e indirectamente estimar la anchura de banda efectiva
de la función IH(vvo) que caracteriza a cada filtro auditivo centrado en el tono puro
usado como señal. Para ello, se variará la anchura espectral de un ruido paso-banda
centrado precisamente en la frecuencia temporal del tono puro. En lo que sigue, se
justifica formalmente el procedimiento empírico utilizado en el experimento de Fletcher
para estimar la anchura de la banda crítica.
1.3. Predicción de resultados del experimento de Prácticas y justificación del

procedimiento de estimación de la anchura de la banda crítica, B
En el experimento que sigue, como en el de Fletcher (1940), la anchura espectral del

ruido o banda espectral, Av, en Hz, es la variable independiente y P, el um bral de
audibilidad del tono de frecuencia vo, es la variable dependiente; la función de densidad
espectral del ruido paso-banda, p(v;v., Av) es constante e idénticamente igual a No dB
SPL dentro de la banda espectral Av que varía simétricamente en torno de la frecuencia
temporal vo, del tono, es decir:
En general, por la ecuación (1):
En el experimento de Fletcher (y en el de esta Práctica), como el ruido es pasobanda

y está centrado en la frecuencia temporal del tono, se tiene que:
191
de donde:
Pero:
es el área bajo la FTM al cuadrado desde vo-Av/2 a vo+Av/2, es decir, el área, que
llamaremos A, del filtro auditivo centrado en vo para la anchura de banda del ruido, Av:
Así pues, el umbral de audibilidad, P, de un tono de frecuencia vo enmascarado por

ruido en función de la anchura de banda del ruido, Av, centrado en vo, será:
Supongamos a priori que el filtro auditivo sea un filtro paso-banda. Sea B, en Hz, la
anchura de la banda crítica o anchura del filtro auditivo, por ahora desconocida. Por el
Postulado 3 existen dos situaciones:
iii.Que la anchura de banda del ruido sea menor que la anchura de la banda del filtro,
es decir, Av < B.Entonces, nos remitimos a la consecuencia y P aumenta con la
anchura de banda del ruido, Ay.
iii.Que la anchura de banda del ruido sea mayor o igual que la banda del filtro, es
decir Av a B.Entonces, el ruido fuera del filtro no afecta al umbral de audibilidad y
PS permanecerá relativamente constante aunque la anchura de banda del ruido,
Av, aumente.
Por tanto, el umbral de audibilidad en presencia de ruido paso-banda obedecerá a la

siguiente ecuación general:
192
donde P (Av;vo), en dB SPL, variable dependiente, es la medida del umbral de
audibilidad del tono puro de frecuencia temporal vo, enmascarado por ruido, en función
de la anchura de banda del ruido máscara, Av. K, constante de proporcionalidad; Av, en
Hz, anchura de banda del ruido, variable independiente; No, en dB SPL, densidad de
potencia del ruido máscara; A(Av;v0), área desde vo-Av/2 a vo+Av/2 bajo la FTM (al
cuadrado) del filtro centrado en vo ; B, en Hz, anchura de la banda crítica o estimación
de anchura efectiva del filtro auditivo.
1.4. Predicciones experimentales
En consecuencia, con ruido paso-banda máscara centrado en la frecuencia temporal del

tono, si el filtro auditivo implicado en la detección del tono (señal) es un filtro paso-banda
centrado en su frecuencia temporal, entonces el umbral de audibilidad del tono
enmascarado por ruido deberá ajustarse a una función monótona creciente de la anchura
de banda del ruido máscara, seguida de una función constante o de crecimiento
asintótico. El punto de transición en el que la potencia del tono puro en el umbral de
audibilidad, P, pasa de crecer con la anchura de banda del ruido, 4v,. a estabilizarse (ser
constante o tener un crecimiento asintótico), a pesar de que la anchura de banda del
ruido aumente, es la anchura de la banda crítica, B, o estimación de la anchura de banda
efectiva del filtro auditivo centrado en la frecuencia temporal del tono utilizado como
señal.
Como es natural, la forma de la función creciente dependerá de la forma supuesta

para la FTM del filtro auditivo. La Figura 6.2 ilustra gráficamente el razonamiento
matemático anterior, suponiendo, como lo hizo Fletcher, que la FTM del filtro auditivo
implicado en la detección del tono puro es una función rectangular centrada en su
frecuencia temporal.
193
Figura 6.2. Estimación de la anchura de la banda crítica a partir de los umbrales de
audibilidad de un tono puro enmascarado con ruido paso-banda. En este ejemplo se ha
supuesto, como se atribuye que supuso Fletcher (1940), que la FTM del filtro auditivo es
una función rectangular centrada en la frecuencia temporal del tono puro. En este caso la
función está centrada en 500 Hz y con una banda crítica de 78.67 Hz (que se desconoce
de antemano y que se trata de encontrar experimentalmente). Los cuatro paneles
superiores muestran la FTM (al cuadrado) del filtro (rectángulo con línea negra), el
espectro de amplitud del ruido paso-banda máscara (rectángulo en gris) con diferentes
anchuras (25, 50, 100 y 200 Hz) y el espectro de amplitud del tono puro (función delta
de Dirac representada mediante una flecha situada en la frecuencia temporal del tono
puro). El panel de la parte inferior muestra los resultados experimentales predichos
mediante el modelo del espectro de potencia para el enmascaramiento descrito en el
texto; la flecha dirigida hacia la abscisa indica el valor numérico de la anchura de la banda
crítica. [Nota: Aunque la idea está extensamente difundida en la literatura sobre audición,
parece ser que en ninguna publicación el propio Fletcher supuso que la FTM de los filtros
auditivos fuese una función rectangular (Allen, 1996, p. 1837), pero la adopción de esa
194
forma para la FTM facilita la comprensión del procedimiento].
1.5. Anchura de la banda crítica en función de la frecuencia central
Existen dos tipos de estimación de la banda crítica, BM y Bc (anchura de banda

rectangular equivalente en Hz), que corresponden a los resultados experimentales
obtenidos por Zwicker en Múnich (M) y por Moore y otros en Cambridge (C),
respectivamente. Las funciones que relacionan la anchura de la banda con la frecuencia
temporal son:
siendo v la frecuencia temporal en Hz.
En la Figura 6.3, en línea continua, aparecen las gráficas de la anchura de la banda

crítica, en Hz, en función de la frecuencia central de la banda, en kHz, para las
estimaciones de Múnich (Bu) y de Cambridge (Be).
195
Figura 6.3. Anchura de la banda crítica (medida en anchura de banda rectangular
equivalente, en Hz) en función de la frecuencia temporal del tono puro de acuerdo con
las fórmulas (4) y (5) del texto obtenidas, respectivamente, en Múnich, 8M y en
Cambridge, B, La línea discontinua muestra la anchura de banda de un tercio de octava
centrada en la respectiva frecuencia. [Figura adaptada de Hartmann (1998) (Figura
10.9)].
El objetivo general de esta Práctica es replicar, siquiera cualitativamente, el experimento

de Fletcher (1940) y determinar experimentalmente (de modo aproximado) la anchura de
las bandas críticas centradas en 500 Hz y en 2000 Hz. Los objetivos específicos de esta
Práctica son:
1.Determinar experimentalmente los umbrales de audibilidad de tonos puros

enmascarados por ruido, en función de la anchura de banda de ruido.
2.Representar los resultados experimentales y determinar de las anchuras de la banda

crítica centrada en esas frecuencias temporales.
3.Comparar esas estimaciones con las estimaciones estándar de Munich y Cambridge.
2. Método
El sujeto realizará dos experimentos de enmascaramiento auditivo; en cada uno de ellos

se presentan la señal y la máscara de modo simultáneo. La señal siempre será un tono
puro y la máscara, ruido paso-banda con diferente anchura de banda pero centrado
siempre en la frecuencia temporal del respectivo tono puro.
2.1. Estímulos
Salvo el tono puro aislado, cada estímulo se compone del tono puro inserto en un ruido
máscara (véase Figura 6.4, estímulo auditivo). Las características respectivas de la señal
y de las máscaras son: señal: tonos puros de 500 y 2000 Hz; cada tono puro tendrá una
duración de 400 ms y será presentado dentro de una ventana temporal de Butterworth de
orden 30; máscaras: ruido paso-banda centrado en 500 y en 2000 Hz con nueve
anchuras de banda diferentes. Para el ruido centrado en 500 Hz las anchuras de banda
del ruido son: 25, 50, 75, 100, 150, 200, 300, 400 y 500 Hz. Para el ruido centrado en
2000 Hz las anchuras de banda del ruido son: 50, 100, 200, 250, 300, 400, 600, 800, y
1600 Hz. Todos los ruidos tendrán el mismo nivel (densidad de potencia), por lo que
196
cuanto mayor sea la anchura de banda del ruido, mayor será su potencia.
En la Figura 6.4 se representan las funciones de onda y los respectivos espectros de

amplitud de una de las señales (tono puro de 500Hz), de uno de los ruidos paso-banda
(centrado en 500 Hz y anchura de banda de 500 Hz) y de uno de los estímulos usado en
el experimento (compuesto por la señal y el ruido mencionados).
Figura 6.4. Funciones de onda (primera fila) y espectros de amplitud (segunda fila) de un
tono puro de 500 Hz aislado, de ruido paso-banda centrado en 500 Hz y anchura de
banda de 500 Hz y de uno de los estímulos utilizados, combinación del tono puro y del
ruido. Los valores de la amplitud representada en el dominio de Fourier son relativos y su
objetivo es meramente didáctico. Nótese que la duración real de los estímulos es de 400
msec.
2.2. Procedimiento
Para la determinación de los umbrales auditivos se utilizará el método de los límites con
escalas o series descendentes con una tarea SÍ/NO. Aunque son conocidas las
limitaciones del método con esta tarea (por ejemplo, la falta de control del criterio de
respuesta del observador), se utilizará este método porque permite una aproximación
rápida al valor del umbral. Se determinará el umbral auditivo de la señal en ausencia y en
presencia de ruido máscara. Para la determinación del umbral auditivo de cada tono puro
se presentará en tres escalas descendentes de 15 pasos cada una, disminuyendo 5 dB con
relación al anterior con intervalos de silencio de 500 ms entre pasos (ver Figura 6.5A).
Para la determinación del umbral auditivo de cada tono puro en presencia del ruido
197
máscara se procederá del mismo modo, solo que el ruido aparecerá continuamente (ver
Figura 6.5B), es decir tanto en los intervalos en los que aparece la señal como en los
periodos de silencio.
Figura 6.5. A.Ejemplo de las cinco primeras presentaciones de una escala descendente
para un tono puro de 500 Hz sin enmascarar. B.Ejemplo de las cinco primeras
presentaciones del tono puro de 500 Hz junto con el ruido máscara (ruido gaussiano)
filtrado paso-banda centrado en 500 Hz y con anchura de banda de 200 Hz.
2.3. Tarea
Para cada tono, el sujeto tiene que contar los pasos que oye del tono enmascarado por
cada tipo de ruido.
2.4. Aparatos

de archivos wav conectado a unos altavoces. Dado que es una tarea de detección de
198
tonos puros, el volumen de los altavoces tiene que ajustarse antes del experimento. Véase
el procedimiento de calibración en el apartado Instrucciones para el experimentador.
Para calibrar los aparatos de audio utilizados en la práctica se emplearán los tonos de 500
y 2000 Hz sin máscara. (Se recomienda calibrar los aparatos de audio utilizando el tono
de 2000 Hz y usar la calibración para ambos experimentos). Estos tonos se presentan en
quince presentaciones con niveles de presión sonora decreciente de 5 en 5 dB. El
experimentador debe reproducir este sonido a la vez que pregunta a los sujetos
experimentales cuántas presentaciones del tono pueden oír. Lo ideal es que la mayoría de
los sujetos oigan entre once y catorce presenta ciones. No hay que dejar que oigan todas
las presentaciones. Si a un determinado volumen sonoro se oyesen las quince
presentaciones, el experimentador ha de bajar el volumen del aparato reproductor hasta
que la mayoría de los sujetos indiquen que solamente se oyen entre once y catorce
presentaciones aproximadamente. El tono puro de 2000 Hz se percibe con más facilidad
que el de 500 Hz en campo abierto (ver Cuadro 5.1 columna ISO 1961 de la Práctica
relativa a la Curva de Audibilidad), por lo tanto si no se oyen las quince presentaciones
para 2000 Hz tampoco se oirán para 500 Hz.
Esta calibración también es útil para normalizar la escala. Si suponemos que el sujeto
tiene audición normal, entonces al último paso que detecte para 2000 Hz le podemos
asignar el valor de 0 dB y el resto de pasos incrementará de 5 en 5 dB. (Véase nota bajo
el cuadro 6.2). Ese mismo paso será también de 0 dB para el tono de 500 Hz. No
obstante, independientemente de los valores físicos reales de los umbrales, estos no
tendrán efecto sobre la estimación de la anchura de cada banda crítica.
En el directorio MATERIAL PRACTICA 6 se encuentran dos subdirectorios,

PRACTICA6_EXPERIMENTO 1 y PRACTICA6_EXPERIMENTO 2, con el siguiente
contenido:
1. PRACTICA6EXPERIMENTO 1. Contiene diez archivos de audio con la

extensión wav, cada uno con una serie de 15 presentaciones de un tono puro de
500 Hz con nivel de presión sonora decreciente en pasos de 5 dB, uno libre de
ruido y los demás con el tono inserto en ruido. Los nombres de los archivos son:
a)500_15steps_5dB .wav: tono puro de 500 Hz sin ruido máscara.
199
b)500 15Mask.wav: tono puro y ruido máscara de anchura de banda (Ay) igual a
25 Hz.
c)500 Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a 50
Hz.
d)500 1575Mask.wav: tono puro y ruido máscara de anchura de banda (Ay) igual a
75 Hz.
e)500 Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a 100
Hz.
j 9500150Mask.wav: tono puro y ruido máscara de anchura de banda (Ay) igual a

150 Hz.
g)500 Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a 200
Hz.
h)500_]5steps Mask.wav: tono puro y ruido máscara de anchura de banda (4v)

igual a 300 Hz.
i)50015steps NoMask.wav: tono puro y ruido máscara de anchura de banda (4v)

igual a 400 Hz.
j)500 NoMask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a
500 Hz.
2. PRACTICA6EXPERIMENTO 2. Contiene diez archivos de audio con la

extensión wav, cada uno con una serie de 15 presentaciones de un tono puro de
2000 Hz con nivel de presión sonora decreciente en pasos de 5 dB, uno libre de
ruido y los demás con el tono inserto en ruido. Los nombres de los archivos son:
a)2000 NoMask.wav: tono puro de 2000 Hz sin ruido máscara.
b)2000 Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a 50
Hz.
c)200_l5steps Mask.wav: tono puro y ruido máscara de anchura de banda (4v)

igual a 100 Hz.
d)2000 Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a
200
200 Hz.
e)2000 15Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a
250 Hz.
f )2000Mask.wav: tono puro y ruido máscara de anchura de banda (Av) igual a

300 Hz.
g)2000 15Mask.wav: tono puro y ruido máscara de anchura de banda (4v) igual a
400 Hz.
h)2000] Mask.wav: tono puro y ruido máscara de anchura de banda (Av) igual a
600 Hz.
i)500_l5steps NoMask.wav: tono puro y ruido máscara de anchura de banda (Av)

igual a 800 Hz.
j)2000 151600NoMask.wav: tono puro y ruido máscara de anchura de banda (Av)

igual a 1600 Hz.
Cada archivo sonoro de los Experimentos 1 y 2 se presentará tres veces. La

presentación puede realizarse de modo ordenado o aleatorio, informando en cualquier
caso a los sujetos de las características del ruido con el fin de que puedan recoger los
datos en la columna correspondiente de los Cuadros 6.1 y 6.2.
Las instrucciones que se impartirán a los sujetos experimentales son las siguientes:
-Ahora escucharéis un tono al que voy a bajar el volumen sonoro hasta que apenas lo
oigáis.
-Decidme los pasos que oís. [El experimentador presenta el archivo NoMask.wav y
fija el volumen sonoro de maveraque los sujetos oigan entre once y catorce
pasos].
-Primero vamos a utilizar un tono de 500 Hz.
-A continuación escucharéis secuencias compuestas por quince pasos o
201
presentaciones del tono de 500 Hz con diferentes ruidos. Notad que cada tres
secuencias el ruido es el mismo en todos los pasos, pero que el tono de 500 Hz va
disminuyendo de volumen en cada paso.
-Por tanto, para cada tipo de ruido hay tres secuencias de quince pasos o
presentaciones, cada una indicada en la Tabla de la hoja de respuestas.
Encada secuencia vuestra tarea consiste en contar los pasos o presentaciones que oís
del tono inserto en cada ruido e indicarlo con una cruz en la casilla
correspondiente del Cuadro 6.1 de la hoja de respuestas
¿Estáis todos preparados?
-Empezamos. [El experimentador reproduce los archivos de audio de

PRACTICA6_EXPERIMENTO 1 cuidando de presentar cada archivo tres veces.
En cada caso se irá indicando la anchura de banda del ruido para que los sujetos
anoten la respuesta en la columna correspondiente].
.................................................................................................
Ahora vamos a hacer lo mismo con un tono de 2000 Hz. [El experimentador
reproduce los archivos de audio de PRACTICA6_EXPERIMENTO2 cuidando de
presentar cada archivo tres veces. En cada caso se irá indicando la anchura de
banda del ruido para que los sujetos anoten la respuesta en la columna
correspondiente].
3.1. Umbrales de audibilidad de un tono puro enmascarado por ruido paso-banda.
En los Cuadros 6.1 y 6.2 aparecen los resultados experimentales de una persona ejemplo
(sujeto experimental), así como el cálculo de los umbrales de audibilidad en presencia de
ruido paso-banda máscara.
3.1.1. Resultados experimentales. Señal: tono puro de 500 Hz. Umbral NPE=6 dB SPL
(ISO, 1961)
CUADRO 6.1.
Ejemplo de resultados experimentales y cálculo de umbrales de audibilidad. Señal:

tono puro de 500 Hz
202
Anchura de banda del ruido máscara, Av (Hz)
En la primera columna el cero de la escala de dB se ha fijado en el paso 12 utilizando

los resultados del tono de 2000 Hz (véase 3.1.2 más adelante). Después se ha rellenado
esa columna en pasos de 5 en 5 dB (tanto positivos como negativos). En las casillas de
las filas inferiores del Cuadro 6.1 se han indicado los puntos de transición (PT) para cada
serie (1, 2, 3) de cada anchura de banda y los umbrales de detección (UD) o audibilidad.
El punto de transición para cada co lumna (serie o secuencia descendente) se obtiene
tomando la media de los valores, en dB, de la última presentación que es detectada y la
siguiente que no es detectada. El umbral de detección (UD) o audibilidad del tono puro
para cada anchura de banda del ruido máscara se calcula tomando el valor promedio
(media aritmética) de los puntos de transición (PT) de las tres series o secuencias.
3.1.2. Resultados experimentales. Señal: tono puro de 2000 Hz. Umbral NPE=1 dB SPL
(ISO, 1961)
CUADRO 6.2.
Ejemplo de resultados experimentales y cálculo de umbrales de audibilidad. Señal:

tono puro de 2000 Hz
203
Nótese que la respuesta indicada con el símbolo # ha servido para fijar el cero de la
escala de dB en ambos experimentos. Es decir, se ha otorgado el cero de la escala de dB
al paso 12 de la serie 2 de 0 Hz de anchura de banda, que es el que tiene el punto de
transición (PT) menor.
3.2. Representación gráfica de los resultados experimentales y determinación de la

anchura de la banda crítica
En las Figuras 6.6 y 6.7 se representan gráficamente los umbrales de audibilidad para los
tonos puros de 500 Hz y 2000 Hz respectivamente, en función de la anchura de banda
del ruido máscara, así como el procedimiento de estimación de la anchura de la banda
crítica.
3.2.1. Señal: tono puro de 500 Hz
204
Figura 6.6. Umbrales de audibilidad (círculos negros) para la persona del ejemplo de un
tono puro de 500 Hz en función de la anchura de banda en Hz de un ruido paso-banda
máscara centrado en la frecuencia temporal del tono. La banda crítica estimada a partir
de los datos experimentales es de 86 Hz aproximadamente.
La anchura de la banda crítica para el tono puro de 500 Hz estimada

experimentalmente (Figura 6.6) es:
205
Figura 6.7. Umbrales de audibilidad (círculos negros) para la persona del ejemplo de un
tono puro de 2000 Hz en función de la anchura de banda en Hz de un ruido paso-banda
máscara centrado en la frecuencia temporal del tono. La banda crítica estimada a partir
de los datos experimentales es de 270 Hz aproximadamente.

3.3. Comparación con las estimaciones estándar de Múnich y Cambridge

experimentalmente es de 86 Hz, mientras que la estimación de Múnich para esa
frecuencia temporal es:
y la de Cambridge es:
206
Análisis:
La anchura estimada de la banda crítica para 500 Hz es menor que la estimación de

Múnich y próxima a la estimación de Cambridge.

experimentalmente es de 270 Hz, mientras que la estimación de Múnich para esa
frecuencia temporal es:
y la estimación de Cambridge es:
Análisis:
La anchura estimada de la banda crítica para 2000 Hz se encuentra entre las

estimaciones de Múnich y Cambridge (menor que la estimación de Múnich y mayor que
la de Cambridge).
Para comparar con las estimaciones de Múnich y Cambridge, en la Figura 6.8 se

representan gráficamente las estimaciones de las anchuras de las bandas críticas
respectivas obtenidas experimentalmente. El círculo negro indica la anchura de la banda
crítica para el tono puro de 500 Hz; el cuadrado negro, la anchura de la banda crítica
para el tono puro de 2000 Hz.
207
Figura 6.8. Representación gráfica de las estimaciones de la anchura de las bandas
críticas obtenidas experimentalmente comparadas con las de Múnich y Cambrigde. El
círculo negro indica la anchura de la banda crítica estimada para el tono puro de 500 Hz;
el cuadrado negro, la anchura de la banda crítica estimada para el tono puro de 2000 Hz.
NOMBRE.......................................................................................
corresponde).
RESULTADOS [3]
Umbrales de audibilidad de un tono puro enmascarado por ruido [3.1]
Resultados experimentales. Señal: tono puro de 500 Hz. Umbral NPS=6 dB SPL (ISO,
1961) [3.1.1]
208
Resultados experimentales y cálculo de los umbrales de audibilidad. Señal: tono puro
de 500 Hz
[CUADRO 6.1]
El cero de la escala de dB se ha de fijar utilizando los resultados del tono de 2000 Hz

(véase 3.1.2 más adelante). El umbral de detección (UD) o audibilidad del tono puro para
cada anchura de banda del ruido máscara se calcula tomando el valor promedio (media
aritmética) de los puntos de transición (PT) de las tres series o secuencias.
Resultados experimentales. Señal: tono puro de 2000 Hz. Umbral NPS=1 dB SPL (ISO,
1961) [3.1.2]
Resultados experimentales y cálculo de los umbrales de audibilidad. Señal: tono puro

de 2000 Hz
[CUADRO 6.2]
209
Otórguese el cero de la escala de dB al paso de la serie de 0 Hz de anchura de banda
con el punto de transición (PT) menor.
Representación gráfica de los resultados experimentales y determinación de la anchura de

la banda crítica [3.2]
Señal: tono puro de 500 Hz [3.2.1]
210
Umbrales de detección (círculos negros) de un tono puro de 500 Hz en función de la
anchura de banda en Hz de un ruido paso-banda enmascarador centrado en la frecuencia
temporal del tono. La banda crítica estimada a partir de los datos experimentales es de
Hz aproximadamente. [FIGURA 6.6]

211
Umbrales de detección (círculos negros) de un tono puro de 2000 Hz en función de la
anchura de banda en Hz de un ruido paso-banda enmascarador centrado en la frecuencia
temporal del tono. La banda crítica estimada a partir de los datos experimentales es de
Hz aproximadamente. [FIGURA 6.7]

Comparación las estimaciones estándar de Múnich (M) y Cambridge (C) [3.3]

experimentalmente esHz, mientras que la estimación de Múnich para esa frecuencia
temporal es:
y la de Cambridge es:
212
Análisis:

experimentalmente esHz, mientras que la estimación de Múnich para esa frecuencia
temporal es:
y la estimación de Cambridge es:
Análisis:
Para comparar con las estimaciones de Múnich y Cambridge, en la Figura 6.8 se

representan gráficamente las estimaciones de las anchuras de las bandas críticas
respectivas obtenidas experimentalmente. El círculo negro indica la anchura de la banda
crítica para el tono de 500 Hz; el cuadrado negro, la anchura de la banda crítica para el
tono de 2000 Hz.
213
Representación gráfica de las estimaciones de la anchura de las bandas críticas obtenidas
experimentalmente comparadas con las de Múnich y Cambrigde. El círculo negro indica
la anchura de la banda crítica estimada para el tono puro de 500 Hz; el cuadrado negro,
la anchura de la banda crítica estimada para el tono puro de 2000 Hz. [FIGURA 6.8]
214
215
1. Introducción
1.1. Percepción de las vocales
Entender la percepción de las vocales supone comprender, entre otras cosas, cuáles son
las características físicas presentes en la señal acústica que permiten codificar
apropiadamente dichos segmentos lingüísticos. Desde un punto de vista articulatorio, las
vocales se pueden clasificar atendiendo a dos dimensiones principales: el lugar de
articulación (que nos indica si la lengua se sitúa en una posición más anterior o más
posterior al articular la vocal) y el modo de articulación (que nos indica si la lengua se
halla más lejos o más cerca de la bóveda de la cavidad bucal). Considerando estos
criterios, en español nos encontraríamos con los siguientes grupos (Quilis y Fernández,
1992):
1.Respecto al lugar de articulación
a)Vocales anteriores: si el predorso de la lengua se sitúa en la parte anterior de la

cavidad bucal.
b)Vocales centrales: si el dorso de la lengua se halla localizado en la región del

paladar medio.
c)Vocales posteriores: si el postdorso de la lengua se sitúa en la región posterior de

la cavidad bucal.
2.Respecto al modo de articulación
a)Vocales altas: si la lengua está tan próxima como sea posible al paladar duro o al
paladar blando, manteniendo el sonido producido por la cualidad vocálica.
b)Vocales medias: si la lengua se separa un poco más de la bóveda de la cavidad

bucal.
c)Vocales bajas: si la lengua se encuentra en máximo alejamiento con respecto a la

bóveda palatal.
En la Figura 7.1 se resume la clasificación de las vocales españolas utilizando

conjuntamente estos dos criterios de clasificación.
216
Figura 7.1. Clasificación articulatoria de las vocales españolas atendiendo al lugar
(abscisa) y al modo (ordenada) de articulación [Quilis y Fernández, (1992), Curso de
fonética y fonología españolas. Madrid: CSIC. FIG. 22].
La Teoría Acústica de la Producción del Habla (Fant, 1960) permite predecir cuál
será la apariencia acústica de las vocales descritas a partir de las configuraciones
articulatorias que se acaban de especificar. Más en concreto, la forma acústica que
adopta una vocal depende de la interacción de dos factores: el flujo de aire que proviene
de los pulmones (y que queda estructurado en la laringe al pasar por la glotis) y las
propiedades de transmisión del tracto vocal (determinadas por la forma particular que
este adopte). La caracterización del modelo suele hacerse en el dominio de la frecuencia
temporal por resultar más intuitivo desde un punto de vista psicológico. Por tanto, en
primer lugar hay que caracterizar el espectro de la forma de onda generada al pasar el
flujo de aire por la glotis, espectro que se representa en la parte superior izquierda de la
Figura 7.2.
217
Figura 7.2. Producción de las vocales de acuerdo con la teoría de la fuente y el filtro. La
producción de las vocales se ilustra en el dominio de la frecuencia temporal,
considerando que el tracto vocal se comporta como un filtro lineal para las diferentes
vocales. Para cada vocal, el espectro de amplitud del flujo de aire por la glotis (a la
izquierda) es modificado por la Función de Transferencia de Modulación (FTM) del filtro
del tracto vocal (en el centro) para producir el espectro de la vocal (a la derecha).
218
[Pickett (1998). The Acoustics of Speech Communication. Fundamentals, Speech
Perception Theory, and Technology. Boston: Allyn and Bacon. FIGURE 4-10. Adaptada
de Fant (1960)].
Las características de transmisión de la energía acústica por el tracto vocal dependen

de la longitud y de la forma que adopta el mismo. Para concretar esas características, es
habitual especificar aquellas frecuencias temporales que van a ser más eficazmente
transmitidas. Como se ha dicho, el tipo de frecuencias temporales que se potencien
dependerá de la cavidad acústica que configuren los articuladores. Distintas
configuraciones generan distintas resonancias o, en otras palabras, según la configuración
de la cavidad, diferentes frecuencias serán máximamente transmitidas. A estas
resonancias características del tracto vocal es a lo que denominamos formantes. En la
Figura 7.2 (en el centro) aparecen las resonancias asociadas a las configuraciones
articulatorias que posibilitan la producción de distintas vocales.
Suponiendo que el tracto vocal puede considerarse como un filtro lineal, las
características espectrales de las vocales pueden predecirse a partir de los espectros
representados en la parte izquierda y central de la Figura 7.2. En la parte derecha de la
misma figura aparece el resultado de procesar el espectro de la función de onda glótica,
con los distintos filtros lineales asociados a la posición articulatoria propia de las
diferentes vocales. Ese resultado es, por tanto, una representación en el dominio de la
frecuencia de dichas vocales. En una lengua como el español, es posible caracterizar
todas las vocales especificando únicamente los dos primeros formantes (F1 y F2)
asociados a cada una de ellas. Una manera útil de representar cada vocal es mediante una
carta de formantes en la que se representa F 1 en función de F2. Los valores de F1 y F2
para las vocales del español pueden inspeccionarse en la carta de formantes que aparece
en la Figura 7.3.
219
Figura 7.3. Carta de formantes para las vocales del español. Formante F1 (ordenada)
versus el formante F2 (abscisa). [Martínez Celdrán (1998). Análisis Espectrográfico de
los Sonidos del Habla. Barcelona: Ariel. FIG 3.1]. Nótese que la frecuencia temporal
disminuye de izquierda a derecha (F2) y de abajo a arriba (F1) para que la carta de
formantes sea isomórfica a la clasificación articulatoria de las vocales que aparece en la
Figura 7.1.
Este modelo, que convenientemente ha sido denominado de la fuente y el filtro, ha

servido de base para el desarrollo de sistemas artificiales de síntesis de voz, como el
propuesto por Klatt (1980). El sintetizador de Klatt es un sintetizador basado en
formantes cuya estructura permite organizar los filtros bien en cascada o bien en paralelo.
El modelo en cascada (o serial) sería el adecuado para la generación de vocales. Como
puede verse en la Figura 7.4 el sintetizador dispone de un generador de pulsos el cual,
junto con los controles RGZ, RGP y RGS - que actúan como filtros-, permite simular el
espectro de la forma de onda glótica. La frecuencia fundamental de la fuente se controla
mediante el parámetro FO y la amplitud de la misma se controla mediante el parámetro
AV (amplitud de la sonoridad). El siguiente paso es atravesar el conjunto de resonadores
configurados en cascada. RNP y RNZ tienen que ver con la generación del rasgo de
nasalidad y no son relevantes para nuestros propósitos. R1 a R5 son resonadores que
permiten incluir hasta 5 formantes en el espectro de salida. Para cada formante debe
especificarse su frecuencia y su anchura de banda. Los parámetros pueden actualizarse
cada varios milisegundos.
220
Figura 7.4. Diagrama de bloques del sintetizador de Klatt. [Klatt, D. H. (1980). Software
for a cascade/parallel formant synthesizer. Journal of the Acoustic Society of America,
67(3), 971-995. FIG. 61.
Los objetivos de esta Práctica son:
1.Especificar la relación que existe entre los parámetros articulatorios de la

producción de vocales y sus consecuencias acústicas.
2.Sintetizar, utilizando una implementación del sintetizador por formantes de Klatt, las
cinco vocales del español atendiendo a las consecuencias acústicas que tiene la
articulación diferencial de los distintos segmentos vocálicos.
3.Comprobar experimentalmente que los parámetros de síntesis usados generan

vocales perceptivamente compatibles con las categorías fonológicas del español.
4.Mostrar cuáles son los parámetros físicos que usa nuestro sistema perceptivo para
codificar las distintas vocales del idioma.
221
2. Método
2.1. Estímulos
Los estímulos que se utilizarán para comprobar experimentalmente qué parámetros de

síntesis generan vocales perceptivamente compatibles con las categorías fonológicas del
español (objetivo 3 de la Práctica), serán creados por los propios alumnos (objetivo 2 de
la Práctica). Para ello se utilizará la implementación del sintetizador de Klatt disponible
en:
http://www.asel.udel.edu/speech/ tutorials/synthesis/Klatt.html
(Alternativamente, pueden también usarse las facilidades de síntesis que proporciona

Praat, herramienta que puede ser descargada gratuitamente en
http://www.fon.hum.uva.nl/praat/).
La tarea es, por tanto, con la información disponible, generar los ficheros de síntesis
adecuados para las distintas vocales del español. Cada estímulo debe tener una duración
de 300 ms. En el Cuadro 7.1 aparece una lista de los parámetros proporcionados por el
sintetizador junto con su nombre y sus rangos (mínimo, máximo) y en el Cuadro 7.2 los
valores de los parámetros para generar las vocales sintéticas utilizadas en el experimento.
CUADRO 7.1.
Algunos de los parámetros utilizados por el sintetizador de Klatt (1980)
222
A continuación, aparecen los parámetros de síntesis que se utilizaron para generar los
estímulos usados en el experimento de reconocimiento de vocales. Se presentan de este
modo para que el alumno pueda con facilidad insertarlos en el sintetizador de Klatt.
Además se resumen en el Cuadro 7.2 para poder comparar las variaciones de los
parámetros (especialmente los valores de F1 y F2).
Parámetros de síntesis
CUADRO 7.2.
Valores de los parámetros para generar las vocales sintéticas utilizadas en el
223
experimento
224
Todos los estímulos tienen una duración de 300 ms y están normalizados en
intensidad (70 dB SPL).
En la síntesis de vocales, el manejo del interfaz de síntesis es relativamente sencillo y en

la dirección indicada pueden encontrarse ayudas para facilitar su uso. En cualquier caso,
se puede simplemente copiar y pegar los "scripts" proporcionados en la caja etiquetada
como "synthesis scripts", teniendo cuidado de marcar previamente en la caja anterior
aquellos parámetros que van a ser variados en dicho script. Tras ello, basta con que pulse
el botón "synthesize" para producir un fichero con la vocal sintetizada. Si el instructor
prefiere utilizar las herramientas proporcionadas por Praat, tan solo ha de acudir al Editor
de vocales y marcar la vocal deseada en el plano definido por F1 y F2. Este segundo
procedimiento es más simple pero menos instructivo.
En la comprobación experimental del efecto de los parámetros de síntesis existen dos

partes.
En una primera parte se presentará a los sujetos cada uno de los estímulos y se les
pedirá que los describan verbalmente. La idea es determinar si, de modo espontáneo, los
estímulos son percibidos como muestras de habla.
En la segunda parte se utilizará un paradigma de identificación simple. Se presentarán

al sujeto, en orden aleatorio, 10 repeticiones de cada uno de los cinco estímulos
sintetizados en el epígrafe anterior. La tarea del sujeto es identificar cada uno de los
estímulos utilizando una de las siguientes etiquetas /a/, /e/, /i/, /o/ y /u/.
El experimentador debe estar especialmente vigilante en la fase de construcción de

estímulos. Debe asegurarse de que los parámetros usados por los alumnos son admisibles
en función de los valores máximo y mínimo que permite el sintetizador y, además, los
adecuados para sintetizar la vocal en cuestión. En esta fase, el experimentador puede ir
variando sistemáticamente cada uno de los parámetros de síntesis para que los alumnos
225
experimenten la relación que existe entre el parámetro que está siendo manipulado y su
experiencia perceptiva. Al final de esta fase, el experimentador mostrará los parámetros
de síntesis utilizados en los estímulos que aparecerán en el experimento y discutirá las
diferencias si las hay.
Es tarea del experimentador hacer ver al alumno el camino que se está recorriendo
desde la producción de una señal lingüística hasta la percepción de esa señal, pasando
por la materialización acústica de la misma. En efecto, consideraciones acerca de la
producción de la vocal asociada a una teoría potente (como la teoría acústica de la
producción del habla) nos llevaron a determinar los valores físicos de los parámetros que
se utilizan en la construcción de estímulos para este experimento. Ahora, el experimento
muestra que esas diferencias en los valores físicos son las que determinan la cualidad de
nuestra experiencia perceptiva.
El directorio MATERIAL PRACTICA 7 consta de dos subdirectorios,

PRACTIVOCALES y PRACTICA7_EXPERIMENTO con el siguiente contenido:
1.PRÁCTICA7_VOCALES. Contiene cinco ficheros de audio con extensión wav con

el siguiente contenido:
a)vocal a.wav: estímulo sintetizado /a/, correspondiente a la vocal /a/
b)vocal e.wav: estímulo sintetizado /e/, correspondiente a la vocal /e/
c)vocal i.wav: estímulo sintetizado /i/, correspondiente a la vocal /i/
d)vocal o.wav: estímulo sintetizado /o/, correspondiente a la vocal /o/
e)vocal u.wav: estímulo sintetizado /u/, correspondiente a la vocal /u/
2.PRÁCTICA7_EXPERIMENTO. Contiene el fichero de audio con extensión wav

Practica?vocales.wav con la secuencia de vocales sintéticas utilizadas como
estímulos en el experimento de identificación.
Parte I
226
-A continuación, vamos a presentaros varios sonidos. Vuestra tarea consiste,
simplemente, en describirlos verbalmente. [El experimentador presenta cada uno
de los cinco estímulos en el orden /a/,, /e/s, /i/s, /o/s, /u/,; ficheros de audio:
a.wav, e.wav, i.wav, o.wav y u.wav].
Parte II
-Ahora vais a escuchar aleatoriamente los estímulos anteriores. Vuestra tarea es

identificar cada estímulo utilizando una de las siguientes categorías: /a/, /e/, /i/, /o/
y /u/. Marcad con una cruz la casilla de la columna correspondiente del Cuadro
7.4 de la hoja de respuestas. Por favor, durante la realización del experimento
tapad las columnas del Cuadro 7.4 encabezadas por Est. [El experimentador
presenta el fichero de audio: Practicasvocales.wav].
3.1. Especificación de la relación que existe entre los parámetros articulatorios de la

producción de vocales y sus consecuencias acústicas
[Compárense las Figuras 7.1 y 7.3 del manual de Prácticas. Formúlense dos reglas que
relacionen las características acústicas de las vocales (mostradas en la Figura 7.3) con las
dimensiones articulatorias de las mismas (que se recogen en la Figura 7.1). Una regla
debe concernir al lugar de articulación y otra al modo de articulación.]
[A modo de ejemplo se muestra una de las reglas pedidas].
Modo de articulación: a mayor altura vocálica (a mayor constricción de la cavidad

oral), menor es la frecuencia temporal del primer formante.
3.2. Síntesis, utilizando una implementación del sintetizador por formantes de Klatt, de
las cinco vocales del español atendiendo a las consecuencias acústicas que tiene la
articulación diferencial de los distintos segmentos vocálicos
En el Cuadro 7.3, y a título de ejemplo, se proporcionan los valores de F0. Cada celda
indica que la frecuencia fundamental empezó adquiriendo un valor de 140 Hz y
paulatinamente descendió hasta 110 Hz.
CUADRO 7.3.
227
Valores de los parámetros utilizados para la síntesis de cada vocal
3.3. Comprobación experimental de que los parámetros de síntesis usados generan

vocales perceptivamente compatibles con las categorías fonológicas del español
3.3.1. Parte I: Descripción verbal de los estímulos
/a/, es un estímulo lingüístico y se escucha como la vocal /a/.
3.3.2. Parte II: Resultados experimentales
En el Cuadro 7.4 se registran los resultados de la identificación de cada categoría vocálica

para la persona ejemplo (sujeto experimental). Las columnas encabezadas por Est han de
ser ocultadas durante la realización del experimento.
CUADRO 7.4.
Identificación de cada categoría vocálica
228
En el Cuadro 7.5 aparecen los porcentajes de identificación de cada categoría vocálica
en cada estímulo.
CUADRO 7.5.
Porcentajes de identificación de cada categoría vocálica en cada estímulo
En la Figura 7.5 aparecen los histogramas en los que se representan los porcentajes de
identificación de cada categoría vocálica para cada estímulo.
229
230
Figura 7.5. Porcentajes de identificación de cada categoría vocálica en cada una de las
vocales sintéticas utilizadas como estímulos: /a/,, /e/,, /i/s, /o/,, /u/,. En la abscisa de cada
histograma, las categorías vocálicas del castellano; en la ordenada, porcentaje de
identificaciones del estímulo como perteneciente a cada categoría.
3.4. Mostrar cuáles son los parámetros físicos que usa nuestro sistema perceptivo para
codificar las distintas vocales del idioma
[Obsérvese cómo la variación de F1 y F2 afecta a la categorización fonológica.]
[A título de ejemplo se explicita el papel de uno de los parámetros físicos que usa
nuestro sistema perceptivo].
A la vista de los resultados experimentales (véase en el Cuadro 7.5 y en la Figura 7.5

los resultados de identificación para el par i-e y para el par o-u) y de los parámetros de
síntesis usados para sintetizar dichas vocales (véase el Cuadro 7.3), parece claro que
nuestro sistema perceptivo usa F1 para categorizar el modo de articulación de las vocales
del español.
NOMBRE.......................................................................................
corresponde).
RESULTADOS [3]
Especificación de la relación que existe entre los parámetros articulatorios de la

producción de vocales y sus consecuencias acústicas [3.1]
231
[Compárense las Figuras 1 y 3 del Manual de Prácticas. Formúlense dos reglas que
relacionen las características acústicas de las vocales (mostradas en la Figura 7.3) con las
dimensiones articulatorias de las mismas (que se recogen en la Figura 7.1). Una regla
debe concernir al lugar de articulación y otra al modo de articulación.]
Síntesis, utilizando una implementación del sintetizador por formantes de Klatt, de las
cinco vocales del español atendiendo a las consecuencias acústicas que tiene la
articulación diferencial de los distintos segmentos vocálicos [3.2]
Valores de los parámetros utilizados para la síntesis de cada vocal [CUADRO 7.3]
Comprobación experimental de que los parámetros de síntesis usados generan vocales

perceptivamente compatibles con las categorías fonológicas del español [3.3]
232
Parte 1: Descripción verbal de los estímulos: [3.3.1]
Parte II: Resultados experimentales [3.3.2]
Nota: Durante la realización del experimento, ocúltense las columnas encabezadas por
Est.
Identificación de cada categoría vocálica
[CUADRO 7.4]
233
Porcentajes de identificación de cada categoría vocálica en cada estímulo
[CUADRO 7.51
234
En la Figura 7.5 aparecen los histogramas en los que se representan los porcentajes de
identificación de cada categoría vocálica para cada estímulo.
235
Porcentajes de identificación de cada categoría vocálica en cada una de las vocales
sintéticas utilizadas como estímulos: /a/,, /e/,, /i/,, /o/,, /u/,. En la abscisa de cada
histograma, las categorías vocálicas del castellano; en la ordenada, porcentaje de
identificaciones del estímulo como perteneciente a cada categoría. [FIGURA 7.5]
Mostrar cuáles son los parámetros físicos que usa nuestro sistema perceptivo para
codificar las distintas vocales del idioma. [3.4] [Obsérvese cómo la variación de F1 y F2
afecta a la categorización fonológica].
236
237
238
1. Introducción
1.1. Percepción categórica
Podría decirse que todo acto perceptivo apela a una cierta categorización del mundo.
Además, no toda variación física en estímulos perceptibles genera una variación de la
sensación, por lo que parece sensato suponer que el número de categorías perceptivas es
mucho menor que el de estímulos. No obstante, en esta Práctica vamos a hablar de
percepción categórica (o categorial) en el sentido estricto que ha asumido el concepto en
el ámbito de la percepción del habla (Liberman, Harris, Hoffman y Griffith, 1957).
En el sentido restringido al que acabamos de aludir, la percepción categórica se define

utilizando, conjuntamente, experimentos de identificación y de discriminación
perceptivas. En particular, se dice que existe percepción categórica cuando se cumplen
los siguientes criterios (cfr. Repp, 1984):
a)Las funciones de identificación han de ser de pendiente pronunciada. En otras

palabras, la probabilidad de identificación de una categoría fonológica dada, sufre
un cambio brusco en un determinado punto del continuo. La representación
gráfica de esta función suele adoptar la forma de la función sigmoide que se
muestra en la Figura 8.1.
239
Figura 8.1. Porcentaje de respuestas de identificación de una categoría fonológica en
función de la variable física pertinente.
b)Las funciones de discriminación tienen máximos locales. En particular, la posición

de este máximo ha de coincidir con el punto del continuo donde se sitúa la frontera
entre categorías. Por tanto, los pares que mejor se discriminan son los que se han
identificado con categorías fonológicas diferentes. La funciones de discriminación
suelen adoptar la forma aproximada de una función Gaussiana como la
representada en la Figura 8.2.
240
Figura 8.2. Porcentaje de respuestas correctas a cada par del continuo acústico.
c)Los estímulos que pertenecen a la misma categoría fonológica no pueden

discriminarse.
d)En tanto la identificación constriñe las posibilidades de discriminar dos estímulos

dados, las funciones de discriminación deberían poder predecirse a partir de las
probabilidades obtenidas en los experimentos de identificación.
En experimentos reales es difícil que se cumplan estrictamente todos los criterios

mencionados más arriba. Por eso los investigadores consideran que se obtiene, en un
sentido amplio, percepción categórica cuando se observa el denominado "efecto de
frontera fonémica", es decir, cuando se cumple al menos el criterio b).
1.2. Bandas críticas y distancia tonotópica
En esta Práctica vamos a enriquecer el análisis de la percepción categórica (un fenómeno

que parece no ser aplicable a todo procesamiento acústico) con la incorporación al mismo
de la estructura de bandas críticas (estructura que opera en todo procesamiento acústico).
Para ello, en la construcción de estímulos, en vez de mantener constante la distancia
física entre los estímulos, mantendremos constante la distancia psicológica entre los
mismos (al menos, por lo que se refiere a la codificación de la frecuencia temporal que
lleva a cabo el Sistema Auditivo Humano). En particular, los valores de frecuencia (en
Hz) serán convertidos a una escala de tonalidad (Bark) basada en las anchuras de banda
241
críticas de Múnich para los filtros auditivos (ver Práctica 6, Figura 6.3). Un Bark se
corresponde con la anchura de banda crítica en cualquier posición del rango de
frecuencia (y a una distancia de 1.3 mm en la membrana basilar). Por tanto, la escala de
Bark refleja la distancia tonotópica entre dos sonidos. Si dos pares de sonidos están
separados por el mismo número de Barks, entonces su representación en la membrana
basilar también es equidistante.
Además de la escala de Bark, existen otras escalas (como la de Cam, basada en las
anchuras de las bandas críticas estimadas por la escuela de Cambridge) que sirven al
mismo propósito. En esta Práctica emplearemos la primera; no obstante, una
representación gráfica de ambas puede verse en la Figura 8.3. (Cfr. Hartmann, 1998,
Figura 10.10).
Figura 8.3. Dos escalas diferentes de tonalidad (Bark y Cam) (Hartmann, 1998, Figura
10.10).
Traunmüller (1990) proporcionó expresiones analíticas para la escala tonotópica

sensorial de Bark. Sus fórmulas son las siguientes (Traunmüller, 1990 ecuación 6):
242
donde v es la frecuencia temporal del estímulo y z su valor en Barks.
Estas fórmulas son razonablemente precisas (con una desviación inferior a 0.05 Bark)
en el rango de 0.2 kHz a 6.7 kHz. No obstante, para frecuencias inferiores a 500 Hz la
relación entre v y z es aproximadamente lineal (z=v/100) y esta será la ecuación que
utilizaremos en esta Práctica para ese rango inferior de frecuencias.
Los objetivos de la esta Práctica son:
1.Especificar los valores de los parámetros que permitirían generar un continuo

acústico de vocales cuyas distancias tonotópicas sean equivalentes. Entendemos
por continuo acústico un conjunto o serie de estímulos (normalmente sintetizados)
que son idénticos en todas sus características acústicas excepto en una
(característica acústica crítica) que se va variando paulatinamente.
2.Obtener experimentalmente los porcentajes de identificación para cada estímulo de

un continuo.
3.Representar la función de identificación asociada al continuo anterior. Entendemos

por función de identificación la función que relaciona el valor de la característica
acústica crítica con la probabilidad de asignar perceptivamente una categoría
fonológica a los distintos estímulos del continuo.
4.Calcular la frontera entre categorías, esto es, el valor de la característica acústica

crítica correspondiente a una probabilidad de 0.5 en la función de identificación.
5.Obtener experimentalmente los porcentajes de discriminación correcta para cada

par de estímulos del continuo.
6.Representar la función de discriminación asociada al continuo anterior. Entendemos

por función de discriminación la función que relaciona la "posición" en el continuo
de dos estímulos (dada una distancia física constante entre ellos referida a la
característica acústica crítica) con la probabilidad de que ambos estímulos sean
perceptivamente distinguibles.
7.Calcular el valor aproximado donde se localiza el máximo de las funciones de

discriminación.
8.Justificar si las funciones obtenidas cumplen con los criterios (a), (b) y (c) que se
243
han propuesto como definición parcial de percepción categórica. Establecer si
aparece el efecto de frontera fonémica.
La Práctica tiene dos partes. En la Parte 1 se realiza una tarea de identificación, la

obtención de la función de identificación y el cálculo de la frontera entre categorías
fonémicas. En la Parte II se realiza una tarea de discriminación, la obtención de la
función de discriminación, el cálculo del valor aproximado en el que se localiza su
máximo y la verificación del efecto de frontera fonémica.
2. Método
2.1. Estímulos
Los estímulos serán nueve vocales estacionarias que formarán un continuo desde la
categoría /i/ hasta la categoría /e/. El continuo se crea modificando las frecuen cias del
primer y el segundo formante (y sus correspondientes anchuras de banda) en pasos
iguales en la escala de Bark. Para calcular los valores de Bark se usan las fórmulas de
Traunmüller (1990) citadas más arriba.
En particular, F1 para el extremo /i/ del continuo adopta un valor de 269 Hz y se va

variando en pasos de +0.2 Bark hasta llegar al otro extremo del continuo. La anchura de
banda de F1, B 1, empieza adoptando un valor de 40 Hz para el extremo /i/ del continuo
y se varía en pasos de +0.0375 Bark. Por su parte, F2 adopta un valor de 2147 Hz para
el extremo /i/ del continuo y se varía en pasos de -0.125 Bark; su anchura de banda, B2,
comienza asumiendo el valor de 200 Hz y se va variando en pasos de -0.125 Bark hasta
llegar al extremo /e/ del continuo.
Los valores de los formantes tercero, F3, cuarto, F4, y quinto, F5, se mantienen
constantes en 2500, 3500 y 4500 Hz, respectivamente. Sus anchuras de banda, B3, B4,
y B5, también se mantienen constantes en 200, 150 y 200 Hz, respectivamente. La
frecuencia fundamental, F0, va variando de 125 Hz a 80 Hz. La duración de los
estímulos es de 300 ms con una rampa de inicio (ascendente) y de finalización
(descendente) de 50 ms.
Los estímulos han sido sintetizados con el algoritmo de Klatt (véase la Práctica 7 de
este Manual) con los valores para sus parámetros que aparecen a continuación y se
resumen en el Cuadro 8.1:
244
CUADRO 8.1.
Valores de los parámetros utilizados para generar los estímulos sintéticos (Est. sint.)
utilizados en el experimento
245
246
El experimento consta de dos Partes con dos tareas diferentes, una de identificación y
otra de discriminación variable 2IAX (modificada).
En la Tarea de Identificación (Parte I), cada estímulo se presenta 20 veces

aleatoriamente. Los participantes tienen que identificar los estímulos como /i/ o como /e/.
Al principio de la sesión los participantes escuchan cinco veces los es tímulos prototípicos
(los extremos del continuo). Antes de responder a los estímulos experimentales, el
participante pasa por un bloque adicional con 20 ensayos de práctica. Por lo tanto, el
número total de ensayos es igual a 200.
En la Tarea de Discriminación (Parte II) se emparejan estímulos contiguos en el

continuo de vocales. Cada pareja genera dos ensayos. Así, la pareja 1-2 genera los
ensayos [1,1] y [1,2]. La tarea del sujeto es decidir si los dos estímulos de cada ensayo
son iguales o diferentes. Como el número posible de parejas es ocho, construimos
bloques de dieciséis (8x2) ensayos. Aunque los experimentos 2IAX son algo más
complicados, hemos optado por utilizar esta versión simplificada para agilizar la tarea.
Los participantes han de responder a 10 de esos bloques, por lo que cada pareja se
presenta 20 veces. Antes de responder a los ensayos experimentales, los participantes
pasan previamente por un bloque de práctica de 16 ensayos. Por tanto, el número total
de ensayos es igual a 176.
247
En la fase de construcción de estímulos ha de ser el alumno, orientado por el

experimentador, el que tome todas las decisiones relevantes. En particular, teniendo en
cuenta la carta de formantes proporcionada, deberá seleccionar valores razonables para
F1 y F2 tanto para la vocal /i/ como para la vocal /e/. Eso le llevará a proponer un
incremento sensato entre los valores de cada estímulo, dado que se le impondrá la
condición de generar un continuo con nueve estímulos (I1 (/i/), 12, 13, 14, 15, 16, 17,
18, 19 (/e/)). El experimentador propondrá las anchuras de banda iniciales y finales al
alumno, pero dejará también que averigüe los valores en Bark para el resto de los
estímulos.
También es interesante que el experimentador anime al alumno a experimentar con

distintos valores para AV y FO y compruebe las consecuencias perceptivas que se
derivan de seleccionar uno u otro valor para estos parámetros.
Antes de comenzar la tarea de identificación, el experimentador debe asegurarse de

que el participante distingue correctamente los dos extremos del continuo. Con respecto a
la tarea de discriminación, el experimentador debe insistir en que el participante ha de
responder que los estímulos son diferentes siempre que aprecie cualquier variación entre
ambos, no solo cuando escuche dos estímulos con una cualidad vocálica distinta.
El directorio MATERIAL PRACTICA 8 consta de tres subdirectorios,

PRACTICA8_PROTOTIPOS, PRACTICA8_EXPERIMENTO_PARTE I_I y
PRACTICA8_EXPERIMENTO_PARTE II_D con el siguiente contenido:
1. PRACTICARPROTOTIPOS. Contiene dos archivos con extensión wav con los

prototipos de los extremos del continuo:
a) Practica8I]J7rototipoi.wav: Estímulo sintetizado correspondiente al extremo /i/

del continuo.
b)Practica8 I9 e.wav: Estímulo sintetizado correspondiente al extremo /e/ del

continuo.
2. PRACTICA8PARTEI_I. Contiene el archivo de audio con extensión wav

Practica8wav con la secuencia de estímulos para el experimento de identificación.
(Los primeros 20 ensayos son de práctica y no deben ser utilizados para calcular
248
los porcentajes).
3. PRACTICA8EXPERIMENTOPARTE11D. Contiene el archivo de audio con

extensión wav Practica8_Discriminación.wav con la secuencia de estímulos para el
experimento de discriminación. (Los primeros 16 ensayos son de práctica y no
deben ser utilizados para calcular los porcentajes).
A los sujetos se les impartirán las siguientes instrucciones.
Parte I: Experimento de identificación
Vais a escuchar los sonidos que acabáis de sintetizar. Como sabéis, se trata de un
conjunto de vocales. Algunas son instancias claras de la vocal /i/, otras son
instancias claras de la vocal /e/ y otras son vocales más ambiguas que podrían ser
/i/ o ser /e/.
Esta es una /i/ clara. [El experimentador presenta el archivo con el estímulo 11:
Practica8 i.wav]. Esta es una /e/ clara. [El experimentador presenta el archivo con
el estímulo 19: Practica8 I9jrototipo e.wav].
Ahora vais a escuchar alternativamente cada una de estas vocales empezando por
la /i/. [El experimentador presenta la secuencia alternativa de 10 estímulos
comenzando por el estímulo Ti: H_prototipo i. wav, D_prototipo e. wav].
A continuación voy a presentar, mezcladas, tanto vocales claras como las que
acabáis de oír, como otras más ambiguas. Vuestra tarea consiste en decidir, para
cada caso, si la vocal es una /i/ o una /e/. No debéis pensar mucho la respuesta.
Responded espontáneamente a todos los estímulos que se presenten. Si no estáis
seguros de qué contestar en algún caso, responded al azar. Los primeros 20
ensayos serán de práctica y no se tomarán en cuenta para el cálculo de
porcentajes. Indicad la respuesta marcando con una cruz la casilla de la columna
correspondiente del Cuadro 8.3 (/i/ si oís el sonido i, /e/ si oís el sonido /e/).
Durante la realización del experimento, tapad las columnas del Cuadro 8.3
encabezadas por el símbolo St. ¿Alguna pregunta?
[El experimentador presenta el archivo Practica8Parte wav].
249
Parte II: Experimento de discriminación
-Ahora vais a escuchar pares de estímulos como los que habéis escuchado hasta este
momento. Vuestra tarea es simplemente decidir si los dos estímulos son iguales o
diferentes basándoos en cualquier clave física que os permita distinguirlos.
-Los primeros 16 ensayos son de práctica, para que podáis familiarizaros con la tarea
y no se tomarán en cuenta para el cálculo de porcentajes. Después empezará el
experimento propiamente dicho.
-Indicad la respuesta marcando con una cruz la casilla de la columna correspondiente

del Cuadro 8.5 (1, si os parecen iguales; D, si os parecen diferentes). Durante la
realización del experimento, tapad las columnas del Cuadro 8.5 encabezadas por la
letra P ¿Tenéis alguna pregunta?
[Elexperimentador presenta el archivo Practica8Parte D.wav].
3.1. Especificación de los valores de los parámetros de síntesis de los nueve estímulos
utilizados
En el Cuadro 8.2 aparecen los valores de los parámetros de síntesis de uno de los nueve
estímulos utilizados en los experimentos de identificación (Parte 1) y de discriminación
(Parte II).
CUADRO 8.2.
Valores de los parámetros de síntesis utilizados para generar los estímulos utilizados
en el experimento
250
PARTE 1: EXPERIMENTO DE IDENTIFICACIÓN
3.2. Obtención experimental de los porcentajes de identificación para cada estímulo del
continuo
En el Cuadro 8.3 se registran los resultados del experimento de identificación (Parte 1)

para la persona del ejemplo (sujeto experimental). La columna St del cuadro indica el
estímulo sintético que se ha presentado en cada ensayo. Esta columna ha de ser ocultada
durante la realización del experimento.
CUADRO 8.3.
Resultados del experimento de identificación (Parte 1)
251
En el Cuadro 8.4 aparecen los porcentajes de identificación de la vocal /i/ para cada
estímulo del continuo.
CUADRO 8.4.
Porcentajes de identificación de la vocal /i/ en cada estímulo del continuo
252
3.3. Obtención de la función de identificación asociada al continuo anterior
En la Figura 8.4 se representa al porcentaje de respuestas de identificación de la vocal /i/

en función de la posición del estímulo en el continuo. Nótese que la línea poligonal que
representa la función de identificación tiene la forma aproximada de la función sigmoide,
como en la Figura 8.1.
Figura 8.4. Porcentaje de respuestas de identificación de la vocal /i/ en función de la

posición del estímulo en el continuo. La línea poligonal que aproxima una función
sigmoide representa la función de identificación.
3.4. Cálculo de la frontera entre categorías (FC)
La frontera entre categorías (FC) es el estímulo que es identificado como /i/ el 50% de
las veces.
Por tanto, la frontera entre categorías está entre el estímulo 15 (F1=349 Hz y F2=1992
Hz) y el estímulo 16 (F1=369 Hz y F2=1955 Hz).
253
Como se estudió en la práctica anterior, F1 es el correlato más importante del modo
de articulación y, por tanto, calculamos, mediante interpolación lineal, la frontera con
respecto a ese valor.
Sucede que F1 (I6) - F1 (I5)=369-349=20 Hz y que p(I5)- p(16)=55%-35%=20%.

Ahora bien, 55%-50%= 5%. Por ello, por interpolación numérica se obtiene que:
Así pues, x=5 Hz y, por tanto, la frontera entre categorías es igual a 349 Hz + 5 Hz =
354 Hz. Es decir:
PARTE II: EXPERIMENTO DE DISCRIMINACIÓN
3.5. Obtención experimental de los porcentajes de discriminación correcta para cada par
de estímulos del continuo
En el Cuadro 8.5 se registran los resultados del experimento de discriminación (Parte II)
para el sujeto experimental. Las columnas I del cuadro indican la respuesta "iguales", las
columnas D, las respuestas "diferentes" y las columnas P del cuadro indican el par de
estímulos que se ha presentado en cada ensayo. Las columnas encabezadas por la letra P
han de ser ocultadas durante la realización del experimento.
CUADRO 8.5.
Resultados del experimento de discriminación (Parte II)
254
En el Cuadro 8.6 aparecen los porcentajes de respuestas correctas para los ensayos con
estímulos pertenecientes a categorías fonémicas diferentes (discriminación).
CUADRO 8.6.
Porcentajes de discriminación para los ensayos con estímulos pertenecientes a

categorías fonémicas diferentes
255
3.6. Representación de la función de discriminación asociada al continuo anterior
En la Figura 8.5 se representa el porcentaje de porcentajes de respuestas correctas para

los ensayos con estímulos pertenecientes a categorías fonémicas diferentes. Nótese que
la línea poligonal que representa la función de discriminación tiene la forma aproximada
de una función Gaussiana, como la de la Figura 8.2.
Figura 8.5. Porcentaje de respuestas correctas para los ensayos con estímulos
pertenecientes a categorías fonémicas diferentes. La línea poligonal que aproxima una
función Gaussiana representa la función de discriminación.
3.7. Cálculo del valor aproximado donde se localiza el máximo de las funciones de
discriminación
Hay que encontrar:
Así pues, en la función de discriminación (Figura 8.5) el máximo se sitúa en el par 15-16.
256
Nótese que el par en el que la función de discriminación tiene un máximo (Figura 8.5)
está compuesto precisamente por los estímulos vocálicos en los que la pendiente de la
función de identificación es máxima (Figura 8.4), es decir, en la frontera entre categorías.
3.8. Justificación de que las funciones obtenidas cumplen con los criterios (a), (b) y (c)
que se han propuesto como definición parcial de percepción categórica
Análisis:
Tomados conjuntamente ambos experimentos, se evidencia que sucede el efecto de

frontera fonémica y por tanto, el fenómeno de percepción categórica (en sentido amplio).
En efecto:
iii. La función de identificación (Figura 8.4) tiene una pendiente pronunciada. La

frontera entre categorías está entre los estímulos 15 e 16 (Cuadro 8.4).
iii. La función de discriminación tiene precisamente el máximo en el par 15-16 (Figura

8.5 y Cuadro 8.6).
iii.Como se observa en los resultados experimentales (Cuadro 8.6 y Figura 8.5), la

discriminación de estímulos pertenecientes a la misma categoría está en torno al
50%.
3.9. Justifíquense las ventajas de utilizar una representación psicoacústicam ente

motivada en la construcción de los estímulos experimentales
[Indicio: Apelar a la distinción entre el estímulo físico y la representación sensorial del

mismo.]
NOMBRE........................................................................................
corresponde).
RESULTADOS [3]
Especificación de los valores de los parámetros de síntesis de los nueve estímulos

utilizados [3.1]
257
Valores de los parámetros de síntesis de los nueve estímulos utilizados
[CUADRO 8.2]
PARTE 1: EXPERIMENTO DE IDENTIFICACIÓN
Obtención experimental de los porcentajes de identificación para cada estímulo del

continuo [3.2]
Nota: Durante la realización del experimento, ocúltense las columnas encabezadas por el
símbolo St.
Resultados del experimento de identificación (Parte I)
[CUADRO 8.3]
258
Porcentajes de identificación de la vocal /i/ en cada estímulo del continuo
[CUADRO 8.4]
Obtención de la función de identificación asociada al continuo anterior [3.3]
259
Porcentaje de respuestas de identificación de la vocal /i/ en función de la posición del
estímulo en el continuo. La línea poligonal que aproxima una función sigmoide representa
la función de identificación. [FIGURA 8.4]
Cálculo de la frontera entre categorías [3.4]
PARTE II: EXPERIMENTO DE DISCRIMINACIÓN
Obtención experimental de los porcentajes de discriminación correcta para cada par de

estímulos del continuo [3.5]
260
Nota: Durante la realización del experimento, ocúltense las columnas encabezadas por P.
Resultados del experimento de discriminación (Parte II)
[CUADRO 8.5]
261
Porcentajes de discriminación de los miembros de cada par como pertenecientes a
categorías fonémicas diferentes
[CUADRO 8.6]
Representación de la función de discriminación asociada al continuo anterior [3.6]
262
Porcentaje de discriminación de los miembros de cada par como pertenecientes a
categorías fonémicas diferentes en función de la composición de cada ar. La línea
poligonal que aproxima una función Gaussiana representa la función de discriminación.
[FIGURA 8.5]
Cálculo del el valor aproximado donde se localiza el máximo de las funciones de

discriminación [3.7]
Justificación de que las funciones obtenidas cumplen con los criterios (a), (b) y (c) que se
han propuesto como definición parcial de percepción categórica [3.8]
Análisis:
263
Justificación de las ventajas de utilizar una representación psicoacústicamente motivada
en la construcción de los estímulos experimentales [3.9]
Análisis:
264
265
1. Introducción
1.1. Percepción de la consonancia/disonancia en la música
El sistema auditivo humano codifica cualquier tipo de información acústica comprendida

en ciertos rangos físicos. No obstante, ciertas configuraciones acústicas adquieren una
consideración peculiar por el papel funcional que desempeñan en nuestra vida cotidiana.
El habla y la música son dos ejemplos destacados de esas configuraciones. Aunque
fenomenológicamente, tanto el habla como la música aparecen como hechos muy
singulares, los investigadores han intentado explicar esa singularidad apelando a las
propiedades generales que caracterizan a los sistemas elementales del análisis sensorial.
Aunque quizá no sea posible explicar todos los fenómenos del habla o de la música
utilizando esa estrategia, merece la pena intentar abarcar de ese modo el mayor número
posible de regularidades conductuales asociadas a esos dominios, ya que uno de los
objetivos del quehacer científico es intentar explicar el mayor número de fenómenos
naturales con el artificio teórico más limitado posible.
Dentro del ámbito de la percepción de la música, una de las dimensiones perceptivas

más estudiadas es la que se refiere a la consonancia/disonancia entre pares de tonos
(puros o compuestos). Aunque dicha dimensión es fácil de comprender intuitivamente,
resulta difícil de definir en términos rigurosos. Kameoka y Kuriyagawa (1969) utilizan los
términos japoneses de "sunda" (claridad) y "nigotta" (turbiedad) para referirse a la
consonancia y a la disonancia, respectivamente. Handel (1988) define consonancia como
la sensación perceptiva de fluidez y agrado que produce una determinada combinación de
tonos, en tanto que la disonancia llevaría asociada una sensación perceptiva de aspereza,
rugosidad y desagrado.
A pesar de la caracterización poco precisa que se ha hecho de estos dos conceptos,

parece que cuando se examinan las músicas tonales de todas las culturas emerge una
cierta predilección hacia ciertos intervalos musicales que suenan particularmente
266
consonantes. Más en concreto los intervalos de octava (2:1), los de quinta (3:2) y los de
cuarta (4:3) se consideran consonancias perfectas, siendo el intervalo de octava el
máximamente consonante. Por su parte, los intervalos de sexta mayor (5:3), tercera
mayor (5:4), tercera menor (6:5) y sexta menor (8:5) se consideran consonancias
imperfectas. Esta (presunta) "universalidad" hace sospechar que quizá la base de esos
juicios esté ligada al funcionamiento del sistema auditivo o, cuando menos, indica que
merece la pena considerar esa posibilidad.
En esta Práctica vamos a tratar de asociar las nociones de consonancia y disonancia

(para tonos puros) con constructor teóricos bien definidos en el ámbito de la psicofisica
auditiva. En concreto, intentaremos ver en qué medida la noción de banda crítica (véase
la Práctica #6 en este Manual) permite comprender las regularidades conductuales que se
observan en los sujetos cuando han de hacer juicios con respecto a la
consonancia/disonancia de dos tonos puros.
En la Figura 9.1 (Roederer, 2008) aparece una representación esquemática de la

relación existente entre la sensación que produce la presentación simultánea de dos tonos
puros de frecuencias temporales f, y fzy los límites de la banda crítica (indicada con el
símbolo AfcB). El tono f, se fija en frecuencia temporal y aparece representado en la
figura por una línea horizontal. La frecuencia, f2, fz = f, +Af, se va variando
paulatinamente a partir de la frecuencia f, tal como indica la línea oblicua cortada de
mayor pendiente. Veamos las sensaciones que se generan cuando f, va aumentando una
cantidad Af para dar lugar a fz. Obviamente, si Af es igual a cero, solo percibimos un
tono cuya tonalidad se corresponde con el de la frecuencia de f, y la amplitud percibida
dependerá de la diferencia en fase de ambos tonos puros. Si Af aumenta un poco,
entonces, aunque se sigue percibiendo un solo tono, su tonalidad aumenta ligeramente.
Para rangos de Af suficientemente pequeños se perciben pulsaciones (beats), esto es, un
tono de amplitud modulada, en las que la frecuencia de la pulsación es, precisamente, Af.
A partir de un determinado valor de Af, la pulsación desaparece y empieza a percibirse
una cierta disonancia o "aspereza" (roughness). Esta sensación de disonancia se mantiene
hasta que se llega al límite de la banda crítica (AfcB); a partir de ese valor, se perciben
dos tonos consonantes, acoplados con suavidad o fluidez (smooth). [Como en Capítulos
anteriores, en adelante la frecuencia temporal se simboliza con la letra v, reservándose la
letra f para indicar una función cualquiera].
267
Figura 9.1. Representación esquemática de las sensaciones consonantes y disonantes que
produce la combinación de dos tonos puros, uno de frecuencia fija f,, y otro de
frecuencia variable f2=f,+ f. 4f_, incremento de f, a partir del cual se discriminan los dos
tonos. 4fcB, incremento de f a partir del cual el tono f2 cae fuera de su banda crítica.
[Roederer, (2008). The Physics and Psychophysics of Music. Berlin: FIGURE 2.12].
Por tanto, parece que la banda crítica marca un límite "natural" que separa las
sensaciones disonantes de las consonantes cuando se presentan al sujeto dos tonos puros
simultáneamente. En síntesis: si la diferencia entre las respectivas frecuencias temporales
de dos tonos puros es menor que una banda crítica, los tonos suenan disonantes; si la
diferencia es mayor, entonces suenan consonantes (Rossing, 1990). En realidad, la
transición que se produce entre la sensación de aspereza y la sensación de suavidad es
gradual y, por tanto, no debe esperarse un cambio abrupto. Así pues, en tomo al límite
268
de la banda crítica existiría un rango aproximado de frecuencias que marcarían esa
transición gradual que se da entre la percepción consonante y disonante de tonos puros.
La anchura de la banda crítica no solo determina si una combinación concreta de

tonos puros se percibirá como consonante o disonante. Dicha anchura determina también
el grado de disonancia percibido (cfr. Rossing, 1990; o los trabajos originales de Plomp y
Levelt, 1965). En la Figura 2 aparecen gráficamente representadas las relaciones que se
acaban de mencionar. Como puede apreciarse, la disonancia resulta ser máxima cuando
la separación en frecuencia de los tonos componentes es aproximadamente la cuarta
parte de la anchura de banda crítica.
Figura 9.2. Consonancia de dos tonos puros en función de su separación en frecuencia

relativa a la anchura de la correspondiente banda crítica (Plomp & Levelt, 1965; Figura
10).
1.Evaluar el grado de consonancia de distintos pares de tonos puros.
2.Verificar si los grupos perceptivos obtenidos se corresponden con las predicciones

que se derivan de la Figura 9.1.
269
3.Verificar si el par percibido como máximamente disonante se corresponde con el
predicho por la gráfica de la Figura 9.2.
4.Verificar si el par percibido como máximamente consonante se corresponde con el

predicho por la gráfica de la Figura 9.2.
5.Inspeccionar y describir los resultados obtenidos en un estímulo que consiste en un

par de tonos en el que el tono superior está en el límite de la Banda Crítica.
6.Aplicaciones: utilizar las funciones conocidas que describen la anchura de banda de

los filtros auditivos (véase Práctica 6) para generar predicciones acerca de la
consonancia o disonancia de pares de tonos.
2. Método
2.1. Estímulos
Se utilizarán cuatro tipos de estímulos diferentes, todos ellos constituidos por suma de
dos tonos puros en el que uno de ellos tiene una frecuencia temporal de 1000 Hz en la
fase de entrenamiento y de 2000 Hz en la fase experimental. Cualquier estímulo obedece
por tanto a la siguiente ecuación:
con v, fijo, vi=1000 Hz o 2000 Hz y v2 variable. Todos los estímulos tienen una
duración de 1 segundo y están normalizados en intensidad.
La descripción de los estímulos de cada bloque se detalla en los Cuadros 9.1 y 9.2
(dada la naturaleza del experimento solo se detalla la frecuencia de los estímulos; la
amplitud y la fase no están explícitamente indicadas).
2.2. Predicciones
Teniendo en cuenta la información proporcionada por las Figuras 9.1 y 9.2, se pueden
realizar las siguientes predicciones.
üi.Predicción 1 (pl): la combinación de un tono de 1000 Hz con tonos de frecuencia

temporal próxima se ha de percibir, según la Figura 9.1, como pulsaciones.
üi.Predicción 2(p2): la anchura de la banda crítica (en Hz) para 1000Hz, según la
fórmula de Cambridge (Práctica #6), es:
270
Según la Figura 9.2 el tono que se percibe con la máxima aspereza o disonancia
es aquel que difiere del tono test en 0.25 la banda crítica. Por tanto, la
combinación de un tono de 1000 Hz con un tono de aproximadamente 1034 Hz
(1000 + 0.25 x 132.64) se ha de percibir con la aspereza máxima.
Según la Figura 9.2, la combinación de un tono de 1000 Hz con un tono de

aproximadamente 1065 Hz (1000+0.5x 132.64) se ha de percibir con aspereza.
iii.Predicción 3(p3): según las Figuras 9.1 y 9.2 la combinación de un tono de 1000
Hz con un tono de 1140 Hz se ha de percibir en el límite entre la consonancia y la
disonancia.
iv.Predicción 4(p4): según la Figura 9.2 la combinación de un tono de 1000 Hz con

tonos de frecuencia temporal más allá de la banda crítica se han de percibir
consonantes.
iv.Predicción 5(p5): más allá de la banda crítica no todas las combinaciones son
igualmente consonantes. Tal y como se deduce de la introducción, los intervalos
de octava serán más consonantes que cualesquiera otros intervalos.
Estas predicciones relativas a la experiencia perceptiva se recogen en el Cuadro 9.1.

Las relativas al tono de 2000 Hz, cuya deducción se deja al estu-diante, se recogen en el
Cuadro 9.2.
CUADRO 9.1.
Valores de las frecuencias temporales de los dos tonos puros componentes de cada
estímulo sonoro y predicción de la experiencia perceptiva
v, =1000Hz
271
CUADRO 9.2.
Valores de las frecuencias temporales de los dos tonos puros componentes de cada
estímulo sonoro y predicción de la experiencia perceptiva
vl = 2000Hz
272
El paradigma experimental utilizado es el de identificación, con dos fases: fase de
entrenamiento y fase experimental. La fase de entrenamiento tiene tres partes. En todas
estas partes el experimentador usará los estímulos correspondientes a un tono puro de
referencia de 1000 Hz. En la primera parte, se presentarán tres veces a los sujetos el
primer estímulo de los tipos 1 (Estl) y 2 (Esta) y el último estímulo del tipo 4 (Est7) para
proporcionarle las categorías de respuesta (pulsación, aspereza y consonancia,
respectivamente). No obstante, antes de especificarle la categoría asociada a cada
estímulo, el experimentador pedirá a cada participante que informe sobre el modo en que
espontáneamente percibe cada estímulo, esto es, sobre si el estímulo es percibido como
consonante o no. Una vez proporcionadas las etiquetas de los estímulos, en la segunda
parte del entrenamiento, cada uno de ellos será presentado (alternativamente) en cinco
ocasiones y el experimentador se asegurará de que el participante puede discriminarlos.
En la tercera parte del entrenamiento, el experimentador presentará al sujeto los
estímulos con distintos niveles de aspereza y consonancia (tres veces cada par).
A continuación, en la fase experimental, se presentarán aleatoriamente los siete

estímulos correspondientes al tono puro de referencia de 2000 Hz. La tarea del sujeto es
decidir la categoría a la que pertenece cada estímulo. Para ello se le proporcionarán cinco
categorías posibles: 1) pulsación (P); 2) aspereza (A); 3) aspereza + (A+); 4) consonancia
(C); y 5) consonancia + (C+). Las categorías con un "+" indican un grado mayor de
posesión de la característica seleccionada. Así, el participante debe seleccionar la
categoría consonante C+ para el estímulo E; y consonante C para el estímulo E;, si el
estímulo i le parece más consonante que el estímulo j. El sujeto realizará primero un
bloque de práctica de veintiún ensayos (3 veces cada estímulo) y después responderá al
bloque propiamente experimental con 140 ensayos (20 veces cada estímulo).
Esta Práctica, aunque fundamentada en modelos teóricos complejos (modelo de bandas

críticas, funciones de anchura de banda crítica, funciones de consonancia, etc.) está
diseñada para verificar de un modo sencillo los aspectos más elementales que se
relacionan con la percepción simultánea de tonos puros en términos de consonancia o
disonancia. Esta es la razón por la que se ha utilizado un paradigma experimental simple
y se han utilizado solo dos o tres estímulos distintos dentro de cada tipo. El
experimentador ha de ser consciente de que la demostración puede ser enriquecida,
variando sistemáticamente la distancia en frecuencia entre los dos tonos que configuran
cada par y midiendo el grado de disonancia que genera cada distancia. De este modo, se
podría hacer una evaluación más sistemática y rigurosa de las predicciones teóricas antes
enunciadas.
273
En cualquier caso, el experimentador debe ser cuidadoso para no sesgar a priori en la
fase de entrenamiento al sujeto sobre cómo ha de percibir los estímulos. En esa fase
primera de entrenamiento, el experimentador solo informará al sujeto de que algunos
estímulos le sonarán más consonantes (eufónicos, fluidos, limpios...) y otros le sonaran
más disonantes (ásperos, rugosos...), pero no asociará de modo explícito esas categorías
con cada uno de los estímulos. El experimentador anotará cuidadosamente cuál es la
sensación espontánea que generan los estímulos en el participante. Solo en la segunda
fase del entrenamiento se proporcionarán al participante las categorías propuestas en esta
práctica. Esto no quita fuerza a la interpretación de los resultados. De hecho, nuestro
interés principal es determinar si los distintos estímulos suscitan en el oyente sensaciones
que este clasifica en categorías perceptivas diferentes, con independencia del nombre que
se asigne a esas categorías. En cualquier caso, para evitar que el sujeto haya aprendido
simplemente a asociar una etiqueta verbal a un estímulo concreto (con independencia de
la disonancia o consonancia que le suscita), en la fase experimental el sujeto ha de
evaluar estímulos con una frecuencia distinta a la que fue expuesto en la fase de
entrenamiento.
El directorio MATERIAL PRÁCTICA 9 contiene tres subdirectorios,

PRÁCTICA9_PARES DE TONOS, PRÁCTICA9_EXPERIMENTO 1 y
PRÁCTICA9_EXPERIMENTO 2, con el siguiente contenido.
1. PRACTICAPARES DE TONOS. Contiene siete archivos de audio .wav:
a) El_pulsaciónlwav: par de tonos puros con frecuencias de 1000 y 1002 Hz.
b)E2 1000.wav: par de tonos puros con frecuencias de 1000 y 1005 Hz.
c) E31000.wav: par de tonos con frecuencias de 1000 y 1034 Hz.
d) E41000.wav: par de tonos puros con frecuencias de 1000 y 1065 Hz.
e)ES consonancia] par de tonos puros con frecuencias de 1000 y 1140 Hz.
j 9E61000.wav: par de tonos puros con frecuencias de 1000 y 1500 Hz.
g)E7 1000.wav: par de tonos con frecuencias de 1000 y 2000 Hz.
2.PRACTICA9_EXPERIMENTO 1. Contiene un archivo de audio wav, Practica9

Secuencia de estímulos usados en la fase experimental con el tono de 1000 Hz.
274
3.PRACTICA9_EXPERIMENTO 2. Contiene un archivo de audio wav, Secuencia
de estímulos usados en la fase experimental con el tono de 2000 Hz.
A los sujetos se les impartirán las siguientes instrucciones:
A.Fase de entrenamiento
Parte 1
-En este experimento vais a escuchar distintos tipos de sonidos. Unos os parecerán
más consonantes (más lim pios, más fluidos, más eufónicos) y otros os parecerán
más disonantes (más ásperos, más rugosos, más turbios).
-Escuchad estos dos estímulos: [El experimentador presenta los Estímulos 3 (aspereza
máxima: E31000) y 7 (consonancia máxima: 000) tres veces cada uno].
-¿Cuál os parece consonante? ¿Cuál os parece áspero?
-En efecto, el primer estímulo lo denominaremos con el término "aspereza" y el

segundo con el término "consonancia".
-Escuchad ahora este estímulo: [El experimentador presenta tres veces el Estímulo 1:
El pulsación10001.
-¿Os parece que hay aspereza o consonancia? A este estímulo lo denominamos

"pulsación". Fijaos que la sonoridad del estímulo va variando a lo largo del tiempo.
Parte 2
-Ahora vamos a presentaros los tres estímulos que habéis oído para asegurarnos de
que sabéis cómo etiquetarlos. [El experimentador presenta alternativamente los
archivos Elpulsaciónl1000, E7consonanciamax1000 y E31000 -tres veces cada
uno- especificando sus categorías asociadas y asegurándose de que el participante
puede discriminarlos].
Parte 3
-A lo largo del experimento os aparecerán estos estímulos junto con algunos más. En
concreto, aparte de las pulsaciones, hay estímulos ásperos en distintos grados y
consonantes en distintos grados. Estos son dos estímulos con dos grados distintos
275
de aspereza: [El experimentador presenta al sujeto tres veces los Estímulos 3 y 4;
y E4 Y estos son dos estímulos con distintos grados de consonancia (el
experimentador presenta tres veces los Estímulos 6 y 7; E6consonancia21000 y
E7consonanciamax1000].
-¿Alguna pregunta?
B.Fase experimental
Bloque de práctica
-Vais ahora a escuchar distintos estímulos como los que se os han presentado hasta
ahora, pero con una tonalidad diferente. Vuestra tarea consiste en clasificar cada
estímulo utilizando estas cinco categorías: pulsación (P), aspereza (A), aspereza +
(A+), consonancia(C) y consonancia + (C+). Debéis utilizar las categorías "+"
cuando el estímulo os parezca especialmente áspero o especialmente consonante.
-Primero tendréis un bloque de práctica para que os familiarices con la tarea. [El
experimentador presenta a los sujetos los 21 primeros ensayos de Practica9 Por
favor, tapad las columnas del Cuadro 9.3 encabezadas por el símbolo Est.
Bloque experimental (Ensayos para el análisis)
-Ahora, vamos a comenzar la fase experimental propiamente dicha. Indicad la

respuesta marcando con una cruz la casilla de la columna correspondiente del
Cuadro 9.4 de la hoja de respuesta. Por favor, cubrid las columnas del Cuadro 9.4
encabezadas por el símbolo Est. ¿Estáis preparados? ¿Alguna pregunta?
[Elexperimentador presenta a los sujetos el fichero Practica9 desde el principio].
3.1. Evaluación del grado de consonancia de distintos pares de tonos puros
Bloque de práctica
En el Cuadro 9.3 se registran los resultados obtenidos por la persona ejemplo (sujeto
experimental) en la evaluación del grado de consonancia de los distintos pares de tonos
puros.
276
CUADRO 9.3.
Evaluación del grado de consonancia de distintos pares de tonos puros (fase

experimental, bloque de práctica)
v, =2000 Hz
En el cuadro 9.4 se registran los resultados obtenidos por la persona ejemplo (sujeto
experimental) en la evaluación del grado de consonancia de los distintos pares de tonos
puros.
CUADRO 9.4.

experimental, bloque experimental)
v,= 2000 Hz
277
278
En el cuadro 9.5 aparecen los porcentajes de la categoría percibida en cada
combinación y la verificación de las predicciones.
CUADRO 9.5.
Porcentaje de la categoría percibida y verificación de las predicciones
v1=2000 Hz
279
280
Figura 9.3. Porcentajes de la categoría percibida para cada uno de los siete estímulos. P,
pulsaciones; A. aspereza; A+ aspereza máxima; C, consonancia; C+, consonancia
máxima.
3.2. Verificación de si los grupos perceptivos obtenidos se corresponden con las

predicciones que se derivan de la Figura 9.1
En efecto, a la vista de los resultados presentados en el Cuadro 9.5 y de los histogramas

que aparecen en la Figura 9.3, puede decirse que los grupos perceptivos obtenidos se
corresponden con las predicciones de la Figura 9.1 y del Cuadro 9.2. Así, los estímulos 1
281
y 2 son percibidos, mayoritariamente, como pulsaciones (predicción 1); los estímulos 3 y
4 son percibidos mayoritariamente como ásperos (predicción 2) y los estímulos 6 y 7 son
percibidos mayoritariamente como consonantes (predicciones 4 y 5).
3.3. Verificación de si el par percibido como máximamente disonante se corresponde con

el predicho por la gráfica de la Figura 9.2
El par percibido como máximamente disonante es el Estímulo 3, verificándose la

predicción 2.
3.4. Verificación de si el par percibido como máximamente consonante se corresponde

con lo predicho por la gráfica de la Figura 9.2
El par percibido como máximamente consonante es el Estímulo 7, verificándose la

predicción 5.
3.5. Inspeccionar y describir los resultados obtenidos para el Estímulo 5 (E5). ¿Por qué
es particularmente interesante el análisis de los resultados obtenidos con este
estímulo?
Es interesante este estímulo porque según las predicciones hechas, la diferencia en

frecuencia entre los tonos que lo componen está en el límite de la anchura de banda
crítica (predicción 3). Estamos, por tanto, ante un estímulo ambiguo en el que los juicios
de los sujetos son, de hecho, más variables. Los resultados muestran que la probabilidad
de considerar este estí mulo como consonantes es muy parecida a la probabilidad de
considerarlo disonante.
3.6. Aplicaciones
En estas aplicaciones se utilizarán los conocimientos adquiridos con el fin de generar

predicciones acerca de la consonancia/disonancia con la que se perciben distintos
conjuntos de tonos. Además, el alumno deberá generar los estímulos para verificar que
sus predicciones son correctas.
Supóngase que el tono de referencia es ahora el que ha sido utilizado en la fase

experimental, esto es, un tono puro con una frecuencia de 2000 Hz. En estas condiciones
contéstese a las siguientes cuestiones:
1. Calcúlese la anchura de banda crítica para la frecuencia de referencia. (Recuérdese

que la fórmula que se debe emplear es: B(v)=24.7(1+4.37(10-3v)), donde v es la
frecuencia temporal en Hz.)
282
2. Calcúlese la frecuencia del segundo tono para que el par se perciba con una
aspereza máxima. Justifíquese teóricamente la respuesta.
Según la Fig. 2, la aspereza máxima se corresponderá con la siguiente frecuencia:
NOMBRE.......................................................................................
corresponde
RESULTADOS [3]
Evaluación del grado de consonancia de distintos pares de tonos puros [3.1]
Bloque de práctica
Est.
Evaluación del grado de consonancia de distintos pares de tonos puros (fase de

práctica)
v1=2000 Hz
[CUADRO 9.3]
283
Est.

experimental)
v,=2000 Hz
[CUADRO 9.4]
284
285
Porcentaje de la categoría percibida y verificación de las predicciones v,=2000 Hz
[CUADRO 9.5]
286
287
Porcentajes de la categoría percibida para cada uno de los 7 estímulos. [FIGURA 9.3]
Verificación de si los grupos perceptivos obtenidos se corresponden con las predicciones

que se derivan de la Figura 9.1 [3.2]
288
Verificación de si el par percibido como máximamente disonante se corresponde con el
predicho por la gráfica de la Figura 9.2 [3.3]
Verificación de si el par percibido como máximamente consonante se corresponde con lo

predicho por la gráfica de la Figura 9.2 [3.4]
Inspeccionar y describir los resultados obtenidos para el Estímulo S. ¿Por qué es

particularmente interesante el análisis de los resultados obtenidos con este estímulo? [3.5]
Aplicaciones [3.6.]
En estas aplicaciones se utilizan los conocimientos adquiridos con el fin de generar

predicciones acerca de la consonancia/disonancia con la que se perciben distintos
289
conjuntos de tonos. Además, el alumno deberá generar los estímulos para verificar que
sus predicciones son correctas.
Supóngase que el tono de referencia es ahora de 5000 Hz. En estas condiciones

contéstese a las siguientes cuestiones:
1. Calcúlese la anchura de banda crítica para la frecuencia de referencia. (Recuerde

que la fórmula que se debe emplear es: B(v)=24.7(1+4.37(10-3v)), donde v es la
frecuencia temporal en Hz).
2. Calcúlese la frecuencia del segundo tono, para que el par se perciba con una
aspereza máxima. Justifíquese teóricamente la respuesta.
290
291
1. Introducción
1.1. Descripción del efecto McCollough
En todas las modalidades sensoriales la exposición prolongada (o adaptación) de una

persona a un estímulo (estímulo adaptador) suele afectar a la percepción de otro estímulo
(estímulo test) parecido o no al estímulo adaptador que es presentado inmediatamente
después. Precisamente, los post-efectos visuales son los efectos perceptivos ilusorios que
suceden en una imagen test (que puede ser una superficie cromática o acromática
uniforme o con textura) previa adaptación a una imagen utilizada como estímulo
adaptador. La mayoría de los post-efectos dura solo un minuto o menos, como sucede en
la modalidad visual con los post-efectos cromáticos y acromáticos y las post-imágenes
(recuérdense las Demostraciones #24 a #27 de la Práctica 1 de este Manual). Pues bien,
una excepción a esa (relativamente) corta duración de los post-efectos es el efecto
McCollough.
Descubierto por Celeste McCollough en 1965, el efecto que lleva su nombre consiste
en que, previa adaptación durante unos minutos a un enrejado con franjas alternas negras
y con matiz de color en una orientación dada, las franjas acromáticas claras de la misma
orientación en un estímulo test se perciben tenuemente coloreadas con el matiz
complementario (Figura 10.1, Thompson y Burr, 2009). Se dice que este post-efecto es
contingente a la orientación porque el particular matiz ilusorio complementario percibido
en las franjas claras del estímulo test acromático depende de la particular orientación de
estas. Por ejemplo, si la persona se adapta a un enrejado con franjas verticales negras y
rojas alternas, percibirá un tenue color verde en las franjas claras verticales del estímulo
test; por el contrario, si la persona se adapta a un enrejado con franjas horizontales
negras y ver des, percibirá un tenue color rojo en las franjas claras horizontales del
estímulo test (Figura 10.1).
292
Figura 10.1. La adaptación a enrejados con franjas rojas y verdes ortogonales (A) tiene
como consecuencia que las franjas claras con la misma orientación del estímulo test (B)
se perciban tenuemente coloreadas con los colores complementarios (C) (En C se han
coloreado las franjas para hacer visible el efecto perceptivo) [Thompson, M. & Burr, D.
(2009). Visual Aftereffects. Current Biology 19 (1), R11-R14. Figura 4. © Copyrigth
Elsevier 2009. Figura reproducida con permiso].
Originalmente, McCollough encontró que este post-efecto puede durar una hora o
más (McCollough, 1965). En la mayoría de las personas, el efecto McCollough persiste
solo durante unos segundos, como los post-efectos regulares, y después desaparece; en
muy pocas, persiste en los minutos posteriores a la demostración. Pero se ha encontrado
que en algunas personas el efecto puede persistir durante horas, días, semanas
(Stromeyer & Mansfield, 1970), meses (Jorres & Holding, 1975) e ¡incluso años! Esas
personas siguen percibiendo el color complementario al de adaptación en patrones de la
vida cotidiana que poseen franjas blancas y negras, como los códigos de barras. Además,
su duración puede variar con el consumo de cafeína y otras drogas psicoactivas.
293
Nota importante: Conocida esta información, las personas que realicen la Práctica
deberían entregar su consentimiento por escrito antes de comenzar la Demostración.
1.2. Variables de las que depende el efecto
Algunas variables de las que depende el efecto son: (a) el tiempo de exposición a los
estímulos adaptadores; (b) el tiempo de demora de la visión del estímulo test; (c) la
orientación relativa del enrejado test respecto del enrejado adaptador; (d) el ojo (derecho,
izquierdo) expuesto a la adaptación; (e) la orientación absoluta en la retina del estímulo
test; (f) la localización relativa del enrejado test en la retina respecto a la región de la
retina que ha sido expuesta a la adaptación (el post-efecto es más efectivo cuando la
imagen retiniana del enrejado test tiene la misma localización retiniana que la del enrejado
adaptador); y (g) la frecuencia espacial fundamental del enrejado adaptador o del
estímulo test (o anchura de las franjas) (Uhlarik & Osgood, 1974). Otras variables son
enumeradas por Stromeyer (1978).
Como caso típico, en la Figura 2 (MacKay & MacKay, 1974) se representa la

saturación del color complementario ilusorio en función del tiempo transcurrido desde el
final de la fase de adaptación.
Figura 10.2. Evolución de la fuerza del efecto con el tiempo de demora desde el final de
la fase de adaptación, supuesto que la fuerza máxima del efecto es igual a 100. La
relación entre la fuerza del efecto McCollough (S) y el tiempo (t) desde el cese de la
294
adaptación (en minutos) viene dado por la ecuación S=]00to.33 (MacKay & MacKay,
1974). Esta ecuación es la que mejor se ajusta a resultados experimentales obtenidos
utilizando el método de cancelación del matiz (MacKay & MacKay, 1974).
1.3. Explicación del efecto
La causa precisa del efecto es aún hoy desconocida. Para explicarlo, McCollough supuso
la existencia en el Sistema Visual Humano de mecanismos sensibles a la orientación de
los bordes del estímulo adaptador y que, a la vez, son diferencialmente sensibles a la
longitud de onda. La primera explicación funcional supone que el efecto es debido a la
adaptación o fatiga de esos mecanismos de codificación. Esta explicación se basa en el
supuesto general de que la estimulación repetida con un patrón tiene como consecuencia
fatigar el mecanismo que lo codifica. McCollough (1965) postuló simplemente que "en el
Sistema Visual, mecanismos detectores de bordes están sujetos a la adaptación al color,
respondiendo con sensibilidad decreciente a aquellas longitudes de onda con las cuales
han sido más recientemente estimulados" (p. 1115). La falta de transferencia intraocular
en el efecto McCollough indica que en VI (región del córtex visual en la que existen
neuronas sintonizadas tanto a la frecuencia espacial, orientación, como al color) las
aferencias de ambos ojos que llegan a las neuronas que responden al color no están
combinadas, es decir las neuronas que codifican el color en V1 son predominantemente
monoculares (Coltheart, 1973), aunque recientemente existen evidencias a favor de
células binoculares para la codificación del color (Peirce et al., 2008).
La Teoría de los Procesos Oponentes explica el efecto por la fatiga de la parte del
mecanismo oponente implicado en la codificación del estímulo adaptador. La adaptación
a un campo de color rojo vertical fatiga la parte "roja" del mecanismo oponente R/G con
sensores en orientación vertical; por tanto, lo que se percibe en el estímulo acromático es
el resultado de la acción de la parte "verde" del mecanismo R/G con sensores en
orientación vertical, y recíprocamente (Figura 10.6).
Una explicación más reciente (McCollough, Howard & Webster, 2009), no

incompatible con la anterior, supone que la imagen es procesada por un banco de canales
sintonizados a la vez a la frecuencia espacial, la orientación y la longitud de onda. La
distribución de la actividad de los sensores de esos canales después de la adaptación
explicaría el efecto.
Aunque tanto la Teoría de Procesos Oponentes como la teoría multicanal de la visión

espacial y cromática proporcionan explicaciones plausibles, sin embargo por sí sólo el
mecanismo de la pérdida de sensibilidad o fatiga no da razón del efecto, ya que no puede
explicar su (relativa) larga duración. Hay que concluir que el efecto McCollough no es
295
solo un caso simple de fatiga de las neuronas y que existen neurotransmisores implicados
que parecen ser los responsables de su larga duración (Shute, 1979). [Una teoría
computable del efecto puede verse en Ciroux (2006)].
Figura 10.3. Explicación del efecto McCollough según la teoría de procesos oponentes.
A.Test. Sensores verticales y horizontales (cada uno compuesto de dos partes
antagonistas dibujadas como elipses verticales) del mecanismo oponente R/G codifican
296
respectivamente las franjas verticales y horizontales del enrejado test (en la región
inferior solo se ha mostrado un sensor de cada orientación). Como la intensidad de la
respuesta de ambas partes es parecida, la experiencia perceptiva es acromática. Por
supuesto, existen también sensores en otras orientaciones, pero su actividad es nula o
casi nula. B.Fase de adaptación. Con la exposición prolongada al enrejado rojo vertical se
fatiga el mecanismo oponente de los sensores verticales que responde a longitudes de
onda larga (rojo), pero el mecanismo oponente de los sensores que responde a longitudes
de onda media (verde) sigue activa; con la exposición al enrejado verde horizontal, se
fatiga el mecanismo oponente de los sensores horizontales verticales que responde a
longitudes de onda media (verde), pero el mecanismo oponente de los sensores que
responde a longitudes de onda larga (rojo) sigue activa. C.Post-test. Al volver a mirar el
enrejado acromático, solo aquellas partes de los sensores que siguen activas responden
ahora: la parte vertical activa (verde) del mecanismo oponente responde ahora a las
franjas verticales claras y la parte horizontal activa (roja) del mecanismo oponente, a las
horizontales claras, provocando el efecto. (Los respectivos mecanismos oponentes con
baja actividad debido a la fatiga se han representado en gris).
Los objetivos de esta Prácticas son:
1.Provocar en los sujetos experimentales el efecto McCollough.
2.Describir el post-efecto en concreto y en general.
3.Estimar y representar la fuerza del efecto en función del tiempo del cese de la
adaptación al enrejado test (en minutos y para algunos sujetos experimentales, en
días).
2. Método
2.1. Estímulos
En la Práctica se utilizarán dos tipos de estímulos (Figura 10.4):
a)Estímulo test: Cualquier tipo de patrón con franjas blancas y negras con
orientaciones horizontal y vertical (Figura 10.4A). En la Figura 10.4A aparecen
dos tipos de patrones, pero otros estímulos con patrones parecidos pueden servir
como estímulo test.
b)Estímulos adaptadores: Enrejado con franjas verticales de color negro y magenta y
297
enrejado con franjas horizontales de color negro y verde (Figura 10.4B). [Post-
efectos rojos y verdes se generan más fácilmente que post-efectos amarillos y
azules (Stromeyer, 1978)].
2.2. Variables independiente y dependiente utilizadas en la Práctica
La variable independiente en esta Práctica será el tiempo de demora desde el cese de la

adaptación al estímulo test; la variable dependiente es la fuerza del efecto medida
mediante la estimación de la saturación con la que se percibe el color complementario
ilusorio (en una escala de 0 a 100). Otórguese el valor de 100 a la fuerza máxima del
efecto que sucede en la fase post-test, inmediatamente después de la adaptación.
2.3. Procedimiento de estimación
Se utilizará el procedimiento de estimación de magnitudes para estimar la fuerza del

efecto en función del tiempo trascurrido desde el cese de la adaptación. Los sujetos
estimarán en una escala de 0 a 100 la saturación del color complementario ilusorio.
2.4. Aparatos
Para la presentación de los estímulos será necesaria la utilización de proyectores o de

pantallas de ordenador o de televisión.
2.5. Procedimiento de adaptación
La secuencia temporal para conseguir el efecto es la siguiente (Power, Hausfeld & Gorta,
1981, p. 115):
1.Fase del test. Presentación previa a los sujetos experimentales del enrejado test con
el fin de comprobar que se compone de franjas verticales y horizontales blancas y
negras.
2.Fase de adaptación. Exposición de los sujetos experimentales durante diez minutos

a los enrejados adaptadores, presentando alternadamente cada enrejado durante
quince segundos cada uno (20 presentaciones de cada enrejado adaptador, 40
presentaciones en total). Se debe mirar al centro de cada imagen, pero permitiendo
que los ojos se muevan algo ya que no se requiere fijación en un punto particular
de los enrejados adaptadores.
3.Fase de post-test. Después de unos diez segundos de demora se vuelve a presentar

a los sujetos experimentales el enrejado test para apreciar el post-efecto. Las
298
franjas blancas verticales del test se perciben ahora de color verdoso y las
horizontales, de color rosa pálido.
Las siguientes instrucciones son útiles que la Práctica resulte adecuadamente realizada:
1.Lo óptimo para lograr un efecto potente es que la persona mire durante treinta
segundos cada estímulo adaptador alternadamente y ello durante veinte minutos,
aunque con diez minutos en total y quince segundos cada estimulo basta para
obtener el efecto.
2.La utilización como estímulo adaptador de dos diferentes orientaciones y colores es

un procedimiento redundante. Para obtener el efecto no son necesarios los dos
estímulos adaptadores con dos colores en franjas de orientación ortogonal. El
efecto ocurre también con franjas de un único color en una orientación
determinada. Por ejemplo, la adaptación con solo un único enrejado horizontal
verde produce que las franjas claras horizontales del estímulo test se perciban de
color rosa, mientras que las verticales se sigan percibiendo acromáticas. Se utilizan
los dos estímulos adaptadores con las franjas cromáticas en orientaciones
ortogonales para que el efecto sea más ostensible debido al contraste simultáneo
cromático (Stromeyer, 1978).
3.Para mostrar que el efecto es específico a la orientación del estímulo que se

presenta en la retina donde se produce la adaptación, se pide a los suj etos
experimentales que, en el post-test, miren el estímulo test inclinando la cabeza 45
grados (con lo que el post-efecto desaparece) o 90 grados (con lo que, ahora, el
efecto reaparece, pero las franjas claras verticales se perciben con el color rosa
pálido).
299
Figura 10.4. A.Estímulos test habituales para comprobar el efecto McCollough. (Una
cualquiera de esas dos imágenes basta como estímulo de comprobación). B.Estímulos
adaptadores para inducir el efecto. Para potenciar el efecto vía contraste simultáneo
cromático deben utilizarse ambos estímulos presentados alternadamente. Para lograr el
efecto, nótese primero que las franjas claras de cualquiera de los estímulos test son
blancas, es decir, carecen de matiz de color. Luego, mírese (sin fijar la mirada en un
punto particular) alternativamente los estímulos adaptadores durante quince segundos
cada uno (20 presentaciones de cada enrejado cromático adaptador, 40 presentaciones en
total). Finalmente mírese otra vez al estímulo test elegido. Las franjas claras verticales se
verán ahora verdosas y las horizontales, rojizas. Si se inclina la cabeza o se gira la página
45 grados, se verán las franjas claras otra vez blancas. Si la inclinación o el giro es de 90
grados, los matices de color ilusorios se intercambian. Para notar la duración del efecto,
después de la adaptación mire el estímulo test de cuando en cuando.
4.Para mostrar que el efecto es específico a un ojo (no se ha encontrado transferencia

intraocular), unos sujetos deben taparse uno de los ojos en la etapa de adaptación.
En la etapa de post-efecto, deben mirar el estímulo test con el ojo que ha sido
adaptado y se verá el post-efecto y luego con el ojo sin adaptar y entonces, el
post-efecto desaparece.
5.El efecto es relativo a la región de la retina en la que se ha proyectado el estímulo

adaptador. Es dificil, sin embargo, mostrar este hecho con un grupo de personas,
puesto que se necesitaría proyectar los estímulos adaptadores en regiones
pequeñas de la retina de cada persona. En la mayoría de los casos y puesto que el
área expuesta al estímulo es la fóvea y los ojos se mueven, el efecto aparece en
cualquier parte del estímulo test a donde se mire.
300
6.El efecto depende de la frecuencia espacial. Por ello, si se realiza la presentación
con Power Point hay que comprobar que la frecuencia espacial fundamental del
estímulo test (o de modo equivalente, la anchura de las franjas con perfil de
luminancia en forma de onda cuadrada) sea igual o parecida a la de los estímulos
adaptadores.
El directorio MATERIAL PRACTICA 10 contiene el archivo Practi que es una

presentación en PowerPoint en la que se muestran los estímulos test, los estímulos
adaptadores, las instrucciones a los sujetos, los ensayos de adaptación y finalmente, otra
vez los estímulos test para apreciar el efecto. La demostración del efecto consta de 40
presentaciones (20 presentaciones por tipo de estímulo adaptador) y cada presentación
tiene una duración de quince segundos.
A los sujetos experimentales se les impartirán las siguientes instrucciones.
[Presentación del estímulo test]
Observad esta imagen y notad que las franjas verticales y horizontales son blancas
y negras y no tienen matiz de color.
[Fase de adaptación: presentación de los estímulos adaptadores]
-Ahora vais a mirar cada una de estas imágenes durante treinta segundos, una detrás
de otra, alternativamente.
-La duración total del experimento será de unos diez minutos.
-Para evitar post-efectos indeseados en esta fase, debéis mirar al centro de cada
imagen, pero moviendo algo los ojos en torno a un círculo imaginario en la parte
central de la imagen.
[Terminada la fase de adaptación y después de unos diez segundos de demora,

presentación de nuevo del estímulo test]
-Ahora mirad lo que sucede en la imagen del principio.
-Estimad como 100 la saturación máxima del color ilusorio.
301
[Comprobación de la duración del efecto]
-Ahora a intervalos de un minuto voy a volver a presentar la imagen con franjas

blancas y negras del principio.
-En cada presentación estimad la saturación del color ilusorio respecto de la de este
en una escala de 0 a 100, siendo 100 la saturación con la que ahora veis el color
ilusorio y 0 si no percibís ningún matiz de color.
-Anotad la saturación del color ilusorio en la casilla de la columna correspondiente del

Cuadro 10.1.
[Comprobación de la larga duración del efecto]
-Cada día, al comenzar la clase, voy a volver a presentar el estímulo adaptador para
ver si a alguno de vosotros le dura el efecto.
-Si aún veis el efecto, anotad la saturación del color ilusorio en la casilla de la
columna correspondiente del Cuadro 10.2.
3.1. Descripción del efecto
Descripción concreta del efecto
Después de la exposición prolongada a enrejados con franjas verticales negras y magenta

y horizontales negras y verdes, las franjas claras verticales de un enrejado test se
perciben verdosas y las verticales, de color rojo desaturado (rosa).
Descripción del efecto en general
El efecto McCollough consiste en que, previa adaptación durante unos minutos a un

enrejado con franjas alternas negras y de color en una orientación dada, las franjas claras
de la misma orientación en un estímulo test se perciben tenuemente coloreadas con el
color complementario. Se dice que este post-efecto es contingente a la orientación porque
el particular matiz ilusorio complementario percibido en las franjas claras del estímulo
test acromático depende de la particular orientación en el estímulo adaptador.
Descripción cuando se mira inclinando la cabeza o girando el enrejado test 45°y 90°
Cuando se mira el enrejado test con la cabeza inclinada o girado 45 grados, el efecto
302
ilusorio deja de percibirse. Si se mira con la cabeza inclinada o el enrejado test girado 90
grados, ahora las franjas horizontales se perciben verdosas y las verticales, de color rosa.
Descripción del efecto al mirar el estímulo test con un ojo adaptado y con otro sin
adaptar
Con el ojo adaptado se percibe el efecto como en la condición binocular; con el ojo sin
adaptar, el efecto desaparece.
3.2. Estimación y representación gráfica de la fuerza del efecto (FE) en función del
tiempo desde el cese de la adaptación
En el Cuadro 10.1 aparece la estimación de la fuerza del efecto (en un escala de 0 a 100,
donde 100 es la fuerza del efecto inmediatamente después de la adaptación) estimado por
la persona sujeto experimental ejemplo. En la Figura 10.4 se representa la fuerza del
efecto en función del tiempo (en minutos) transcurrido desde la adaptación.
CUADRO 10.1.
Estimación de la fuerza del efecto en función de tiempo transcurrido (en minutos)

desde la adaptación
303
Figura 10.5. Fuerza del efecto McCollough en función del tiempo (en minutos)
transcurrido desde el cese de la adaptación.
En el Cuadro 10.2 aparecerá la estimación de la fuerza del efecto (en un escala de 0 a

100). En la Figura 10.5 se representará la fuerza del efecto en función del tiempo (en
días) transcurrido desde la adaptación. [Una vez realizada la estimación de la magnitud
del efecto en la Práctica, la estimación con los días se deja al estudiante].
CUADRO 10.2.
Estimación de la fuerza del efecto en función del tiempo transcurrido (en días) desde
la adaptación
304
Figura 10.6. Fuerza del efecto McCollough en función del tiempo (en días) transcurrido
desde el cese de la adaptación.
NOMBRE.......................................................................................
corresponde).
RESULTADOS [3]
Descripción del efecto [3.1]
Descripción concreta del efecto
305
Descripción del efecto en general
Descripción cuando se mira inclinando la cabeza o girando el enrejado test 45 grados y

90 grados.
Descripción del efecto al mirar el estímulo test con un ojo adaptado y con otro sin
adaptar.
306
Estimación y representación gráfica de la fuerza del efecto en función del tiempo desde el
cese de la adaptación [3.2]
Estimación de la fuerza del efecto en función de tiempo (en minutos) transcurrido

desde la adaptación
[CUADRO 10.1]
307
Fuerza del efecto McCollough en función del tiempo (en minutos) transcurrido desde el
cese de la adaptación. [FIGURA 10.5]
Estimación de la fuerza del efecto en función del tiempo (en días) transcurrido desde
la adaptación
[CUADRO 10.2]
308
Fuerza del efecto McCollough en función del tiempo (en días) desde el cese de la
adaptación. [FIGURA 10.6]
309
310
1. Introducción
1.1. Concepto de Colorimetría
Colorimetría es el conjunto de técnicas instrumentales, metodológicas y formales que se

utilizan en la medida del color considerado como sensación. Su objetivo es especificar
numéricamente el color de cualquier estímulo visual fisicamente definido. Todo estímulo
visual cromático o acromático queda caracterizado cuando se conocen sus coordenadas
en un espacio cromático basado en datos psicofisicos. A partir de ellas se pueden obtener
la longitud de onda dominante (que indica su matiz) y la pureza de excitación (que nos da
una idea aproximada de la saturación relativa de un color dentro de una escala que va
desde blanco a la longitud de onda dominante), que caracterizan numéricamente el color.
Para ello, para caracterizar fisicamente un campo de color:
1.Se calculan sus valores triestímulo X, Y, Z.
2.A partir de esos valores, se calculan sus coordenadas de cromaticidad x, y, z.
3.Se representa el estímulo en el diagrama de cromaticidad (elegimos el espacio x-y

CIE-1931).
4.[Si se cuenta con un diagrama de cromaticidad dividido en regiones de color, puede

indicarse el matiz con el que se percibe el estímulo visual].
5.A partir de las coordenadas de cromáticidad se calcula la longitud de onda

dominante, )Ld, (alt. complementaria, 2c) correspondiente.
6.A partir de esas mismas coordenadas, se calcula la pureza de excitación, pej

(colorimétrica o espectral).
1.2. Procedimiento general para caracterizar psicofísicam ente el estímulo cromático

(Wyszecki & Stiles, 1982, p. 156-164)
Sean X, Y, Z, valores triestímulo; P(a,), función de distribución espectral de la energía

radiante (o función de radiancia) de la fuente lumínica; función de radiancia de la fuente
311
lumínica que ilumina al objeto o al filtro; /1(k) función de reflectancia del objeto (p(X)) o
función de transmitancia del filtro (i(X)); x(a.), y(Á,),z(í1,), funciones de
emparejamiento, ajuste o igualación de colores del observador colorimétrico patrón CIE-
1931 (Figura 11.1 y Cuadro 11.3); y k, factor de normalización.
1.2.1. Cálculo de los valores triestímulo
Las fórmulas para el cálculo de los valores triestímulo son ligeramente diferentes para
fuentes lumínicas y para objetos o filtros.
I.Fuentes lumínicas
Los valores triestímulos X, Y, y Z para luces se calculan así:
donde k es un factor de normalización que puede ser asignado arbitrariamente.
II. Objetos o filtros
Los valores triestímulo X, Y, y Z para objetos o filtros se calculan así:
donde k es un factor de normalización que es usualmente definido como:
De modo que para un objeto difusor o transmisor perfectos (/3(7)=1), Y=100. Así pues,
312
el valor triestímulo Y indica el porcentaje de luz reflejada o transmitida por el objeto.
1.2.2. Cálculo de las coordenadas de cromaticidad
Las coordenadas de cromaticidad x, y y z se calculan así:
Figura 11.1. Funciones de igualación de colores x, y, z. Cada gráfica representa el valor

para el observador colorimétrico patrón CIE-1931 en función de la longitud de onda de la
luz monocromática, es decir, cada una de las funciones definidas por las columnas
313
correspondientes del Cuadro 11.3. La función y(A) es idéntica a la función de eficiencia
espectral lumínica para visión fotópica V(,.).
1.2.3. Diagrama de cromaticidad x-y para el observador colorimétrico patrón CIE 1931
(Figura 12.2A)
El diagrama de cromaticidad x-y CIE (1931) aparece en la Figura 11.2. La línea curva
(ver Figura 11.2 A) en forma del contorno de la puntera de la suela de un zapato es el
lugar en el que se localizan las luces monocromáticas del espectro visible (lugar del
espectro o locus espectral).
Figura 11.2. A.Diagrama de cromaticidad x-y para el observador colorimétrico patrón

CIE 1931 mostrando el locus espectral (línea curva en forma del contorno de la puntera
de la suela de un zapato) de la línea de púrpuras no espectrales (línea recta, que cierra la
curva). B.Diagrama cromaticidad en el que se han indicado a posteriori los matices de las
regiones de color.
1.2.4. Longitud de onda dominante (2a)
Según Wyszecki & Stiles (1982, pp. 175), la longitud de onda dominante de un
estímulo de color es la longitud de onda de una luz monocromática que al mezclarse con
314
un estímulo acromático particular iguala perceptivamente el estímulo de color dado.
Dado un estímulo de color cualquiera (xc, y,) en el diagrama de cromaticidad, para

encontrar gráficamente la longitud de onda dominante correspondiente, ,~d, se traza una
línea recta que une el punto acromático (xa0.33, y,=0.33) y el punto indicado por las
coordenadas de cromaticidad de nuestro color (xc, y,) y se prolonga hasta cortar en un
cierto punto a la línea del locus espectral. La longitud de onda del punto donde la línea
recta corta al locus espectral es precisamente la longitud de onda dominante ~d y las
coordenadas de cromaticidad de ese punto (xd, yd) corresponden a las coordenadas de la
longitud de onda dominante. Por ejemplo, un color con coordenadas (0.45, 0.40) tiene
como longitud de onda dominante ~d = 585 nm con coordenadas (0.54, 0.45) (véase el
ejemplo en la Figura 11.3).
Puesto que no todas las rectas con origen en el punto acromático y que pasan por un
punto cualquiera del diagrama de cromaticidad cortan el locus espectral, no todas las
luces tienen longitud de onda dominante. Una luz compuesta que tenga longitud de onda
dominante se percibe con el matiz de la luz monocromática de esa longitud de onda pero
con menor saturación, dado que las luces que están situadas en el locus espectral están
saturadas al 100%.
1.2.5. Pureza de excitación
La pureza de excitación de un estímulo de color se define como la razón de la

distancia que hay desde el estímulo cromático al punto acromático y la distancia desde la
longitud de onda dominante al punto acromático, dentro del diagrama de cromaticidad
(véase un ejemplo en Figura 11.3).
Sea (xei yc) las coordenadas de cromaticidad del estímulo de color cuya pureza de
excitación queremos calcular; (xw, yw), las coordenadas del iluminante (D65, A, B, etc)
(en esta Práctica supondremos que las coordenadas del iluminante patrón o punto
acromático son x,=0.33, y,,=0.33) y por último, (xd, yd), las coordenadas de la longitud
de onda dominante para el estímulo de color dado. La pureza de excitación, pe, se define
así:
Por ejemplo, para el color dado con coordenadas (0.45, 0.40) y longitud de onda
dominante ~d = 585nrn con coordenadas (0.54, 0.45), la pureza de excitación, pej es:
315
Otras ecuaciones para determinar la pureza de excitación (pe) (Wyszecki y Stiles,
1982 Eq. 1(3.4)) son:
Por ejemplo, para el color dado anteriormente y utilizando la primera ecuación, la

pureza de excitación, pej es:
En todas las ecuaciones anteriores la pureza de excitación puede adoptar valores entre
0 y 1. Cuanto más próximo esté el estímulo de color a la longitud de onda dominante,
más puro es el estímulo y por lo tanto, la pureza de excitación estará próxima a 1 y
viceversa.
316
1.Calcular los valores triestímulo y las coordenadas de cromaticidad de diversas

fuentes lumínicas y objetos (pétalos aislados de tres tipos de flores) (Eckert &
Carter, 2000), dadas sus respectivas funciones de distribución espectral de
radiancia (fuentes lumínicas) o sus funciones de reflectancia (objetos) utilizando el
observador colorimétrico patrón del Sistema CIE 1931.
2.Averiguar las relaciones entre algunas de esas fuentes lumínicas.
3.Representar esas luces y objetos en el diagrama de cromaticidad x-y CIE 1931 e
317
inferir su matiz.
4.En el caso de los pétalos de flores, comparar los resultados con los originales
obtenidos por Eckert & Carter (2000).
2. Método
2.1. Estímulos
Se utilizarán dos tipos de estímulos: fuentes lumínicas, caracterizadas por su función de

radiancia y objetos (pétalos aislados de flores de diferentes plantas) iluminados con el
iluminante D65 y caracterizado por su función de reflectancia espectral. La
caracterización física sigue a continuación.
Las gráficas de las funciones de radiancia, P(L), de las fuentes lumínicas L 1, L2, L3,
L4, L5 y L6 aparecen en la Figura 11.4.
La función de irradiancia, ^A), normalizada de la luz emitida por una lámpara de

filamento de tungsteno (la bombilla incandescente corriente a punto de desaparecer
sustituida por las bombillas de bajo consumo), que llamaremos fuente lumínica L7, se
muestra en la Figura 11.5 y discretizada a intervalos de 50 nm en el Cuadro 11.1. [Sin
pérdida de generalidad y por simplicidad, los valores de la irradiancia, que se refiere a
energía recibida, pueden utilizarse en esta Práctica como valores del flujo o potencia
radiante en vatios, que se refiere a energía emitida, transferida o recibida].
318
319
320
Figura 11.4. Funciones de radiancia, P(X), de las fuentes lumínicas cuyos valores
triestímulo y coordenadas de cromaticidad han de ser calculados.
321
Figura 11.5. Distribución de irradiancia espectral, P(X), normalizada de una lámpara con
filamento de tungsteno (Wyszecki y Stiles, 1982, Figura 5(1.2(.2)). En la Práctica es la
fuente lumínica J.
CUADRO 11.1.
Irradiancia * de la lámpara con filamento de tungsteno en función de la longitud de

onda discretizada a intervalos de 50 nm
II. Objetos
En la Figura 12.6 aparece la fotografía en gama de grises de las flores de un clavel

(01), una margarita (02) y una rosa (03), junto con sus pétalos aislados.
322
Figura 11.6. Fotografía de un clavel (arriba), una margarita (abajo a la izquierda) y una
rosa (abajo a la derecha), junto con sus pétalos aislados. [Eckert, M. P. & Carter, G. A.
(2000). Flowers produce variations in color saturation by arranging petals at oblique and
varying angles. Journal of the Optical Society of America A, 17, 825830. Figura 1. ©
Copyright OSA 2000. Figura reproducida con permiso]. Deliberadamente la imagen
cromática se ha reproducido en escala de grises como una imagen acromática para
eliminar los matices de color. Precisamente uno de los objetivos de la Práctica es inferir
el matiz de los pétalos aislados de cada flor a partir de sus coordenadas de cromaticidad,
conocidos el iluminante y las respectivas funciones de reflectancia de los pétalos.
En la Figura 11.7 aparecen las gráficas de las funciones de reflectancia espectral, p(

L), de los pétalos aislados del clavel (A), la margarita (B) y la rosa (C) (Eckert & Carter,
2000). En el Cuadro 11.2 aparecen los valores numéricos (aproximados) de las
reflectancias respectivas en función de la longitud de onda discretizada a intervalos de 50
nm. Para calcular sus coeficientes cromáticos, los pétalos aislados se supondrán
iluminados con el iluminante estándar D65.
323
324
Figura 11.7. Funciones de reflectancia espectral, p(7L), de un pétalo aislado de un clavel
(A), de una margarita (B) y de una rosa (C). (Eckert & Carter, 2000, figuras 4, 5, 6
(arriba)). [M.P.Eckert & G.A.Carter (2000). Flowers produce variations in color
saturation by arranging petals at oblique and varying angles. Journal of the Optical
Society of America A, 17, 825-830. Figuras 4, 5 y 6. ©Copyright OSA 2000. Figuras
reproducidas con permiso]. Las funciones que se utilizan en la Práctica corresponden a
las curvas exteriores en cada panel.
CUADRO 11.2.
Reflectancia * de pétalos aislados de flores en función de la longitud de onda

discretizada a intervalos de 50 nm
2.2. Procedimiento de cálculo de los valores triestímulo y de las coordenadas cromáticas

(Wyszecki & Stiles, 1982, p. 156-164)
2.2.1. Cálculo de los valores triestímulo
Sean X, Y, Z, los valores triestímulo; P(k), función de radiancia de la fuente lumínica;
325
S(X,), función de radiancia de la fuente lumínica que ilumina al objeto o al filtro; /3(k),
función de reflectancia del objeto (p(2)) o función de reflectancia del filtro (i(7,,)); x(Á,),
y(Á,), z(Á,), las funciones de emparejamiento o igualación del color (Cuadro 11.3); Ak
intervalo de muestreo; k, factor de normalización. Para el cálculo de los valores
triestímulo, las integrales de la Introducción se sustituyen por sumas. Así pues:
I.Fuentes lumínicas:
II. Objetos o filtros:
k es el factor de normalización definido como:
En ambos casos, las coordenadas de cromaticidad se calculan así:
326
2.2.2. Cálculo de las coordenadas de cromaticidad (procedimiento simplificado)
Puesto que AA y el factor de normalización k suelen ser constantes, no afectan a los

valores de las coordenadas de cromaticidad. Para simplificar, en el caso de las fuentes
lumínicas, se calcularán valores triestímulos modificados X', Y' y Z' así:
Y en el caso de objetos, modificados así:
De modo que ahora las coordenadas de cromaticidad x e y se calculan así:
El material auxiliar contiene un programa de Excel (CIE1931.xls) para calcular los valores
triestímulo (con el procedimiento simplificado descrito antes) y las coordenadas de
cromaticidad, con el fin de evitar operaciones tediosas a los alumnos, sobre todo cuando
el estímulo de color viene definido con una función discreta o discretizada con muchos
327
valores.
Dentro de este programa hay diferentes hojas de cálculo. En la hoja de cálculo

etiquetada como CIE, la columna A contiene la longitud de onda en nm. La columna B,
etiquetada como "Potencia", ha de contener los valores de la función de distribución
espectral de la energía radiante de la fuente lumínica o del iluminante para cada longitud
de onda y ha de ser rellenada por el alumno. Los valores son directamente los de P(2) en
el caso de fuentes lumínicas o S(A) cuando la fuente lumínica actúa como iluminante. La
columna C etiquetada como "Reflectancia" ha de contener los valores de la reflectancia
del objeto, cuando sea pertinente. Cuando se trata de fuentes lumínicas, todos sus
valores son idénticamente iguales de la unidad. Cuando se trata de objetos, debe ser
rellenada con los valores correspondientes de la función de reflectancia. En la columna D
se calculan los valores de la función de distribución espectral de la energía radiante
("Energía") que llega a los ojos del observador. En las siguientes columnas aparecen
sucesivamente los valores triestímulo (E, F y G) para cada longitud de onda y el
producto de la energía por esos valores (H, I y J). En la parte inferior aparecen
calculadas las coordenadas de cromaticidad y a la derecha, la representación gráfica de la
fuente lumínica o del objeto en el diagrama de cromaticidad x-y CIE 1931 (véase la
Figura 11.2).
El papel del experimentador en esta Prácticas se limita a guiar a los alumnos en los
difentes cálculos a realizar.
CUADRO 11.3.
Funciones de igualación del color z(7L)) del observador colorimétrico patrón CIE
1931 y funciones de respuesta cromática -b(r(,)-g( a intervalos de 5 nm
328
329
3.1. Cálculo de los valores triestímulo modificados y de las coordenadas de cromaticidad
En los Cuadros 11.4 y 11.5 se muestran los resultados del cálculo de los valores
triestímulo simplificados para la fuente lumínica L1 y el pétalo de clavel,
respectivamente, así como la longitud de onda dominante y la predicción de su color.
CUADRO 11.4.
330
Valores triestímulo modificados, coordenadas de cromaticidad y matiz de lafuente
lumínica L1
II. Objetos
CUADRO 11.5.
Valores triestímulo modificados, coordenadas de cromaticidad y matiz del objeto Ol
3.2. Relaciones entre algunas de las fuentes lumínicas
El cálculo de valores triestímulo permite comparar fuentes lumínicas entre sí. Como
ejercicio:
a)Compárense las fuentes lumínicas C y D.
b)Indíquese la relación entre las fuentes lumínicas E y F.
3.3. Representación de esas luces y objetos en el diagrama de cromaticidad CIE 1931 e

inferencia de su color
331
En la Figura 11.8 se representa el locus espectral para el observador colorimétrico patrón
CIE 1931, así como la localización de la fuente lumínica L1 y del objeto 01 (pétalo del
clavel) en el diagrama cromático.
Figura 11.8. Representación en el diagrama cromático x-y CIE 1931 de la fuente

lumínica L1 (círculo blanco) y del objeto 01 (círculo rosa) utilizados en la Práctica.
3.4. Comparación con los resultados originales obtenidos por Eckert & Carter (2000) en
el caso de pétalos de flores
Las coordenadas de cromaticidad del objeto 01 (pétalo del clavel) coincide con los
resultados de Eckert & Carter (2000) (Figura 11.9 A). La predicción del matiz de color a
partir de su representación en el diagrama de cromaticidad CIE 1931 (rosa claro)
332
coincide con la experiencia fenoménica (Figura 11.9 B).
333
Figura 11.9. A.Coordenadas de cromaticidad (rombos) de los pétalos aislados (iluminante
D65) en el diagrama de cromaticidad x-y CIE 1931. B.Las flores y los pétalos de la
Figura 11.6 en color. [Eckert, M. P. & Carter, G. A. (2000). Flowers produce variations
in color saturation by arranging petals at oblique and varying angles. lournal of the
Optical Society of America A, 17, 825-830. Figuras 1 y 7. © Copyright OSA 2000.
Figuras reproducidas con permiso].
NOMBRE.......................................................................................
corresponde).
RESULTADOS [3]
334
Cálculo de los valores triestímulo modificados y de las coordenadas de cromaticidad
[3.1]
Valores triestímulo modificados, coordenadas de cromaticidad y color de las fuentes

lumínicas
[CUADRO 11.4]
II. Objetos
335
Valores triestímulo modificados, coordenadas de cromaticidad y matiz de los objetos
[CUADRO 11.5]
Relaciones entre algunas fuentes lumínicas [3.2]
Representación de esas luces y objetos en el diagrama de cromaticidad CIE 1931 e

inferencia de su color [3.3]
336
Representación en el diagrama cromático x-y CIE 1931 de las fuente lumínicas (círculos)
y de los objetos (triángulos) utilizados en la Práctica. [FIGURA 11.81
Comparación con los resultados originales obtenidos por Eckert & Carter (2000) en el
caso de pétalos de flores [3.4]
337
338
A.Coordenadas de cromaticidad (rombos) de los pétalos aislados (iluminados con D65)
en el diagrama de cromaticidad x-y CIE 1931. B.Las flores y los pétalos en color.
[Eckert, M. P. & Carter, G. A. (2000). Flowers produce variations in color saturation by
arranging petals at oblique and varying angles. Journal of the Optical Society of America
A, 17, 825-830. Figuras 1 y 7 © Copyright OSA 2000.Figuras reproducidas con
permiso]. [FIGURA 11.91
339
340
341
Funciones de radiancia, P(2,), de las fuentes lumínicas cuyos valores triestímulo y
coordenadas de cromaticidad han de ser calculados. [FIGURA 11.4]
Fuente lumínica Ll
342
x=
Y=
Fuente lumínica L2
x=
Fuente lumínica L3
x=
Fuente lumínica L4
343
x=
Y=
Fuente lumínica L5
x=
Fuente lumínica L6
x=
Fuente lumínica L5+ L6
344
x=
Y=
Fuente lumínica L7: Lámpara incandescente de tungsteno 200 W Osram (bombilla

incandescente). Función de irradiancia en la Figura 11.5.
Distribución de irradiancia espectral, P(A), normalizada de una lámpara con filamento de

tungsteno (Wyszecki y Stiles, 1982, Figura 5(1.2(.2». En la Práctica iluminante L7).
345
[Figura 11.5]
Irradiancia * de la lámpara con filamento de tungsteno en función de la longitud de

[CUADRO 11.1]
Fuente lumínica L7
x=
II. Objetos
Objeto 01: pétalo de un clavel.
346
Funciones de reflectancia, p(a,), de los pétalos de un clavel. La función que se utiliza en
la Práctica es la correspondiente a la curva exterior [Eckert, M. P. & Carter, G. A.
varying angles. Journal of the Optical Society of America A, 17, 825-830. Figura 4. ©
Copyright OSA 2000. Figura reproducida con permiso]. [Figura 11.7A]
Reflectancia * del pétalo aislado de un clavel en función de la longitud de onda

[CUADRO 11.2A]
x=
347
Objeto 02: pétalo de una margarita.
Funciones de reflectancia, p(),), de los pétalos de una margarita. La función que se utiliza
en la Práctica es la correspondiente a la curva discontinua exterior [Eckert, M. P. &
Carter, G. A. (2000). Flowers produce variations in color saturation by arranging petals at
oblique and varying angles. Journal of the Optical Society of America A, 17, 825-830.
Figura 5. © Copyright OSA 2000. Figura reproducida con permiso]. [FIGURA 11
Reflectancia * del pétalo aislado de una margarita en función de la longitud de onda

[CUADRO 11.2B]
348
x=
Y-
Objeto 03: pétalo de una rosa.
Funciones de reflectancia, p(a,), de los pétalos de una rosa. La función que se utiliza en
la Práctica es la correspondiente a la curva discontinua exterior. [Eckert, M. P. & Carter,
G. A. (2000). Flowers produce variations in color saturation by arranging petals at
Figura 6. Copyright OSA 2000. Figura reproducida con permiso]. [Figura 11.7C]
Reflectancia* del pétalo aislado de una rosa en función de la longitud de onda

[CUADRO 11.2C]
349
x=
Y=
350
351
1. Introducción
1.1. Apariencia de color y Teoría de Procesos Oponentes
Apariencia de color es el aspecto de la percepción visual por el que una persona es capaz
de asignar atributos perceptivos (matiz, saturación, brillo y claridad) a cualquier estímulo
visual dado, presentado en el campo visual de la persona (Wyszecki, 1986). La teoría
tricromática (Young, 1802; Helmholtz, 1859-1867) explica muchos de los fenómenos
conocidos de la apariencia del color. Sin embargo, fenómenos como los post-efectos
cromáticos (el efecto McCullough, por ejemplo) no pueden ser explicados por esa teoría.
Una teoría de la percepción del color que solventa los problemas de la teoría tricromática
y explica fenómenos visuales no explicados por ella es la Teoría de Procesos Oponentes
(Hering, 1878; Hurvich y Jameson, 1955, 1974; Jameson y Hurvich, 1955; véase
Hurvich, 1981, cap. 5).
La Teoría de Procesos Oponentes postula que el SVH, por lo que respecta a la

percepción del color, se compone de tres canales o mecanismos bipolares u oponentes,
uno acromático o de luminancia (W/Bl) y dos cromáticos (R/G, Y/B), compuesto cada
uno por dos partes antagonistas y caracterizados por sus respectivas funciones de
respuestas acromáticas (w(7L) - bl(),)) y cromáticas r(A) - g(íL), y(a) - b(a)) (Figura
12.1 y Cuadro 11.3 de la Práctica 11).
352
Figura 12.1. Funciones de respuesta de los mecanismos cromáticos rojo-verde (gráfica
rojo-verde) y amarillo-azul (gráfica amarillo-azul) y acromático (línea blanca). La
respuesta (o valencia) cromática de cada mecanismo (Cuadro 11.3 de la Práctica #11
columnas y(X)-b(),)y- se ha representado en función de la longitud de onda de la luz.
1.2. Procedimiento general para determinar la apariencia de color
Conocida la composición espectral de la luz que llega al ojo del observador procedente de
un estímulo visual cualquiera (E(Á)) y las respectivas funciones de respuesta cromática,
es posible predecir a ciegas el color con el que se verá ese estímulo. Para ello basta
suponer (Hurvich, 1981, p. 66) que:
iii.Las funciones de respuesta cromática y acromática representan el modo en el que

los mecanismos neuronales responden a la composición espectral del estímulo
visual.
üi.Los mecanismos oponentes se comportan de modo lineal, es decir, la respuesta de

cada mecanismo oponente a un estímulo de color compuesto por luces
monocromáticas de diferentes longitudes de onda, E(2), es la suma de las
respuestas del mecanismo a cada longitud de onda por separado:
353
donde RRIG, RyB y RWB1 son las respectivas respuestas cromáticas y
acromáticas.
iii. Las respuestas de estos mecanismos correlacionan directamente con la percepción

cromática y acromática.
Los coeficientes cromáticos que permiten relacionar las respuestas de los mecanismos
oponentes cromáticos con la percepción (apariencia) del matiz de color, se definen así:
donde las barras indican valor absoluto. El coeficiente de saturación (Hurvich, 1981, p.
79) es:
Los coeficientes cromáticos normalizan las respuestas cromáticas e indican las

cantidades (en proporciones o porcentajes) de sensación de rojo o verde (CRic) y de
amarillo o azul (() elicitadas por el estímulo visual. El coeficiente de saturación relaciona
las respuestas cromáticas y la acromática. Por ello, para predecir a ciegas la apariencia de
color de un estímulo visual, bastará con calcular la respuesta al estímulo visual de cada
mecanismo oponente y el valor de los coeficientes cromáticos y de saturación
correspondientes.
354
1.Calcular la respuesta de cada mecanismo oponente y sus respectivos coeficientes

cromáticos para una selección de luces y objetos.
2.Predecir la apariencia de color (matiz y saturación) de las luces y objetos dados.
2. Método
2.1. Estímulos
Se utilizarán los mismos dos tipos de estímulos que en la Práctica 11: luces,
caracterizadas por su función de radiancia y objetos (pétalos aislados de diferentes de
flores de distintas plantas) iluminados con el iluminante D65 y caracterizados por sus
funciones de reflectancia espectral.
Las gráficas de funciones de radiancia, P(Á), de las fuentes lumínicas L1, L2, L3,
L4, L5 y L6 aparecen en la Figura 12.2 (idénticas a las utilizadas en la Práctica #11).
355
Figura 12.2. Funciones de radiancia, P( de las fuentes lumínicas cuyos coeficientes
cromáticos han de ser calculados con el fin de inferir su apariencia cromática.
La función de irradiancia, P(,2), normalizada de la luz emitida por una lámpara de

filamento de tungsteno (la bombilla incandescente corriente a punto de desaparecer
sustituida por las bombillas de bajo consumo), que llamaremos L7, se muestra en la
Figura 12.3 y en el Cuadro 12.1. [Sin pérdida de generalidad y por simplicidad, los
valores de la irradiancia, que se refiere a energía recibida, pueden utilizarse en esta
Práctica (al igual que en la Práctica #11) como valores del flujo o potencia radiante en
vatios, que se refiere a energía emitida, transferida o recibida].
Figura 12.3. Distribución de irradiancia espectral, P(}), normalizada de una lámpara con
filamento de tungsteno (Wyszecki y Stiles, 1982, Figura 5(1.2.2)). En la Práctica es la
fuente lumínica J.
CUADRO 12.1.
Irradiancia * de una lámpara con filamento de tungsteno en función de la longitud de
356
II. Objetos
En la Figura 12.4 aparece la fotografía en gama de grises de las flores de un clavel

(01), una margarita (02) y una rosa (03), junto con sus pétalos aislados.
Figura 12.4. Clavel (arriba), margarita (abajo a la izquierda) y rosa (abajo a la derecha),
junto con sus pétalos aislados. [Eckert, M. P. & Carter, G. A. (2000). Flowers produce
variations in color saturation by arranging petals at oblique and varying angles. Journal of
the Optical Society of America A, 17, 825-830. Figura 1. © Copyright OSA 2000. Figura
reproducida con permiso]. Deliberadamente la imagen cromática se ha reproducido como
una imagen acromática para eliminar sus matices de color. Precisamente, uno de los
357
objetivos de esta Práctica es inferir el matiz color de los pétalos a partir de sus
coeficientes cromáticos, conocidos el iluminante y las respectivas funciones de
reflectancia.
En la Figura 12.5 aparecen las gráficas de funciones de reflectancia espectral, p(Á),

de los pétalos aislados del clavel (A), la margarita (B) y la rosa (C) (Eckert & Carter,
2000) (idénticos a los objetos utilizados en la Práctica #11). En el Cuadro 12.2 aparecen
los valores numéricos (aproximados) de las reflectancias respectivas en función de la
longitud de onda discretizada a intervalos de 50 nm. Para calcular sus coeficientes
cromáticos, los pétalos aislados se supondrán iluminados con el iluminante estándar D65.
Figura 12.5. Funciones de reflectancia espectral, p(2.), de un pétalo aislado de un clavel

(A), de una margarita (B) y de una rosa (C). (Eckert & Carter, 2000, figuras 4, 5, 6
(arriba)). [Eckert, M. P. & Carter, G. A. (2000). Flowers produce variations in color
Society of America A, 17, 825-830. Figuras 4, 5, 6. © Copyright OSA 2000. Figuras
reproducidas con permiso]. Las funciones que se utilizan en la Práctica corresponden a
las curvas exteriores en cada panel.
CUADRO 12.2.
Reflectancia * de pétalos aislados de flores en función de la longitud de onda

2.2. Procedimiento de cálculo de los coeficientes cromáticos
358
El procedimiento general para calcular los coeficientes cromáticos es el siguiente:
1. Cálculo de la respuesta de cada mecanismo oponente (las integrales de la

Introducción se sustituyen por sumas):
donde E(X), que ha de ser calculada de antemano, es la composición espectral de

la luz que llega al ojo del observador, sea emitida por una fuen te, reflejada por un
objeto, transmitida por un filtro o una combinación de esas tres situaciones.
Recuerde que E(2) es idéntica a P(2) en el caso de fuentes lumínicas y a S(2)p(2)
en el caso de objetos donde S( es la fde de la energía radiante del iluminante y
p(%,) es la función de reflectancia del objeto. Supuesto que AX es constante (lo
que es el caso) puede eliminarse de los cálculos.
De un modo muy simple, si los valores triestímulo son conocidos de antemano,

las respuestas de los mecanismos oponentes se pueden calcular del siguiente modo:
donde X',Y' y Z' son los valores triestímulos modificados (ver Capítulo 11,
apartado 2.2.2).
2. Cálculo de los respectivos coeficientes cromáticos y de saturación:
359
Supóngase que para un determinado campo de color, RRIG 0.263, RYB 0.018,
Rw/Bf 1.566; entonces CR,G 0.935, CY/B=0.064, C5 0.152 y, por tanto, ese campo de
color elicita la percepción de 93.5% de rojo, 6.4% de amarillo y con 15.2% de
saturación, es decir, se percibe rojo muy claro o rosa claro.
El material auxiliar contiene un programa de Excel (CIE1931.xls) para calcular los valores
de las respuestas cromáticas y acromática y los coeficientes cromáticos y acromático,
con el fin de evitar operaciones tediosas a los alumnos, sobre todo cuando el estímulo de
color viene definido con una función discreta o discretizada con muchos valores.
En la hoja de cálculo etiquetada como CIE, la columna A contiene la longitud de onda

en nm. La columna B, etiquetada como "Potencia", ha de contener los valores de la
función de distribución espectral de la energía radiante de la fuente lumínica o del
iluminante para cada longitud de onda y ha de ser rellenada por el alumno. Los valores
son directamente los de P(2) en el caso de fuentes lumínicas o S(A) cuando la fuente
360
lumínica actúa como iluminante. La columna C, etiquetada como "Reflectancia", ha de
contener lo valores de la reflectancia del objeto. Cuando se trata de fuentes lumínicas,
todos sus valores son idénticamente iguales de la unidad. Cuando se trata de objetos,
debe ser rellenada con los valores correspondientes de la función de reflectancia. En la
columna D se calculan los valores de la función de distribución espectral de la energía
radiante ("Energía") que llega a los ojos del observador. En las columnas P, Q y R
aparecen sucesivamente los valores de la valencia para cada longitud de onda y para cada
uno de los tres mecanismos oponentes y-b, r-g, w-bl, respectivamente, y en las columnas
K, L y M, el producto de la energía por esos valores para cada longitud de onda. En la
parte inferior aparecen calculados los valores de las respuestas cromáticas y acromática
indicadas con los respectivos símbolos en color, así como los valores de los coeficientes
cromáticos y acromático.
La labor del experimentador en esta Práctica se reduce a guiar a los alumnos en los
difentes cálculos a realizar.
3.1. Cálculo de las respuestas de los mecanismos oponentes y de los coeficientes

cromáticos
3.2. Predicción de la apariencia de color
CUADRO 12.1.
Respuestas de los mecanismos oponentes, coeficientes cromáticos y matiz de la

fuente lumínica L1
361
II. Objetos
CUADRO 12.2.
Respuestas de los mecanismos oponentes, coeficientes cromáticos y matiz del objeto

01
Compruébese el matiz de color predicho por la teoría de Procesos Oponentes con el

matiz del objeto (pétalo del clavel) en la Figura 12.6.
La predicción de la apariencia color del objeto 01 (pétalo de clavel) a partir de la

Teoría de Procesos Oponentes (rosa claro) coincide con la experiencia fenoménica
(Figura 12.6).
362
Figura 12.6. Las flores y los pétalos de la Figura 12.4 en color. [Eckert, M. P. & Carter,
Figura 1. © Copyright OSA 2000. Figura reproducida con permiso].
NOMBRE.......................................................................................
corresponde).
RESULTADOS [3]
Cálculo de las respuestas de los mecanismos oponentes y de los coeficientes cromáticos

[3.1] y
Predicción de la apariencia de color [3.2]
363
donde E es la composición espectral de la luz que llega al ojo del observador. Los
coeficientes cromáticos y el coeficiente de saturación son:
1. Fuentes lumínicas
Respuestas de los mecanismos oponentes, coeficientes cromáticos y color de las

fuentes lumínicas
[CUADRO 12.1]
364
II. Objetos
Respuestas de los mecanismos oponentes, coeficientes cromáticos y color de los

objetos
[CUADRO 12.2]
1. Fuentes lumínicas
365
366
Funciones de radiancia, P(A), de las fuentes lumínicas cuyos coeficientes cromáticos han
de ser calculados con el fin de inferir su apariencia cromática. [FIGURA 12.2]
Cálculo de la respuesta de cada mecanismo y de los coeficientes cromáticos
Fuente lumínica Ll
367
Fuente lumínica L2
Fuente lumínica L3
368
Fuente lumínica L4
Fuente lumínica L5
369
Fuente lumínica L6
Fuente lumínica L7: Lámpara incandescente de tungsteno 200 W Osram (bombilla

incandescente). Función de irradiancia.
370
Distribución de irradiancia espectral, P(A), normalizada de una lámpara con filamento de
tungsteno (Wyszecki y Stiles, 1982, Figura 5(1.2.2)). En la Práctica es la fuente lumínica
J. [FIGURA 12.3]
Irradiancia * de una lámpara con filamento de tungsteno en función de la longitud de

[CUADRO 12.1]
371
II. Objetos
Objeto 01: pétalo de un clavel.
372
Funciones de reflectancia, p(A), de los pétalos de un clavel. La función que se utiliza en
la Práctica es la correspondiente a la curva exterior. [Eckert, M. P. & Carter, G. A.
varying angles. Journal of the Optical Society of America A, 17, 825-830. Figura 4. ©
Copyright OSA 2000. Figura reproducida con permiso]. [FIGURA 12.5A]
Reflectancia * del pétalo aislado de un clavel en función de la longitud de onda

[CUADRO 12.2A]
373
Objeto 02: pétalo de una margarita.
Funciones de reflectancia, p(7L), de los pétalos de una margarita. La función que se

utiliza en la Práctica es la correspondiente a la curva discontinua exterior. [Figura
reimpresa de Eckert, M. P. & Carter, G. A. (2000). Flowers produce variations in color
Society of America A, 17, 825-830. Figura 5. © Copyright OSA 2000. Figura
reproducida con permiso]. [FIGURA 12.5B]
Reflectancia * del pétalo aislado de una margarita en función de la longitud de onda

[CUADRO 12.2B]
374
Objeto 03: pétalo de una rosa.
375
Funciones de reflectancia, pOL) de los pétalos de una rosa. La función que se utiliza en
la Práctica es la correspondiente a la curva discontinua exterior. [Eckert, M. P. & Carter,
Figura 6. © Copyright OSA 2000. Figura reproducida con permiso]. [FIGURA 12.5C]
Reflectancia* del pétalo aislado de una rosa en función de la longitud de onda

[CUADRO 11.2C]
376
377
378
1. Introducción
1.1. La Función de Sensibilidad al Contraste espacial (FSCe-1D)
La Agudeza Visual humana (AV), en miri-', en ciclos por grado de ángulo visual (c/gav),
o en dioptrías, es una medida de la capacidad del Sistema Visual Humano (SVH) para
percibir los detalles de alto contraste que existen en las imágenes. Normalmente esa
medida basta para caracterizar la función visual y sus posibles déficits. A veces, sin
embargo, es necesario conocer la capacidad del SVH para percibir características
espaciales en otros tamaños o escalas y en todo el rango de contrastes, es decir, la
capacidad de percibir otras características espaciales además de los detalles. Así por
ejemplo, en un día de niebla en el que el entorno se ve difuminado, los detalles de una
escena son irrelevantes, mientras que lo importante son los grandes objetos presentes en
ella. La medida que nos aporta información acerca de la capacidad (o rendimiento) del
SVH para percibir objetos en diferentes escalas y tamaños es la Función de Sensibilidad
al Contraste espacial (FSCe).
La FSCe-ID de enrejados sinusoidales expresa la sensibilidad al contraste (esto es, el

recíproco del umbral de contraste) de cada enrejado sinusoidal en función de la
frecuencia espacial del enrejado, manteniendo fijas la orientación y la posición del
enrejado en la retina (Campbell & Robson, 1968). Aunque técnicamente su obtención es
algo complicada, la medida de la FSCe es conceptualmente simple: para obtener la FSCe
primero se determinan experimentalmente los umbrales de contraste de enrejados
sinusoidales de diferentes frecuencias espaciales, luego se calcula para cada uno la
respectiva Sensibilidad al Contraste (SC) (recíproco del umbral de contraste) y
finalmente se ajusta una función a esos datos de SC (véase la Figura 13.1). De modo
análogo a la Curva de Audibilidad, la FSCe es propia de cada persona y en ella se
reflejarán los posibles déficits visuales, tanto los de origen meramente óptico como los
379
causados por disfunciones del sistema retina+córtex.
Figura 13.1. Funciones de Sensibilidad al Contraste espacial (FSCe-1D) (líneas curvas

continuas) de dos personas adultas con visión normal (IS y GB). Los estímulos visuales
utilizados fueron enrejados sinusoidales con 902 de orientación ventaneados
espacialmente con una gaussiana 2D isotrópica (funciones de Gabor 2D) y 15 cd/m2 de
380
luminancia media. Los umbrales de contraste, con los que se obtuvo la Sensibilidad al
contraste (círculos) fueron determinados mediante escaleras adaptativas Bayesianas y
una tarea 2AFC con presentación temporal. La línea curva continua de cada panel
corresponde a la FSCe ajustada a los datos experimentales mediante el criterio de
mínimos cuadrados. La función genérica utilizada para el ajuste es SC(u)=buexp(-au),
siendo SC, la sensibilidad al contraste, u la frecuencia espacial del enrejado en c/gav y a
y b parámetros que hay que determinar mediante regresión no lineal (utilizando, en este
caso, métodos de minimización numérica) a partir de los datos experimentales.
[Resultados adaptados de Serrano-Pedraza (2005) y Serrano-Pedraza & V.Sierra-
Vázquez (2006). The effect of white-noise mask leve) on sinewave contrast detection
thresholds and the critical-band-masking model. Spanish Journal of Psychology, 9, 249-
262. Figura 3].
La FSCe típica del ser humano adulto con visión normal tiene una forma
cualitativamente similar a las respectivas FSCs típicas de bebés de diferentes edades
(Figura 13.2) o a las de otras especies animales (Figura 13.3), aunque difiere de ellas en
parámetros tales como la agudeza visual, el rango de frecuencias espaciales de los
enrejados visibles o la frecuencia espacial del enrejado sinusoidal al que se es más
sensible.
381
Figura 13.2. A.Sensibilidad al contraste de bebés de 1, 2 y 3 meses (símbolos) y sus
correspondientes FSCe-1D (líneas poligonales). B.FSCe para una persona adulta
obtenida en las mismas condiciones experimentales que las de los bebés. (La línea curva
discontinua representa una extrapolación ideal de la FSC estándar de un adulto obtenida
en condiciones experimentales similares). [Banks, M. S., Salapatek, P. (1978). Acuity
and contrast sensitivity in 1-, 2-, 3-month-old human infants. Investigative OphtaImology
and Visual Science, 17, 362-365. Figuras 1 y 2. Figuras reproducida con permiso ©
Copyright ARVO 1978.1.
382
Figura 13.3. Sensibilidad al Contraste relativa para diferentes especies animales
(símbolos) y sus correspondientes FSCe-1 D (líneas poligonales). Para cada especie, los
datos han sido normalizados de modo que la máxima SC sea igual a la unidad en la
frecuencia espacial en la que la sensibilidad es máxima. Nótese la forma cualitativamente
similar de las FSCs a pesar de su desplazamiento en el eje de la frecuencia espacial.
Datos de Northmore & Dvorak (1979) (carpa dorada), Blake et al. (1974) (gato), Jacobs
(1974) (mono nocturno), De Valois et al. (1974) (macaco), Fox et al. (1976) (halcón).
1.Medir los umbrales de contraste para enrejados sinusoidales de diferentes

frecuencias espaciales.
2.Calcular la SC para cada frecuencia espacial.
3.Representar gráficamente la SC en función de la frecuencia espacial del enrejado y

determinar la propia FSCe-1D.
4.Comparar los resultados con la FSCe estándar de una persona adulta con visión
383
normal.
5.Comparar los resultados con los obtenidos en bebés.
6.Comparar los resultados con los obtenidos en otras especies animales.
2. Método
El sujeto realizará un experimento visual de detección de enrejados sinusoidales con

franjas horizontales que varían en su frecuencia espacial.
2.1. Estímulos
Los estímulos visuales que se utilizarán son imágenes de enrejados sinusoidales

horizontales ventaneados espacialmente con una función gaussiana 2D (es decir,
físicamente funciones de Gabor) (Figura 13.4). Se utilizarán siete frecuencias espaciales
(2, 4, 8, 16, 32, 64 y 128) expresadas en ciclos por imagen (c/i), ya que la frecuencia
espacial en c/gav particular de cada función de Gabor dependerá del tamaño concreto de
las imágenes presentadas y de la distancia del sujeto experimental a la pantalla en la que
se presenten. El nivel de gris medio de todos los enrejados es 128 (la luminancia media
en cd/m2 dependerá en cada caso de la intensidad lumínica del sistema de presentación).
Figura 13.4. Muestras de imágenes de enrejados sinusoidales utilizadas como estímulos

visuales en la Práctica. Todos los enrejados se han generado con el máximo de contraste.
Los enrejados de 32 c/i, 64 c/i y de 128 c/i son apenas visibles en esta figura.
2.2. Procedimiento
Para la obtención experimental de los umbrales de contraste se utilizará el método de los

límites con escalas o series descendentes con una tarea SINO. Aunque son conocidas las
limitaciones del método con esta tarea (por ejemplo, la falta de control del criterio de
respuesta del observador), se utilizará este método porque permite una medida rápida del
valor del umbral.
Para la determinación del umbral de contraste de cada uno de los enrejados, estos se
presentarán en tres escalas descendentes de quince pasos cada una, disminuyendo el
384
contraste con relación al anterior (contraste en unidades logarítmicas (logia)) en 0.2
unidades logarítmicas: 0,-0.2,-0.4,-0.6,-0.8,-1,-1.2, -1.4,-1.6,-1.8,-2.0,-2.2,-2.4,
-2.6,-2.8). Cada presentación tendrá una duración de 1 segundo. Antes y después de
cada presentación aparecerá ruido blanco visual (luminancia con fdp Gaussiana) durante
1 segundo, cuyo objetivo es eliminar posibles post-efectos de contraste.
2.3. Tarea
El sujeto tiene que contar el número de presentaciones en las que percibe las franjas
horizontales para cada enrejado sinusoidal con la misma frecuencia espacial.
En esta Práctica se utilizarán siete archivos con extensión avi (uno para cada frecuencia
espacial), suponiendo además que el dispositivo de presentación de imágenes no está
calibrado. La calibración de la luminancia de las imágenes de enrejados se ha realizado
con el mismo procedimiento descrito en la Práctica #3, §2.4 y §2.5.
Cada archivo contiene una serie descendente de quince pasos o presentaciones del
enrejado sinusoidal con la frecuencia espacial indicada en su nombre y cuyo contraste va
disminuyendo con los valores enumerados en §2.2. Cada presentación está separada por
una imagen de ruido blanco. Cada serie (es decir, cada archivo avi) será presentada tres
veces. En cada serie, el experimentador indicará a los sujetos la frecuencia espacial
correspondiente para que recojan los datos en la columna adecuada del Cuadro 13.1.
El directorio MATERIAL PRACTICA 13 contiene dos subdirectorios, PRACTICA

13_IMAGENES y PRACTICA13_EXPERIMENTO, con el siguiente contenido:
1.El subdirectorio PRACTICAI3_IMAGENES contiene siete imágenes enrejado) con

extensión pcx de enrejados sinusoidales con fre cuencias 2, 3, 8, 16, 32 y 124
ciclos por imagen (c/i) respectivamente y con el máximo contraste (m=1).
2.El subdirectorio PRACTICA I3_EXPERIMENTO contiene siete archivos con

extensión .avi correspondientes al experimento:
a) Práctical3esp2.avi
b) Práctical3esp4.avi
385
c) Práctical3esp8.avi
d) Práctical3esp16.avi
e) Práctical3esp32.avi
Práctical3 esp64.avi
g) Práctical3esp128.avi
El experimentador impartirá a los sujetos experimentales las siguientes instrucciones:
-Estos son los estímulos que hay que detectar. [Elexperimentador presenta las
imágenes contenidas en el subdirectorio PRACTICA13
-A continuación, veréis series descendentes compuestas por quince presentaciones de

imágenes que son enrejados sinusoidales de diferentes frecuencias espaciales que
van disminuyendo de contraste en cada presentación.
-Para cada enrejado de una determinada frecuencia espacial hay tres series de quince
presentaciones cada una.
- En cada serie vuestra tarea consiste en indicar las presentaciones en las que veis
cada enrejado e indicarlo con una cruz en la casilla correspondiente del Cuadro
13.1 de la hoja de respuestas.
-¿Estáis todos preparados?
-Empezamos. [El experimentador presenta cada serie de Práctica]3frecesp *.avi tres

veces, indicando a los sujetos experimentales la frecuencia espacial del enrejado de
la serie a fin de recoger los datos en las columnas correspondientes del Cuadro
13.1].
2.7. Elaboración y análisis de los resultados
El punto de transición de cada serie o columna (PT), es decir, el umbral de contraste de

la serie s para una determinada frecuencia espacial k, se obtiene tomando el valor del
contraste de la última presentación que es detectada, digamos i, y de la siguiente que no
es detectada, digamos i+l. Puesto que el contraste viene dado en unidades logarítmicas
(logiom), primero se ha de obtener el contraste físico (m) y luego el valor medio (PT); es
386
decir:
donde PT(k, s) es el punto de transición o umbral de contraste de la frecuencias espacial

k en la serie s; logiomi, contraste de la última presentación que es detectada, i, en
unidades logarítmicas; y logiom;+,, contraste de la siguiente presentación, en unidades
logarítmicas.
El umbral de contraste de cada frecuencia espacial, k, es la media aritmética de los

PT de las tres series por frecuencia; es decir:
El experimentador, una vez obtenido el umbral de contraste para cada frecuencia

espacial k en ciclos por anchura de la imagen (c/i) y para cada sujeto experimental, tiene
que calcular la sensibilidad al contraste (S(). Para ello basta con calcular el recíproco del
umbral de contraste para cada frecuencia espacial. Si se desea comparar los propios
datos con los de otros, es preciso transformar la frecuencia espacial original de c/i (k) a
c/gav y reescalar la abscisa de la gráfica en c/gav (u). Esa transformación depende, a la
vez, de la frecuencia espacial k en c/i de la imagen utilizada como estímulo visual, de la
longitud l del lado vertical de la imagen en la pantalla de presentación y de la distancia d
del sujeto experimental a la pantalla de presentación. (¡Cuidado: l y d deben expresarse
en las mismas unidades de longitud!). La frecuencia espacial u, en c/gav, correspondiente
a la frecuencia espacial k, en c/i, es:
donde a es el ángulo visual en grados subtendido por cualquiera de los lados de la imagen
(cuadrada) de la pantalla de presentación. [Atención: La función arco tangente (are tg,
arctan o tan) tiene que devolver el ángulo en grados; si lo devuelve en radianes hay que
hacer la conversión a grados].
En la Figura 13.5 aparecen resultados estándar para una persona adulta con visión
normal Figura 13.5A), así como la posibilidad de comprobar de modo inmediato la forma
aproximada de la propia FSCe-ID (Figura 13.5B). Con visión normal o corregida, una
387
forma parecida a la curva de la Figura 13.5A debe ser obtenida con los datos
experimentales si al reescalar los c/i en c/gav resulta, por su rango, una escala comparable
a la de estas gráficas.
388
Figura 13.5. La Función de Sensibilidad al Contraste espacial (FSCe-1D) humana. A.
Sensibilidad al Contraste (círculos) y FSCe-1D de una persona adjulta con visión normal
(línea curva continua). La Sensibilidad al Contraste de enrejados sinusoidales (i.e., el
recíproco del umbral de contraste obtenido experimentalmente) y la FSCe-1D se han
representado, en escala log-log, en función de la frecuencia espacial del enrejado
sinusoidal (La=500 cd/m2). [Campbell, F. W., Maffei, L. (1974). Contrast and spatial
frequency. Scientific American, Noviembre. p. 111. Figura reproducida con permiso ©
1974 Scientific American, Inc. Todos los derechos reservados].B. Demostración
inmediata de la forma de la propia Función de Sensibilidad al Contraste en escala log-log.
[Imagen original de I. Serrano Pedraza y V.Sierra Vázquez según idea de Campbell y
Maffei (1974)]. La imagen representa un enrejado sinusoidal modulado en frecuencia
espacial y contraste de modo logarítmico. La frecuencia espacial aumenta de izquierda a
derecha. El contraste decrece de abajo a arriba pero en la misma cantidad en todas las
frecuencias; es decir, en una misma línea horizontal todas las frecuencias espaciales
tienen físicamente el mismo contraste (salvo distorsiones introducidas por el proceso de
reproducción). Sitúese aproximadamente a 40 cm de la imagen y observará un contorno
curvo ilusorio en forma de U invertida asimétrica (parecida en forma a la curva del panel
A) que separa la región uniforme superior de la región inferior con textura. Ese perfil
ilusorio es precisamente la forma de la propia FSCe. Nótese que la altura de las franjas,
i.e. la sensibilidad al contraste, es mayor dentro del rango entre 2 y 5 c/deg. Para
frecuencias espaciales inferiores y superiores a este rango la sensibilidad al contraste se
reduce considerablemente. Nótese además que el lado derecho de la U invertida cae más
y de forma más abrupta que el lado izquierdo. Si se tiene la visión corregida y se observa
la imagen sin la prótesis de corrección, la forma del perfil de la U invertida ilusoria se
altera en función del tipo de déficit visual.
3.1. Determinación de los umbrales de contraste para enrejados sinusoidales de

diferentes frecuencias espaciales
Se han obtenido los umbrales de contraste para enrejados sinusoidales de 12 x 12 cm

presentados a una distancia de 1 m. En el Cuadro 13.1 se registran los resultados del
experimento de detección para la persona del ejemplo (sujeto experimental) y se calculan
los umbrales de contraste, mT, para cada enrejado.
CUADRO 13.1.
Resultados experimentales y cálculo del umbral de contraste para cada enrejado

Frecuencia espacial en ciclos por imagen, k, (c/i)
389
En la fila etiquetada PT del Cuadro 13.1 existen a su vez tres filas (1,2, 3) en las que
han indicado los puntos de transición para la serie correspondiente, en la siguiente fila
(Media) aparecen el umbral de contraste de cada frecuencia espacial y en la siguiente
(SC), la sensibilidad al contraste. El punto de transición (PT) para cada columna
(escalera descendente) se obtiene tomando el valor medio del contraste de la última
presentación que es detectada y la siguiente que no es detectada. El umbral de contraste
(mT) para cada frecuencia espacial se obtiene calculando la media aritmética de los PT
de las tres series. (Véase §2.7 anterior).. Sean k la frecuencia espacial y s el número de la
serie (1, 2, 3) para cada frecuencia espacial. Entonces,
Finalmente, la Sensibilidad al Contraste (SC) para la frecuencia espacial k es el

recíproco del umbral de contraste:
390
Por ejemplo, la Sensibilidad al Contraste para la frecuencia espacial igual a 2 e/i,
SC(2), se calcula así:
Transformación de c/i, k, en c/gav, u, para cada sujeto experimental:
Las condiciones de presentación de las imágenes han sido:
Longitud del lado vertical de las imágenes de los enrejados en la pantalla de

presentación:
Distancia del sujeto experimental a la pantalla de presentación:
Por lo tanto, la fórmula de transformación de c/i, k, en c/gav, u es:
donde:
u, frecuencia espacial en c/deg o c/gav
391
k, frecuencia espacial en c/i del estímulo visual
d, distancia del sujeto experimental a la pantalla de presentación
1, longitud del lado vertical de la imagen utilizada como estímulo visual en la pantalla
de presentación.
(¡Cuidado!: 1 y d deben expresarse en las mismas unidades de longitud).
[Atención: La función arco tangente (arc tg, arctan o tan) tiene que devolver el ángulo
en grados; si lo devuelve en radianes hay que hacer la conversión a grados].
(Hágase la conversión para cada frecuencia espacial en c/i y rellénense las casillas
correspondientes del Cuadro 13.2).
Por ejemplo, dadas las condiciones de presentación, 2 c/i corresponden a:
3.2. Cálculo de la Sensibilidad al Contraste (SC) para cada frecuencia espacial
En el Cuadro 13.2 aparecen resumidos los valores del umbral de contraste (mT) y de la
Sensiblidad al Contraste (SC) para cada enrejado en función de su frecuencia espacial en
c/i (k) y en c/gav (u) (de acuerdo con la distancia y tamaño).
CUADRO 13.2.
Umbral de contraste y Sensibilidad al Contraste en función de la frecuencia espacial

del enrejado
392
3.3. Representación gráfica de la SC en función de la frecuencia espacial del enrejado y
estimación de la propia FSCe-1D
La Sensibilidad al Contraste para cada enrejado sinusoidal en función de su frecuencia

temporal se ha representado mediante los círculos negros en la Figura 13.6. La línea
poligonal que une los puntos es una estimación de la FSCe-ID del sujeto experimental.
3.4. Comparación con la FSCe-1D estándar (500 cd/m2) (Campbell y Maffei, 1974)
La forma en U invertida de la FSC obtenida es parecida a la de la FSCe-1D estándar

(Figura 13.5A) para una persona adulta con visión normal.
El máximo (4.6 c/gav) se encuentra dentro del rango de frecuencias espaciales (de 2 a
5 c/gav) de la FSCe1D estándar.
Extrapolando los resultados experimentales, la agudeza visual (AV) de la persona

sujeto experimental es aproximadamente igual a 256 c/i, es decir, igual a 37 c/gav.
No se puede saber si la AV es o no normal puesto que la Luminancia media (en

cd/m2) de los estímulos no es conocida.
393
Figura 13.6. Sensibilidad al contraste (círculos negros) de enrejados sinusoidales que
varían en frecuencia espacial, manteniendo fijas su orientación y fase, y estimación de la
FSCe-1D (línea poligonal). La frecuencia espacial u, en c/gav, correspondiente a la
frecuencia espacial k, en c/i, es:
394
donde es el ángulo visual en grados subtendido por el lado vertical de la imagen utilizada
como estímulo visual, 1=12cm, longitud del lado vertical de la imagen en la pantalla de
presentación y d=100cm, distancia del sujeto experimental a la pantalla de presentación.
La línea poligonal que une los círculos es una estimación de la FSCe-1D.
3.5. Comparación con los resultados obtenidos en bebés
La FSCe-1D de la persona sujeto experimental (adulto), como la FSC-1D estándar de

humanos adultos con visión normal (Figuras 13.2B y 13.5A), tiene con respecto a las
FSCe-1D de bebés de 1, 2 y 3 meses de edad:
iii. Una forma clara en U invertida ligeramente distinta a la forma de las FSC de los
bebés.
iii.Un rango mayor de frecuencias espaciales a la que el adulto es sensible.
iii.Su máximo desplazado a una frecuencia relativamente más alta.
iv. Mayor sensibilidad para todas las frecuencias espaciales del rango.
iv. Mayor Agudeza Visual.
3.6. Comparación con resultados obtenidos en otras especies animales
La FSCe-1D de la persona sujeto experimental, como la FSC-1D estándar de humanos

adultos con visión normal, es parecida a la FSC del macaco (Figura 13.3, línea poligonal
que une los círculos blancos).
NOMBRE.......................................................................................
corresponde).
395
RESULTADOS [3]
Determinación de los umbrales de contraste para enrejados sinusoidales de diferentes

frecuencias espaciales [3.1]
Resultados experimentales y cálculo del umbral de contraste para cada enrejado
[CUADRO 13.1]
Frecuencia espacial en ciclos por imagen, k, (c/i)
Transformación de c/i, k, a c/gav, u, para cada sujeto experimental:
Longitud del lado vertical de las imágenes de los enrejados en la pantalla de presentación:
396
Distancia del sujeto experimental a la pantalla de presentación:
Por lo tanto, la fórmula de transformación de c/i, k, en c/gav, u es:
donde:
u, frecuencia espacial en c/deg o c/gav
k, frecuencia espacial en c/i del estímulo visual
d, distancia del sujeto experimental a la pantalla de presentación
1, longitud del lado vertical de las imagen utilizada como estímulo visual en la pantalla de
presentación.
(¡Cuidado: /y d deben expresarse en las mismas unidades de longitud!).
(Hágase la conversión para cada frecuencia espacial en c/i y rellénense las casillas
correspondientes del Cuadro 13.2).
Cálculo de la Sensibilidad al Contraste (SC) para cada frecuencia espacial [3.2]
Umbral de contraste y Sensibilidad al Contraste en función de la frecuencia espacial

del enrejado
[CUADRO 13.2]
397
Representación gráfica de la SC en función de la frecuencia espacial del enrejado y
estimación de la propia FSCe - 1 D [3.3]
Frecuencia espacial (c/gav)
Sensibilidad al contraste (círculos) de enrejados sinusoidales que varían en frecuencia

espacial, manteniendo fijas su orientación y fase, y estimación de la FSCe-1D (línea
poligonal). La frecuencia espacial u, en c/gav, correspondiente a la frecuencia espacial k,
en c/i, es:
398
donde es el ángulo visual en grados subtendido por el lado vertical de la imagen utilizada
como estímulo visual, 1= cm, longitud del lado vertical de la imagen y d= cm, distancia
del sujeto experimental a la pantalla de presentación. La línea poligonal que une los
círculos es una estimación de la FSCe-1D. [FIGURA 13.6]
Comparación con la FSCe-1D estándar (500 cd/m2) (Campell y Maffei, 1974) [3.4]
Comparación con los resultados obtenidos con bebés [3.5]
Comparación con los resultados obtenidos en otras especies animales [3.6]
399
400
401
Adelson, E. H. (1995). http://web.mit.edu/persci/people/adelson/checkershadow
illusion.html
Ades, D. (2004) (ed.). Dalí. Catálogo de la exposición producida por Palazzo Grassi con
la Fundació Gala-Salvador Dalí con motivo del Centenario del Nacimiento de
Salvador Dalí. Madrid: La Esfera de los Libros.
Allen, J. B. (1996). Harvey Fletcher's role in the creation of communication acoustics.

Journal of the Acoustical Society of America, 99, 1825-1839.
Amón, J. (1978). Estadística para Psicólogos. 1. Estadística descriptiva. Madrid:

Ediciones Pirámide.
ANSI S3.6-1996 American National Standard Specification for Audiometers.
Banks, M. S., Salapatek, P. (1978). Acuity and contrast sensitivity in 1-, 2-, 3-month-
o1d human infants. Investigative Ophtalmology and Visual Science, 17, 362-365.
Blake, R., Cool, S. J., Crawford, M. L. (1974). Visual resolution in the cat. Vision
Research, 14, 1211-1217.
Berger, E. H. (1981). Re-examination of the low-frequency (50-1,000 Hz) normal

threshold of hearing in free and diffuse sound fields. Journal of the Acoustical Society
of America, 70, 1635-1645.
Boring, E. G. (1930). A New Ambiguous Figure. American Journal of Psychology, 42,

444.
Boring, E. G. (1942). Sensation and Perception in the History of Experimental

Psychology. N. Y.: Appleton-Century-Croft.
Brown, J. L. (1966). Afterimages. En C.H.Graham (ed.), Vision and Visual Perception.

N. Y.: Wiley and Sons.
Campbell, F. W., Maffei, L. (1974). Contrast and spatial frequency. Scientifzc American,
Noviembre.
Campbell, F. W., Robson, J. G. (1968). Application of Fourier analysis to the visibility of
402
gratings. The Journal of Physiology, 197, 551-566.
Ciroux, J. B. (2006). Simulating the McCollough Effect in a Self-Organizing Model of

the Primary Visual Cortex. Master of Science Informatics. School of Informatics.
Edinburgh University. June 6, 2006.
Coltheart, M. (1973). Colour-specificity and monoculararity in the visual cortex. Vision

Research, 13, 2595-2598.
Coombs, C. H., Dawes, R. M., Tversky, A. (1970) Mathematical Psychology. An

Elementary Introduction. Englewood Cliffs, NJ: Prentice-Hall. Cap. 6 [Edición en
castellano: (1981) Introducción a la psicología matemática. Madrid: Alianza Editorial].
Cornsweet, T. N. (1970). Visual Perception. N. Y.: Academic Press.
De Valois, R. L, Morgan, H. C., Snodderly, D. M. (1974). Psychophysical studies of

monkey vision. III. Spatial luminance contrast sensitivity tests of macaque and human
observers. Vision Research, 14, 53-67.
Eckert, M. P., Carter, G. A. (2000). Flowers produce variations in color saturation by

arranging petals at oblique and varying angles. Journal of the Optical Society of
America A, 17, 825-830.
Egam, J. P. (1975). Signal Detection Theory and ROC Analysis. N.Y.: Academic Press.
Egam, J. P., Schulman, A. L, Greenberg, G. Z. (1959). Operating characteristics

determinad by binary decisions and ratings. Journal of the Acoustical Society of
America, 31, 768-773.
Fant, G. (1960). Acoustic Theory of Speech Production. The Hague: Mouton & Co.
Fletcher, H. (1940). Auditory patterns. Review of Modern Physics, 12, 47-65.
Fox, R., Lehmkuhle, S. W., Westendorf, D. H. (1976). Falcon visual acuity. Science,
192, 263-265.
Glasberg, B. R., Moore, B. C. J. (1990). Derivation of auditory filter shapes from

notchednoise data. Hearing Research. 47, 103-138. (doi:10.1016/0378-
5955(90)90170-T).
Goldstein, E. B. (1999). Sensación y Percepción. México: International Thomson Eds. 5'
403
edición.
González, R. C., Wintz, P. (1977). Digital Image Processing. Reading, MA:

AddisonWesley.
Green, D. M, Swets, J. A. (1974). Signal Detection Theory and Psychophysics. N. Y.:

Krieger (Reimpresión con correcciones de la edición de 1966).
Handel, S. (1989). Listening. An Introduction to the Perception of Auditory Events.

Cambridge, Mass: MIT Press.
Harmon, L. D. (1973). The recognition of faces. Scientifzc American, 229(5), 70-82.
Harmon, L, D., Julesz, B. (1973). Masking in visual recognition: Effect of

twodimensional filtered noise. Science, 180, 1104-1197.
Hartmann, W. H. (1998). Signals, Sound, and Sensation. Berlín: Springer Verlag.
Heffner, H. E. (1983). Hearing in large and small dogs. Absolute thresholds and size of
the tympanic membrane. Behavioral Neuroscience, 97, 310-318.
Heffner, R. S., Heffner, H. E. (1980). Hearing in the elephant (Elephas maximus).

Science, 208, 518-520.
Heffner, R. S., Heffner, H. E. (1985). Hearing in mammals: The least weasel. Journal of
Marnmalogy, 66, 745-755.
Heffner, H. E., Masterton, R. B. (1980). Hearing in glires: Domestic rabbit, cotton rat,
feral house mouse, and kangaroo rat. Journal of the Acoustical Society of America,
68, 1584-1599.Hermann, L. (1870). Eine Erscheinung simultanen Kontrastes. Pflüg.
Arch. ges. Physiol., 3. 13-15.
Hill, W. E. (1915). My Wife and My Mother-in-Law. Puck, 16 (Nov), 11.
Houtsma, A. J. M., Rossing, T. D., Wagenaars, W. M. (1987). Auditory Demonstration.

Eindhoven, The Netherlands: IPO&ASA.
Helmholtz, H. von (1859-1867). Handbuch der Phyisiologischen Optik. Hamburgo: Voss

(2a ed.).
Hering, E. (1878). Zur Lehre von Lichtsinne. Viena: Gerold's Shon.
404
Hurvich, L. M. (1981) Color Vision. Sunderland, MA.: Sinauer Associates Inc.
Hurvich, L. M., Jameson, D. (1955). Some quantitative aspects of an opponent-colors

theory. II. Brightness, saturation, and hue in normal and dichromatic vision. Journal
of the Optical Society of America, 45, 602-616.
Hurvich, L. M., Jameson, D. (1974). Opponent processes as a model of neural

organization. American Psychologist, 29, 88-102.
ISO 226:2003 Acoustics - Normal equal-loudness-level-contours.
Jacobs, G. H. (1977). Visual capacities of the owl monkey (Aotus trivirgatus). II. Spatial
contrast sensitivity. Vision Res. 17: 821-825.
James, W. (1890/1981). The Principies of Psychology. Cambridge, MA: Harvard

University Press.
Jameson, D., Hurvich, L. M. (1955). Some quantitative aspects of an opponent-colors

theory. 1. Chromatic responses and spectral saturation. Journal of the Optical Society
of America, 45, 546-552.
Jáñez, L. (1992). Psicofísica En J.Mayor, J & J.L.Pinillos (eds. del Tratado),

J.L.Fernández Trespalacios & P.Tudela Garmendia (eds. del Volumen), Tratado de
Psicología General. Volumen 3. Atención y Percepción. Madrid: Alhambra
Universidad. Pp.1-44.
Jastrow, J. (1899). The mind's eye. Popular Science Monthly, 54, 299-312.
Jones, P. D., & Holding, D. H. (1975). Extremely long-terco persistence of the

McCollough effect. Journal of Experimental Psychology: Human Perception and
Performance, 1, 323-327.
Julesz, B. (1960). Binocular depth perception of computer-generated patterns. Bell

System Technical. Journal, 39, 1125-1162.
Julesz, B. (1964). Binocular depth perception without familiarity cues. Science, 145,
356363.
Karneoka, A. y Kuriyagawa, M. (1969). Consonance theory part 1: Consonance of

Dyads. Journal of the Acoustical Society of America, 45, 1451-1459.
405
Kanizsa, G. (1986). Gramática de la Visión. Percepción y pensamiento. Madrid: Paidós.
Klatt, D. H. (1980). Software for a cascade/parallel formant synthesizer. Journal of the

Acoustic Society of America, 67(3), 971-995.
Laming, D. (1973). Mathematical Psychology. N. Y.: Academic Press, cap. 5.
Liberman, A. M., Harris, K. S., Hoffman, H. S. y Griffith, B. C. (1957). The

discrimination of speech sounds within and across phoneme boundaries. Journal of
Experimental Psychology, 53, 379-388.
López-Bascuas, L. E. (1999a). El sonido y la arquitectura del sistema auditivo humano.

En E.Munar., J.Roselló, A.Sánchez Cabaco (coord.), Atención y Percepción. Madrid:
Alianza Editorial. Pp. 447-487.
López-Bascuas, L. E. (1999b). Percepción de la Tonalidad y de la Sonoridad. En

E.Munar, J.Roselló y A.Sánchez-Cabaco (Coords.). Atención y Percepción. Madrid.
Alianza. Pp. 489-517.
McCollough, C. (1965). Color adaptation of edge-detectors in the human visual system.

Science, 149, 9, 1115-1116.
McCollough Howard, C., Webster, M. A. (2009). The McCollough effect. Scholarpedia,

6(2), 8175.
Mach, E. (1865). Über die Wirkung der raumlichen Vertheilung des Lichtreizes auf die
Netzhaut. Sitzungsberichte der mathematisch-naturwissenshaftlichen Klasse der
Kaiserlichen Akademie der Wissenschaften, Wien 52/2, 303-322.
MacKay, D. M., & MacKay, V. (1974) The time course of the McCollough effect and its
physiological implications. Journal ofPhysiology (London) 237, 38-39.
Magic Eye Inc. (1993). The Magic Eye: A New Way of Looking at the World. Boston:
N. E.Thing Enterprises. [El Ojo Mágico. Barcelona: Ediciones B].
Martínez Celdrán, E. (1998). Análisis Espectrográfico de los Sonidos del Habla.

Barcelona: Ariel.
Moore, B. C. J. (1993). Frequency analysis and pitch perception. En W.A.Yost, A. N.

Popper, R.R.Fay (eds.), Human Psychophysics. Berlin: Springer Verlag. Pp.56-115.
406
Moore, B. C. J. (2003). An Introduction to the Psychology of Hearing. N. Y.: Academic
Press, 5.a edición.
Moore, B. C. J. (2008). Basic auditory processes involved in the analysis o speech.

Philosophical Transactions of the Royal Society B, 363, 947-963.
Navon, D. (1977). Forest before trees: the precedence of global features in visual
perception. Cognitive Psychology, 9, 353-383.
Northmore, D. P., Dvorak, C. A. (1979). Contrast sensitivity and acuity of the goldfish.
Vision Research, 19, 255-261.
Oliva, A., Torralba, A., Schyns, P. G. (2006). 11ybrid images. ACM Transactions on
Graphics (SIGGRAP 2006 issue) 25, 527-532. http://cvcl.mit.edu/hybrid/
OlivaTorralb_Hybrid_Siggraph06.pdf.
Patterson, R. D. (1976) Auditory filter chapes derived with noise stimuli. Journal of the
Acoustical Society of America, 59, 640-654. (doi:10.1121/1.380914).
Patterson, R. D., Moore, B. C. J. (1986). Auditory filters and excitation pattems as

representations of frequency resolution. En B.C.J.Moore (ed.), Frequency selectivity
in hearing. Londres: Academic Press. Pp. 123-177.
Peirce, J. W., Solomon, S. G., Forte, J. D., Lennie, P. (2008). Cortical representation of
color is binocular. Journal of Vision, 8 (3):6, 1-10.
Pelli, D.G., Zang, L. (1991) Accurate control of contrast on microcomputer displays.

Vision Research, 31(7/8), 1337-1350.
Peterson, W. W., Birdsall, T. G., Fox, W. C. (1954). The theory of signal detectability.
IRE Transactions, PGIT-4, 171-212.
Pickett, J. M. (1980). The Acoustic of Speech Conamunication. Eundanaentals, Speech

Perception Theory, and Technology. Boston: Allyn and Bacon.
Pinna, B., Brelstaff, G. (2000). A new illusion of relative motion. Vision Research, 40,
2091-2096.
Plomp, R., Levelt, J. M. (1965). Tonal Consonance and Critical Bandwidth. Journal of
the Acoustical Society of Anierica, 38, 548-560.
407
Pokomy, J. & Smith, V. C. (1986). Colorimetry and color discrimination. En K.R.Boff,
Kaufman, L. & Thomas. J. P. (eds.), Handbook of Perception and Human
Performance. Vol 1. Sensory Processes and Perception. N. Y.: Wiley & Sons, 1986.
Cap. 8. Pp. 8-15.
Popper, K. (1959). The Logic of Scientific Discovery. London: Hutchinson & Co. [La
lógica de la investigación científica. Madrid: Tecnos].
Poulton, E. C., Stevens, S. S. (1953). On the halving and doubling of the loudness of
white noise. Journal of the Acoustical Society of America, 27, 329-331.
Power, R. P., Hausfeld, S., Gorta, A. (1981). Workshops in Perception. London:

Routledge & Kegan.
Quilis, A. & Fernández, J. A. (1992). Curso de Fonética y Fonología Españolas para

estudiantes anglo-americanos. Madrid: CSIC.
Ratliff, F. (1965). Mach Bands: Quantitative Studies on Neural Networks in the Retina.
San Francisco: Holden-Day Inc.
Ratliff, F. (1972). Contour and contrast. Scientific American, Junio.
Repp, B. H. (1984). Categorical perception: Issues, methods and findings. En N.J.Lass

(Ed.), Speech and Language: Advances in Research and Practice, Vol. 10. New York:
Academic Press.
Robinson, J. O. (1972). The Psychology of Visual Illusions. London: Hutchinson

U.Library.
Robinson, D. W., Dadson, R. S. (1956). A re-determination of equal-loudness relations

for pure tones. British Journal ofApplied Physics, 7, 166-181.
Rock, 1. (1984). La Percepción. Barcelona: Prensa Científica, Editorial Labor.
Roederer, J. G. (2008). The Physics and Psychophysicis of Music (4'h ed.). New York:
Springer.
Rossing, T. D. (1990). The Science of Sound (2nd Ed.). Reading, MA: Addison Wesley.
Rubin, E. (1915). Synsoplevede Figurer en E.G.Boring (1942). Sensation and

Percepcion in the History of Experiemental Psychology. N. Y.: Appleton-Century-
408
Crofts, Inc., figura 36.
Scharf, B. & Buus, S. (1986). Audition 1: Stimulus, Physiology, Thresholds. En K. R.

Boff, Kaufman, L. & Thomas. J. P. (eds.), Handbook of Perception and Human
Performance. Vol 1. Sensory Processes and Perception. N. Y.: Wiley & Sons, 1986.
Cap. 14. Pp.14-1, 14-71.
Schooneveldt, G. P., & Moore, B. C. J. (1989). Comodulation masking release (CMR)

as a function of masker bandwidth, modulator bandwidth, and signal duration. Journal
of the Acoustical Society of America, 85, 273-281.
Schyns, P., Oliva, A. (1999). Mr. angry and mr. smile: when categorization flexibility
modifies the perception of faces in rapid visual presentations. Cognition, 69, 243-265.
Serrano-Pedraza, 1. (2005). Procesos visuales de demodulación espacial. Tesis Doctoral.

Universidad Complutense Madrid, Spain. Disponible en www.ucm.es/BUCM/tesis/
psi/ucm-t28909.pdf.
Serrano-Pedraza, 1. & Sierra-Vázquez, V. (2006a). El paradigma de enmascaramiento

con ruido visual: Simulación del modelo basado en bandas críticas. Lecturas de
Psicología Experimental. M.J.Contreras, J.Botella, R.Cabestrero y B.Gil (Coords.),
Madrid: Uned Ediciones. Pp. 183-192.
Serrano-Pedraza, 1. & Sierra-Vázquez, V. (2006b). The effect of white-noise mask level

on sinewave contrast detection thresholds and the critical-band-masking model.
Spanish Journal of Psychology, 9, 249-262.
Serrano-Pedraza, L, Manjunath, V., Osunkunle, 0., Clarke, M. P., Read, J.C.A. (2011)
Visual suppression in intermittent exotropia during binocular alignment. Investigative
Ophthalmology and Visual Science, 52, 2352-64.
Serrano-Pedraza, L, Sierra-Vázquez, V., Derrington, A.M. (2013). Power-spectrum

model of visual masking: simulations and empirical data. Journal of the Optical
Society of America A. 30 (6) 1119-1135.
Sierra Vázquez, V. (1992). Procesamiento visual temprano: Aspectos biológicos,

psicofísicos y computacionales del análisis espacial de imágenes por el sistema visual
humano. En J.Mayor, J.L.Pinillos (eds.), J.L.Fernández Trespalacios, P.Tudela (eds.
del volumen), Tratado de Psicología General. Volumen 3. Atención y Percepción.
Madrid: Alhambra Universidad, 1992. Cap. 5.
409
Sierra-Vázquez, V., Serrano-Pedraza, L, Luna, D. (2006). The effect of spatial-
frequency filtering on the visual processing of global structure. Perception, 35, 1583-
1509.
Sierra-Vázquez, V., Serrano-Pedraza, 1. (2011). Application of Riesz transforms to the

isotropic AM-PM decomposition of geometrical-optical illusion images. Journal of the
Optical Society of America A, 27, 781 - 796.
Stevens, S. S. (1957). On the psychophysical law. Psychological Review, 64,153-181.
Stevens, S. S. (1962). To honor Fechner and repeal his law. Science, 133, 80-86.
Stevens, S. S. (1970). Neural events and the psychophysical law. Science, 170,
10431050.
Stevens, S. S. (1975). Psychophysics: Introduction to its Perceptual, Neural, and Social

Prospects. N. Y.: Wiley and Sons.
Stevens, J. C., Stevens, S. S. (1963). Brightness function: Effects of adaptation. Journal

of the Optical Society of America, 53, 375-385.
Shute, C. C. D. (1979). The McCollough Effect: An Indicator of Central

Neurotransmitter Activity. Cambridge: Cambridge University Press.
Southall, J. P. C. (1962). Helmholtz's Treatise on Physiological Optics. Vol.2. N. Y.:

Dover.
Stromeyer, C. F. (1978). Form-color aftereffects in human vision. En R.Held, H. W.

Leibowitz, H.-L. Teuber (eds.), Handbook of Sensory Physiology. Vol. VIII.
Perception. Berlin: Springer-Verlag. Pp. 97-142.
Stromeyer, C. F., Mansfield, R. J. W. (1970). Colored aftereffects produced with moving

edges. Perception and Psychophysics, 7(2): 108-114, 1970.
Sutherland, N. S. (1996). The International Dictionary of Psychology. N. Y.: The

Crossroad Publishing Company.
Swets, J. A. (1961). Is there a sensory threshold? Science, 134, 168-177.
Swets, J.A., Tanner, W. P., Birdsall, T. G. (1961). Decision processes in perception.

Psychological Review, 68, 301-340.
410
Tanner, W. P., Swets, J. A. (1954). A decision-making theory of visual detection.
Psychological Review, 61, 401-409.
Thompson M., Burr, D. (2009). Visual aftereffects. Current Biology, 19, Rl1-R14.
Traunmüller, H. (1990). Analytical expressions for the tonotopic sensory scale. Journal of
the Acoustical Society ofAmerica, 88, 97-100.
Tyler, C. W. (1994). El nacimiento de estereogramas por ordenador para una

estereovisión sin ayuda de aparatos. En S.Horibuchi (ed.) (1994). Estereograma. El
secreto de las 3D. Barcelona: Editorial Blume. Pp. 83-89.
Tyler, C. W. & Clarke, M. B. (1990). The Autostereogram. Stereoscopic Displays and

Applications. Proceeding of the SPIE, 1258, 182-196.
Uhlarik, J. J., Osgood, A. G. (1974). The role of some spatial parameters of gratings on
the McCollough effect. Perception and Psychophysics, 15, 524-528.
Wheatstone, C. (1838). Contributions to the physiology of visión. Part the first, on some
remarkable and hitherto unobserved phenomena of binocular vision. Philosophical
Transactions of the Royal Society, 148, 371-394.
Wyszecki, G., Stiles, W. S. (1982). Color Science: Concepts and Methods, Quantitative
Data and Formulae. N. Y.: Wiley.
Yost, W. A. (2007). Fundamentals of Hearing. An Introduction. N. Y.: Academic Press,

5.a edición.
Young, T. (1802). On the theory of light and colours. Philosophical Transactions of the
Royal Society London, 92, 12-48.
Referencias de las figuras
-Figura Demostración #15. Figura reimpresa de Harmon, L. & Julesz, B. (1973), Figura
1, Science, 180, 1194-1197. © Copyright AAAS 1973. Figura reproducida con
permiso.
-Figura Demostración #24. Figura reimpresa de Thompson, M. & Burr, D.(2009).Visual

aftereffects. Current Biology, 19(1), Rl l-R14. © Copyright Elsevier 2009 Figura
reproducida con permiso.
411
-Figura 10.1. Figura reimpresa de Thompson, M. & Burr, D. (2009). Visual Aftereffects.
Current Biology 19 (1), Rll-R14. © Copyright Elsevier 2009. Figura reproducida con
permiso.
-Figuras 11.6 y 12.4. Figura reimpresa de Eckert, M. P. & Carter, G. A. (2000). Flowers
produce variations in color saturation by arranging petals at oblique and varying
angles. Journal of the Optical Society of America A, 17, 825-830. © Copyright OSA
2000. Figura reproducida con permiso.
-Figuras 11.7A, B y C y 12.5A,B y C.Figuras reimpresas de Eckert, M. P. & Carter, G.

A. (2000). Flowers produce variations in color saturation by arranging petals at
© Copyright OSA 2000. Figura reproducidas con permiso.
-Figura 11.9A y B.Figura 11.7. Figuras reimpresas de Eckert, M. P. & Carter, G. A.

(2000). Flowers produce variations in color saturation by arranging petals at oblique
and varying angles. Journal of the Optical Society of America A, 17, 825-830. ©
Copyright 2000. Figuras reproducidas con permiso.
-Figura 13.2A y B.Figuras reimpresas de Banks, M. S., Salapatek, P. (1978). Acuity and
contrast sensitivity in 1-, 2-, 3-month-o1d human infants. Investigative Ophtalmology
and Visual Science, 17, 362-365. © Copyright ARVO. Figuras reproducidas con
permiso.
-Figura 13.5 Figura reimpresa de Campbell, F. W., Maffei, L. (1974). Contrast and
spatial frequency. Scientifzc American, Noviembre. Reproducida con permiso © 1974
Scientific American, Inc. Todos los derechos reservados.
412
Índice
Prólogo 23
1. Demostraciones de fenómenos sensoriales y perceptivos 28
2. Método 30
2.2. Instrucciones para el experimentador 31
2.3. Instrucciones a los sujetos experimentales 32
3.2. Fenómenos de la percepción no verídica 51
4. Recogida y análisis de datos 62
2. Determinación experimental de los parámetros de la Ley de
67
Stevens para la percepción de la sonori
1.2. Objetivos de la Práctica 69
2.1. Estímulos 70
2.2. Procedimiento y tarea 72
2.3. Aparatos 73
2.7. Cálculo de los parámetros a y b de la ley de Stevens 75
3. Resultados: Ejemplo 77
3.3. Representación gráfica de los resultados experimentales y de la
79
función potencial
4. Aplicaciones: Problemas 81
4.2. Cantidad en la que hay que disminuir la presión sonora en dB
82
SPL para que la sensación sonora s
3. Determinación experimental de los parámetros de la Ley de
91
Stevens para la percepción del brillo
2.4. Instrucciones para el experimentador 97
2.5. Material audiovisual 98
2.7. Estimación de los parámetros a y b de la ley de Stevens 99
3.1. Estimación de brillo. Resultados experimentales 100
413
3.2. Cálculo del valor de los parámetros de la ley de Stevens 101
correspondiente al sujeto experimental
4. Teoría de la Detección de la Señal (TDS). Verificación
111
experimental del modelo Normal-Normal con
2.3. Condiciones experimentales 116
2.5. Aparatos 117
2.9. Algoritmo para el cálculo de d' y Í supuesto el modelo N-N
119
con varianzas iguales
3.1. Obtención y representación gráfica de los resultados de los
121
experimentos de detección
3.2. Cálculo de los valores de d' y Í correspondientes al sujeto
125
experimental en la Parte 1
3.3. Verificación del modelo N-N con varianzas iguales 127
3.4. Curva ROC teórica 128
3.5. Representación gráfica de la sensibilidad y del criterio o sesgo
128
de respuesta del sujeto experi
4. Método 131
4.5. Aparatos 132
5.2. Cálculo de los valores de d' y (3 correspondientes al sujeto
140
experimental en la Parte II
5.3. Verificación del modelo N-N con varianzas iguales 141
5.4. Curva de isocriterio teórica 142
5.5. Representación gráfica de la discriminabilidad de la señal y del
143
criterio o sesgo de respuesta
5. Medida de la Curva de Audibilidad humana 164
2.2. Procedimiento 170
2.4. Tarea 171
2.6. Material audiovisual 172
414
3.2. Representación gráfica del umbral de audibilidad de cada tono
174
en función de su frecuencia tempo
3.3. Determinación de la Curva de Audibilidad Humana 175
415

Libro de Practicas Percepcion

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Libro de Practicas Percepcion

Cargado por

Copyright:

Formatos disponibles

4

Vicente Sierra Vázquez

Luis Enrique López Bascuas

1. Demostraciones de fenómenos sensoriales y perceptivos

1.1. El problema de la percepción

1.2. Objetivos de la Práctica

2.2. Instrucciones para el experimentador

2.3. Instrucciones a los sujetos experimentales

2.4. Material audiovisual

3.1. Fenómenos de la percepción verídica

3.2. Fenómenos de la percepción no verídica

4. Recogida y análisis de datos

2. Determinación experimental de los parámetros de la Ley de Stevens para la percepción

1.1. La ley de Stevens para la percepción de la sonoridad

1.2. Objetivos de la Práctica

2.2. Procedimiento y tarea

2.4. Instrucciones para el experimentador

2.5. Material audiovisual

2.6. Instrucciones a los sujetos experimentales

2.7. Cálculo de los parámetros a y b de la ley de Stevens

3.1. Estimación de la sonoridad. Resultados experimentales

3.2. Cálculo del valor de los parámetros de la ley de Stevens correspondiente al

3.3. Representación gráfica de los resultados experimentales y de la función potencial

4.1. Decrementos en presión sonora (escala absoluta) desiguales, razón ¿fija o

5. Recogida y análisis de datos

3. Determinación experimental de los parámetros de la Ley de Stevens para la percepción

1.1. La ley de Stevens para la percepción del brillo

1.2. Objetivos de la Práctica

2.2. Procedimiento y tarea

2.4. Instrucciones para el experimentador

2.5. Material audiovisual

2.6. Instrucciones a los sujetos experimentales

2.7. Estimación de los parámetros a y b de la ley de Stevens

3.1. Estimación de brillo. Resultados experimentales

3.2. Cálculo del valor de los parámetros de la ley de Stevens correspondiente al

3.3. Representación gráfica de los resultados experimentales y de la función potencial

4. Recogida y análisis de datos

4. Teoría de la Detección de la Señal (TDS). Verificación experimental del modelo

1.1. Índices de la sensibilidad (/discriminabilidad) y del criterio y predicciones de la

1.2. Objetivos de la Práctica

2.2. Procedimiento y tarea

2.6. Instrucciones para el experimentador

2.7. Material audiovisual

2.8. Instrucciones a los sujetos experimentales

3.1. Obtención y representación gráfica de los resultados de los experimentos de

3.2. Cálculo de los valores de d' y Í correspondientes al sujeto experimental en la

3.3. Verificación del modelo N-N con varianzas iguales

3.4. Curva ROC teórica

3.5. Representación gráfica de la sensibilidad y del criterio o sesgo de respuesta del

4.2. Procedimiento y tarea

4.3. Condiciones experimentales

4.6. Instrucciones para el experimentador

4.8. Instrucciones a los sujetos experimentales

5.1. Obtención y representación gráfica de los resultados de los experimentos de

5.2. Cálculo de los valores de d' y (3 correspondientes al sujeto experimental en la

5.3. Verificación del modelo N-N con varianzas iguales

5.4. Curva de isocriterio teórica

5.5. Representación gráfica de la discriminabilidad de la señal y del criterio o sesgo

6. Recogida y análisis de datos

5. Medida de la Curva de Audibilidad humana

1.1. La Curva de Audibilidad (CA) humana

1.2. Objetivos de la Práctica

2.5. Instrucciones para el experimentador

2.7. Instrucciones a los sujetos experimentales