Está en la página 1de 10

Tema 2C.

Los estímulos sensoriales para la visión II: Las Imágenes

Cuando la luz llega a nuestros ojos, generalmente lo hace en configuraciones complejas,


como son las imágenes. De hecho, cada uno de nuestros ojos forman una imagen
independiente, por tanto nuestro sistema visual en condiciones normales, trabaja con dos
imágenes diferentes en dos dimensiones. En el córtex se formará un solapamiento de esas
dos imágenes, la profundidad que se va a construir a partir de la información de las dos
imágenes bidimensionales, formando una tercera dimensión. A diferencia de la luz, que solo
puede cambiar a lo largo del tiempo, las imágenes pueden variar también a lo largo del
espacio.

Imagen: una imagen es una distribución bidimensional de energía electromagnética con


cierta configuración espacio-temporal. Nuestros ojos trabajan con imágenes 2D, cada ojo
con una imagen 2D.

1. Clases de imágenes

Podemos clasificar los distintos tipos de imágenes atendiendo a tres dimensiones, que
son el matiz, el movimiento y la modulación temporal:
● Matiz: división en las imágenes, entre aquellas acromáticas y cromáticas:
○ Cuando tenemos una imagen que solo tiene variaciones de intensidad, es
decir, que no tiene color, hablamos de una imagen acromática. Al ser en
blanco y negro lo importante es la posición y la luminancia. La imagen se
encuentra formada por píxeles, se suelen usar imágenes naturales. La
posición espacial es un parámetro importante, podemos localizarlo con
coordenadas (x,y) Cada punto de una imagen tiene 3 valores de R,G y B.
○ Cuando tenemos variaciones en la longitud de onda y también en la
intensidad, hablamos de imagen cromática. Donde podemos diferenciar
los colores y las tonalidades.
● Movimiento: las imágenes pueden ser estáticas o dinámicas.
● Modulación temporal: una imagen estática puede tener modulación temporal o
no.

1
○ Cuando no hay no percibo ningún cambio en la imágen a lo largo del
tiempo aun estando la imagen en el mismo lugar, entonces estamos en el
caso de una imagen de no modulación temporal; no hay parpadeo
perceptible.
○ En el caso en que tengamos una situación donde hay parpadeo en la
imágen, estamos hablando de una imagen de modulación temporal.

Lo que nuestro sistema visual se encarga de procesar son imágenes, las cuales pueden ser
de dos tipos: acromáticas y cromáticas. Que a su vez pueden ser, estáticas o dinámicas.
En el estudio del sonido, los tonos puros son funciones periódicas cuya representación
gráfica se ajusta a la función sinusoidal. Desde el siglo pasado, se sabe que cualquier señal
auditiva puede sintetizarse sumando tonos puros (y viceversa). Por tanto, los tonos puros
constituyen el elemento irreductible a partir del cual puede sintetizarse cualquier sonido.

1.1 Imágenes sintéticas 1D

→ Tenemos un patrón alternante de dos franjas


paralelas, una blanca y una negra, con tonalidades
claras y oscuras que varían abruptamente en
luminancia. Pasamos de un blanco muy claro a un
negro en el mismo tramo. Si representáramos el
perfil de iluminancia de este patrón, al igual que lo
hicimos con las bandas de Match, observaríamos la secuencia: blanco, blanco, blanco,
blancoy directamente negro, negro. El cambio completo ocurre en un punto
determinado de la imagen.

Análisis de Fourier: nos permite descomponer cualquier función compleja en sus


componentes sinusoidales.
Si intentamos descomponer un perfil de luminancia complejo en funciones
sinusoidales, podríamos realizar el análisis de Fourier de este perfil. Este perfil de
luminancia no se asemeja en nada a los perfiles de los tonos puros. Cuando se trata de un
tono puro, este se caracteriza por funciones de onda similares, pero al tener un perfil de
iluminancia complejo como el mencionado, la situación cambia considerablemente
debido a los cambios abruptos.

Entonces, al realizar un análisis de Fourier de este perfil de


luminancia, observaremos que se puede descomponer en
componentes más simples, en estímulos más básicos para el
sistema visual. Aquí, se presenta una onda, por ejemplo,
denominada C1, que muestra una alternancia de aumento y
disminución. Luego, tenemos otra onda llamada F3, que presenta
una variación diferente. Aunque estas ondas individuales no se
asemejan a los tonos puros, al sumarlas, obtenemos una función de
onda (f1+f2+f3+f4) que se parece al perfil de luminancia original.
Este enfoque de sumar varias ondas más simples es análogo a
la síntesis de Fourier y nos permite representar de manera
eficiente perfiles de luminancia complejos.

2
1.2 Enrejados sinusoidales
Enrejado sinusoidal: patrón alternante de franjas paralelas, claras y oscuras que varían de
modo sinusoidal (no abrupta) en luminancia.

En el caso de las imágenes, los “tonos puros” serían denominados enrejados sinusoidales
porque su variación de la luminancia se ajusta a una función sinusoidal.

La variación sinusoidal es gradual y suave en la luminancia, avanzando poco a poco


desde una baja luminancia hasta el blanco. Luego, desciende gradualmente al gris y
finalmente al negro, repitiendo este ciclo de manera continua. En contraste, una
variación abrupta sería un cambio repentino y brusco en la luminancia.
Aquí tenemos un estímulo conocido como enrejado sinusoidal,
que consiste en un patrón alternante de franjas paralelas
claras y oscuras que varían de manera sinusoidal, es decir, de
forma suave y continua. Este tipo de estímulo se considera
el más simple para el sistema visual, ya que su variación
suave facilita la percepción.
→ En posibles preguntas de examen, podríamos indagar sobre
cuáles son los estímulos más simples para el sistema visual, y la
respuesta sería patrones como el enrejado sinusoidal. De manera
análoga, para el sistema auditivo, los tonos puros representan los
estímulos más simples."

2. Parámetros enrejados sinusoidales

⇨ Amplitud: indica la máxima luminancia por encima de la luminancia media


A = (Lmax -Lmin)/2
Contraste de Michelson (m): diferencia de intensidad luminosa entre barras claras y
oscuras. m = (Lmax - Lmin) / (Lmax + Lmin)

En la vida cotidiana, nos referimos a menudo al


contraste de las imágenes, un parámetro relacionado
con la amplitud visual. En el caso de un proyector, se
puede experimentar un contraste variable, siendo más
notorio cuando funciona correctamente. El contraste de
Michelson, descubierto por Michelson, es un parámetro
clave. Se simboliza con 'M' minúscula y se calcula en
una escala de 0 a 1, representando la diferencia en
intensidad luminosa entre barras claras y oscuras. A
medida que la diferencia disminuye, el contraste varía, mostrando valores como 0,25 para
contrastes más bajos. Este parámetro es esencial para describir la percepción visual en
imágenes y proyecciones.

⇨ Frecuencia espacial: es el número de ciclos


(pares de franjas claras y oscuras) por unidad de
longitud. Se mide en ciclos por grado de ángulo visual
(c/gav, u) o en ciclos por imagen (c/i, k).

3
En el caso de ciclos por imagen, se observa que a medida que aumenta la frecuencia
espacial, se incrementa el número de ciclos de claros y oscuros en la imagen. Esto se
representa mediante funciones de onda que muestran la amplitud y el espacio.
En el ejemplo de tres rejillas con diferente frecuencia espacial, se destaca que, a medida
que aumenta la frecuencia espacial, hay más ciclos de contraste en la imagen. La cuenta de
ciclos por imagen se realiza al contar las transiciones de blanco a negro a lo largo de la
imagen. Además, se menciona que la distancia a la que se observa la imagen también es
crucial, y existe otra medida de frecuencia espacial, los ciclos por grado de ángulo visual,
que tiene en cuenta la distancia de visualización.

La frecuencia espacial puede medirse en


ciclos por grado de ángulo visual o en
ciclos por imagen, y su valor puede variar
según la distancia de observación. Por
ejemplo, al acercarse a un objeto, la
proyección en la retina aumenta, alterando la
frecuencia espacial medida en ciclos por grado
de ángulo visual.
Se presenta un caso con dos estímulos: uno de tres ciclos por imagen y otro de seis
ciclos por imagen. Al considerar la frecuencia espacial en ciclos por grado de ángulo visual,
se destaca que, debido a la proyección en la retina, ambos estímulos pueden tener la
misma frecuencia, ya que el tamaño percibido varía con la distancia. En general, se suele
hablar más sobre la frecuencia espacial en ciclos por grado de ángulo visual

⇨ Fase: distancia al origen, expresada en radianes, del primer máximo de luminancia


del enrejado. Es la posición del enrejado en el espacio. Va de 0 a 2π, siendo 0 y 2π
la misma posición.

Cuando se trata de ondas auditivas, como los tonos puros, se


menciona que no importa si el tono comienza en su punto mínimo
o máximo, ya que perceptivamente el sistema auditivo no nota la
diferencia; ambos sonidos suenan igual. Sin embargo, en el caso
de las ondas visuales, representadas por los enrejados, la fase
inicial sí afecta la percepción visual. Se ilustra con dos
enrejados: uno que comienza en blanco y otro en negro. A
medida que avanzan, se observa que uno está en fase de cero
radianes, mientras que el otro está en fase de pi radianes, lo
que demuestra la influencia de la fase inicial en la percepción
visual.

⇨ Orientación: es el ángulo comprendido entre la línea horizontal que sirve de


base al enrejado y una recta que actúa de eje de simetría para una franja
cualquiera de dicho enrejado. La orientación se mide en grados sexagesimales,
variando de 0 a 360 grados. Se menciona que en ambos extremos, como 0 y 180
grados, el enrejado parecería vertical, indicando que ciertos ángulos son
indistinguibles perceptualmente. La orientación se relaciona con la posición angular
de la base de la línea que sirve como referencia, siendo una medida clave en el
análisis visual.

4
3. Analisis de Fourier
La función de onda que estamos considerando representa la
amplitud en una determinada área. A través del análisis de Fourier,
podemos descomponer esta función en sus componentes, que
serían los siguientes (linea verde=base). Tomemos como ejemplo la
onda (verde), dividiéndola en sus diferenciales. Aquí, podríamos
visualizar otro ejemplo diferente que ilustra cómo se construiría la
función de onda a partir de tres componentes distintos.
Estos ejemplos nos permiten entender cómo podemos descomponer
y reconstruir funciones de onda mediante el análisis de Fourier.

⇨ dominio espacial = funcion de onda


⇨ dominio espacial = espectro de fourier
En esta representación, la amplitud se encuentra en el eje vertical, similar a lo que
teníamos en el caso de sonidos. Sin embargo, en
lugar de la frecuencia temporal, ahora estamos
trabajando con frecuencias espaciales en el eje
horizontal. En la gráfica, están representados los
diferentes componentes que contribuirían a una
onda compleja.
Podemos observar un patrón de enrejado con distintas
frecuencias espaciales: uno con una frecuencia
espacial de 1, otro con 3, otro con 5 y otro con 7.
Estos valores representan los diferentes
componentes que compondrían la onda compleja,
y son identificables gracias al análisis de Fourier.

3.1 Dominio de Fourier : Espectro de amplitud


En esta representación, casi toda la información de la
imagen se encuentra contenida. Sin embargo, al igual
que ocurría con los sonidos, a veces necesitamos hacer
representaciones que nos permitan incluir información
de varias dimensiones, aunque tengamos que dejar
alguna fuera. En este espectro de amplitud,
representamos la información de la siguiente manera.
La amplitud de los enrejados de las componentes se
representa desde blanco hasta negro. Mayor
contraste se muestra en blanco, mientras que menor
contraste se representa hacia tonos más oscuros. En el extremo negro, la ausencia
total de contraste indica que la componente no está presente.
Además, en la representación se incluye la información de frecuencia. Cerca del centro se
representan las bajas frecuencias temporales, y a medida que nos alejamos, se
representan las frecuencias más altas. Finalmente, la orientación también se incorpora
en esta representación.

Cómo cualquier sonido se puede descomponer en tonos puros, cualquier imagen


compleja puede dividirse en numerosos componentes sinusoidales. En este caso,

5
estamos observando un solo enrejado, y su espectro
de amplitud está representado.
En el espectro de amplitud, se aprecia una
alternancia de barras verticales claras con bajo
contraste, ubicadas en el centro de la imagen.
Además, hay pequeños puntos grises dispersos. Esta
es la representación de un enrejado con bajo contraste.
Si modificamos el enrejado para aumentar su
contraste, veremos
un cambio notable
en su espectro de
amplitud. Las barras verticales con puro contraste se
destacarán más claramente.
Al cambiar la frecuencia del enrejado, ya sea
aumentando o disminuyendo, veremos cómo afecta al
espectro de amplitud. Aumentar la frecuencia se refleja
en una mayor
información en el
centro de la imagen, mientras que disminuir la
frecuencia lo hará alejarse del centro.
Finalmente, si cambiamos la orientación del
enrejado, por ejemplo, de vertical a horizontal,
observaremos un cambio en la posición de las
barras en el espectro de amplitud, reflejando el cambio
en la orientación.

Imagen compleja
Consideremos dos puntos amarillos en el espectro de
amplitud, que representan un enrejado de 8 ciclos. Al
situarnos a la altura donde se representarán 8 ciclos,
podemos identificar la frecuencia espacial (en este caso
0°). Ahora, al mover la información a los dos puntos azules,
cambiamos la orientación del enrejado mientras mantenemos
la misma frecuencia espacial, se va a girar el enrejado 45
grados. En continuación con un nuevo tipo de tejado en los
puntos blancos, se va girar a 90 °. Aunque la frecuencia
espacial sigue siendo la misma, la orientación varía. Lo
mismo ocurre al acercarnos a los puntos rojos; aunque la
orientación vuelve a ser de 90 grados como en los puntos
blancos, la frecuencia espacial se reduce. Aquí surge un
problema fundamental: los espectros de amplitud no proporcionan información sobre
la posición específica de cada componente en la imagen original. Sabemos que hay
enrejados de diferentes tipos, pero al reconstruir la imagen original, no podemos determinar
en qué parte de la imagen se ubicaría cada enrejado.

En el caso del espectro de fase, guardamos información detallada sobre cada


componente, pero sacrificamos información sobre la amplitud. En este contexto, no

6
podemos determinar la ubicación precisa de la
amplitud, ya que el espectro de fase se enfoca en la
posición y la orientación de los componentes
sinusoidales.
Para reconstruir la imagen original, necesitamos tanto
el espectro de amplitud como el espectro de fase.
Cada uno de ellos proporciona una parte esencial de la
información. Mientras que el espectro de amplitud nos
da detalles sobre la magnitud y el contraste de los
componentes, el espectro de fase nos informa sobre
la ubicación y la orientación específicas.
En resumen, ambos espectros son cruciales para
recuperar la imagen original. Sin embargo, utilizar solo
uno de ellos deja lagunas en nuestra comprensión, ya que nos falta información clave para
una reconstrucción precisa.

4. Filtrado de imágenes
⇨ Filtro paso-bajo: Lo que está en el centro es lo que representa las bajas
frecuencias, a medida que nos alejamos del centro
tenemos las frecuencias altas. Con lo cual un filtro
de este tipo nos está dejando pasar sobre las bajas
frecuencias y nos está eliminando las altas
frecuencias
⇨ El filtro contrario el filtro paso alto pues tendría
eliminación de bajas frecuencias de todas las fechas
en el centro y conservación de las altas frecuencias
⇨ El filtro paso banda que deja pasar una banda de frecuencia
así y el resto las atenúa o elimina
⇨ Cuando aplicamos un filtro paso bajo a una imagen,
eliminamos las frecuencias altas y nos quedamos con las bajas,
como se observa en el espectro. Esto transforma una imagen nítida
llena de detalles en una versión borrosa, donde se mantiene la
información general, como la apariencia de una mujer, pero se
pierden los detalles finos como dientes, ojos y pestañas. Aunque
obtenemos una visión global, la percepción de la imagen se vuelve
difusa al filtrar las altas frecuencias.
⇨ Cuando aplicamos un filtro paso alto, como se muestra en
este caso, conservamos los detalles de la imagen pero perdemos
la información global. Podemos distinguir claramente los diferentes elementos,
pero la imagen carece de la coherencia y suavidad que proporcionan las frecuencias
bajas. Al observar el espectro, notamos que se ha eliminado la parte central.
⇨ En cambio, al utilizar un filtro paso banda, que conserva frecuencias
intermedias, obtenemos una mezcla. La imagen resultante tiene algunos detalles
y cierta nitidez, pero falta la definición proporcionada por las frecuencias bajas
presentes en la otra imagen. Este tipo de filtrado nos ofrece una combinación de
detalles y suavidad, pero no alcanza los extremos de los filtros paso bajo o paso
alto.

7
Similar a lo que ocurre con el sonido, también existe ruido visual, conocido como ruido
blanco o gaussiano en el ámbito visual. Este tipo de ruido, suave en apariencia, se asemeja
a la estática en las televisiones cuando la señal es débil. Se utiliza en experimentación para
estudiar el sistema visual y se puede filtrar de manera similar a las imágenes. El ruido visual
se presenta como enrejados sinusoidales con todas las frecuencias, amplitudes y
orientaciones, siendo la fase aleatoria. Al aplicar filtros, como paso bajo, paso alto o
paso banda, se modifican las características del ruido, resultando en imágenes con
aspectos borrosos, detallados o una combinación de ambos, según el tipo de filtrado
utilizado. Esto se evidencia en los espectros de amplitud de las imágenes resultantes.

5. Experimentos psicofísicos: enmascaramiento


⇨ Los experimentos psicofísicos emplean el enmascaramiento como herramienta
para explorar y modificar los umbrales de detección
⇨ Haciendo un experimento de ese tipo, nos permite obtener información de cómo
funciona nuestro sistema visual

5.1 Enmascaramiento y adaptación selectiva


Elevación de umbrales = resultados de adaptación selectiva (estímul de 90°) = pre
adaptación
Pro adaptación = destaca una influencia significativa con una afectación fuerte en los
umbrales perceptivos

A pesar de que los umbrales pre y post


adaptación pueden llegar a ser casi idénticos,
resalta la importancia de este proceso en la
modulación de la percepción sensorial. La fuerza
de la afectación subraya la capacidad de
adaptación del sistema perceptivo a estímulos
específicos, contribuyendo a una comprensión
más profunda de cómo el cerebro ajusta su
sensibilidad en respuesta a patrones específicos
de entrada sensorial.

8
⇨ En este análisis, se destaca que la percepción y la adaptación de los umbrales
están estrechamente ligadas a la similitud entre el estímulo adaptador y los
estímulos de prueba. La medición de umbrales muestra una mayor afectación
cuando los estímulos son más parecidos al adaptador, independientemente de la
orientación específica. La diferencia entre medidas pre y post adaptación es más
notable para estímulos que comparten la misma orientación que el adaptador.
⇨ Se observa una elevación de umbrales, especialmente para estímulos similares al
adaptador, indicando una adaptación selectiva. Este fenómeno se atribuye al
procesamiento a través del mismo canal visual. Si el adaptador es un enrejado
vertical, la adaptación es más fuerte cuando se presentan estímulos similares, como
otro enrejado vertical, mientras que estímulos que utilizan diferentes canales, como
desplazados u horizontales, muestran una menor afectación.
⇨ La existencia de diversas estructuras especializadas, como canales y series de
estructuras formando un canal, indica la complejidad y especialización del
sistema perceptivo. Estas estructuras se adaptan selectivamente a ciertos
estímulos, influyendo en la percepción y la afectación de los umbrales durante la
adaptación. La presencia de canales especializados sugiere una organización
diferenciada del sistema sensorial, adaptándose de manera específica a distintos
tipos de estímulos. Esto contribuye a comprender cómo el sistema perceptivo
procesa e interpreta la información sensorial de manera selectiva.

5.2 Método de ajuste

En estos experimentos se utilizan para medir las


características de nuestro sistema visual y nuestra
sensibilidad a diferentes estímulos y contrastes. Similar a
las representaciones gráficas de la sensibilidad auditiva,
tenemos una función de sensibilidad al contraste para los
estímulos visuales. Esta función muestra cómo varía
nuestra sensibilidad en relación con la frecuencia
espacial, donde la parte superior indica mayor sensibilidad.
En particular, la agudeza visual se ilustra cuando nos
presentan letras cada vez más pequeñas. Este proceso es
análogo a evaluar tejidos visuales de menor tamaño y mayor
dificultad. La agudeza visual se mide en el punto donde
somos capaces de resolver el rejado más difícil, equivalente a presentar letras al
máximo contraste posible. Este punto crucial revela nuestra capacidad máxima de
resolución visual.

5.3 Teoria multicanal


La teoría multicanal nos muestra que en el sistema visual también tenemos subcanales
visuales.
Al hacer estas medidas, medimos diferentes subcanales del sistema
visual, un canal que está especializado en altas frecuencias, otro en
medias, otro en bajas, etc. Al final obtenemos como función de
sensibilidad al contraste (línea de puntos), es lo que llamamos la
envolvente de todos los canales de abajo. La envolvente es el máximo
de una onda que viaja por la membrana basilar. En esta gráfica

9
tenemos la línea continua es una medición de datos experimentales tras haber adaptado a
una persona a un enrejado de 5 ciclos por grado. Lo que sucede es que justo para el valor
se reduce la sensibilidad y también afecta en menor medida a los valores más cercanos.

5.4 Función de sensibilidad al contraste y frecuencia temporal.

Al medir esta función hablamos de estímulos estáticos


como los enrejados, no había cambios a nivel temporal.
Pero para caracterizar la función visual al completo
tenemos que usar estímulos que cambian con el tiempo,
en el caso de los enrejados, si cambian con el tiempo
parpadearán (modulación temporal).
Tenemos modulaciones temporales con frecuencias
temporales distintas, de ahí los distintos arcos. Cuando el
estímulo cambia lento está más cerca y la última de la
líneas representadas es la última.
Como los Hz son ciclos por segundo, en esta parte de la
gráfica la primera se sitúa en 0 ciclos por segundo al no
haber un parpadeo, y a mitad que tengo más ciclos es
porque tengo más parpadeo por segundo.

10

También podría gustarte