Está en la página 1de 6

PROCESAMIENTO DIGITAL DE IMÁGENES

Antes de abordar dicho tema, necesitamos hacer ciertas definiciones:


Imagen: Señal bidimensional (coordenadas espaciales) cuyo codominio representa alguna
forma de intensidad de energía, como pueden ser luz visible, ultrasonido, rayos X etc.
Imagen digital: Es una imagen que ha sido discretizada en sus coordenadas espaciales y
cuantizada en su intensidad de energía. De esta forma, una imagen digital se organiza como
un arreglo bidimensional (matriz) de elementos mínimos (pixeles) que representan una
cantidad cuantizada de energía.
Por ejemplo: sea una imagen digital 𝐼(𝑥, 𝑦) cuyos valores de energía se han cuantizado en
4 niveles (0,1,2 y 3). La representación matricial sería:

Si obedecemos el siguiente código de representación gráfica

Finalmente, nuestra imagen digital quedaría como:

En la representación computacional de una imagen se debe aclarar cuantos bits ocupa cada
elemento (pixel). En el ejemplo anterior, al tener solo cuatro niveles de intensidad, basta con
representar cada elemento con dos bits. De forma estandarizada, las imágenes digitales se
representan con 8 bits, alcanzando así una representación de energía cuantizada en 256
niveles (0 a 255).
Dado que las imágenes digitales pueden ser tratadas como matrices, se pueden realizar
distintas operaciones simples con ellas, por ejemplo:
• Sumas y restas
• Multiplicación por constante
• Composiciones lineales
• Operaciones pixel a pixel
Estas operaciones están sujetas a la conformabilidad (compatibilidad de dimensiones) entre
las respectivas matrices, por ejemplo, al sumar dos imágenes, resulta necesario que posean
las mismas dimensiones.
Una imagen digital puede ser representada como una matriz de intensidades de un solo tipo
de radiación. En este caso, la imagen se le conoce como “de intensidad” o “monocromática”.
Cuando la información a representar requiere mayor complejidad, una opción consiste en
emplear múltiples tipos de radiación, generándose así un arreglo de matrices de intensidad
(hipermatriz) una por cada tipo de energía. El ejemplo por excelencia para este tipo de
imágenes son las fotografías digitales a color, donde se emplean tres tipos de luz visible, Rojo
(R), verde (G) y azul (B)
Esta forma de generar la sensación de las imágenes a color a partir de la combinación lineal
de tres estímulos monocromáticos esta sustentado en la forma en la que se constituyen las
células fotosensibles, específicamente, los conos. Partiendo de este hecho, es como se
sustenta la teoría tricromática del color, la cual dice que (en principio) cualquier sensación
de color es posible emularla a través de la combinación lineal de tres estímulos, nombrados
primarios (R, G y B).
Cada espacio generado por un conjunto de tres coordenadas cromáticas se le conoce como
espacio de color. El RGB es un espacio cartesiano que comúnmente se emplea para la
representación de colores en dispositivos de despliegue digitales.

Adicionalmente, existen otros espacios de color que tienen utilidades en otros contextos, por
ejemplo:
• CMY: Espacio complementario al RGB, sumamente útil para medios impresos. Los
estímulos primarios son el Cyan, Magenta y el Amarillo
• CMYK: Basado en el anterior, adicionando una coordenada adicional, el Negro
• HSV: Espacio no cartesiano, cuyas coordenadas se definen de la siguiente manera
o H (Hue o matiz): Es la representación en una escala normalizada y circular de
0 a 1 de la escala de luz visible
o S (Saturación): Es una cuantificación del nivel de mezcla de un cierto matiz
con blanco. En palabras llanas, indica que tal “pastel” es un color.
o V (Valor): Es la cantidad de “iluminación” que posee un color, donde la
nulidad representa el cero, y el todo representa el blanco

Otros espacios de color:


• HSL • YUV • XYZ
• YIQ • YCbCr • CIELab
Transformaciones de espacios de color, con coordenadas normalizadas (rango 0 a 1)
De RGB a CMY De CMY a RGB

𝐶 1−𝑅 𝑅 1−𝐶
[𝑀 ] = [1 − 𝐺 ] [ 𝐺 ] = [1 − 𝑀 ]
𝑌 1−𝐵 𝐵 1−𝑌

De RGB a HSV (pixel a pixel) De RGB a HSV (pixel a pixel)

También existe el muy extendidamente empleado procedimiento de transformar una imagen


tricromática a una versión monocromática, también conocida como “escala de grises” y mal
llamada “blanco y negro”. En ese caso, la transformación consiste en un promedio ponderado
de las tres capas (R, G y B) para generar una sola matriz de intensidad. De forma popular,
existen estas versiones de promedio:
𝐼𝑟𝑜𝑗𝑜 (𝑥, 𝑦) 𝐼𝑣𝑒𝑟𝑑𝑒 (𝑥, 𝑦) 𝐼𝑎𝑧𝑢𝑙 (𝑥, 𝑦)
𝐼𝑔𝑟𝑖𝑠1 (𝑥, 𝑦) = + +
3 3 3
𝐼𝑔𝑟𝑖𝑠2 (𝑥, 𝑦) = 0.299𝐼𝑟𝑜𝑗𝑜 (𝑥, 𝑦) + 0.487𝐼𝑣𝑒𝑟𝑑𝑒 (𝑥, 𝑦) + 0.114𝐼𝑎𝑧𝑢𝑙 (𝑥, 𝑦)
Listado de funciones útiles de Matlab para lectura y manipulación simple de imágenes
• imread: Ayuda a leer una imagen digital y devuelve una matriz(hipermatriz) con los
datos numéricos de la imagen
• imshow: Despliega en una figura de Matlab una imagen representada por una matriz
o hipermatriz
• rgb2gray: Transforma una matriz tricromática a su versión en escala de grises
• size: Ayuda a determinar las dimensiones de una matriz, en la forma renglones por
columnas
• mat2gray: Ayuda a mapear los valores de una matriz a un rango entre 0 y 1,
convirtiendo dichos valores a formato double
• imwrite: Sirve para guardar una matriz asociada a una imagen, a un formato formal
de imagen para abrir con cualquier otro programa
Tips
1) Para acceder únicamente a una capa de una imagen tricromática, se puede emplear
algo como lo siguiente (tomando como ejemplo la capa roja)

2) Para crear una submatriz que sea una porción de una cierta imagen, se puede hacer
algo como lo siguiente (tomando como ejemplo el cuadrante superior izquierdo)

3) Las operaciones que se realicen de pixel a pixel estarían ordenadas en dos ciclos for
anidados, para hacer un barrido como el de una matriz regular
4) Todas las operaciones que matemáticas y aritméticas que se apliquen a los valores de
los pixeles deben ser realizadas después de un proceso de normalización y conversión
a tipo double
5) Ciertas operaciones que se pueden hacer sobre todos los pixeles al mismo tiempo se
pueden hacer de forma directa (sin hacer ciclos), como sería el tratamiento de una
matriz regular.

RECORDAR
“En lo general, el procesamiento digital de imágenes consiste en aplicar
transformaciones a imágenes digitales para extraer la información que ellas
contienen. Dichas transformaciones se aplican en forma de algoritmos
computacionales”

También podría gustarte