Está en la página 1de 44

Universidad Autónoma del

Estado de México.
Centro Universitario UAEMEX Valle de Chalco

M. E. Horacio Jesús Tacubeño Cruz.


Procesamiento de Imágenes

Fundamentos
Índice
• Conceptos Fundamentales de procesamiento de Imágenes
• Operaciones básicas con imágenes digitales en escala de ...
• Filtrado espacial en imágenes digitales
• Espacios de color y transformaciones colorimétricas
• Procesamiento morfológico
Conceptos Fundamentales de
procesamiento de Imágenes
Sistema visual humano
El sistema visual humano es uno de los mecanismos
de procesamiento de imágenes más poderosos que
existen. Este sistema es capaz de detectar, analizar y
almacenar imágenes con un gran poder de
procesamiento.
En general, el procesamiento de imágenes consiste
en alterar la información visual para obtener
mejores resultados o para aislar algunas
características particulares de las imágenes.
El ojo
• El ojo es el detector de las señales visuales.
Efectúa la focalización de las imágenes
provenientes del exterior para que la retina
pueda recibir la imagen.
La retina
• La retina es la capa sensorial del ojo. Ella lleva a cabo
la transducción de una señal electromagnética (la
imagen) a electroquímica (impulsos nerviosos) y
efectúa un pre-tratamiento de la información antes
de enviarla al cerebro por medio del nervio óptico.
Visión Humana
Input: Estímulo Visual (espacial/temporal)
Output: Modelo interno del mundo
Goal: Medir, clasificar, e interpretar información
visual
Visión Computacional
Métodos computacionales y algoritmos usados
para:
❖Simular visión humana / cognición
❖Input: imagenes and video (datos 3d?)
❖Output: modelo del mundo
❖Goal (objetivo): medir, clasificar, interpretar
información visual
Campos de la visión
computacional
Visión y otros campos

Psicología cognitiva Procesamiento de la señal

Inteligencia artificial Visión por computador Análisis de patrones

Gráficos de computadora
Metrología
Algunas áreas
Diversas Aplicaciones
▪ AI: visión es la entrada “input stage”
▪ Medicina: comprendiendo la visión humana/ cirugía
aumentada
▪ Ingeniería y computación: Extracción de modelos
▪ Graficas: Generación de contenido /”authoring”
Objetivo de la visión
computacional
El objetivo de la visión computacional (VC) es
tomar decisiones útiles acerca de los objetos
físicos reales del mundo (de escenas) en base a
imágenes adquiridas digitalmente.
Por lo tanto, la tarea de la VC es la construcción
de:
– Descriptores de la escena en base a características
– Relevantes contenidas en una imagen
PROCESAMIENTO DE BAJO NIVEL,
NIVEL INTERMEDIO, ALTO NIVEL
VISIÓN DE BAJO NIVEL
Adquisición
a) Adquisición
• Las computadoras solo pueden procesar imágenes digitales, es necesario
utilizar un digitalizador para el procesamiento de imágenes
• Un digitalizador de imágenes debe ser capaz de:
– Dividir la imagen en pixeles
– Medir el nivel de gris de la imagen para cada pixel (intensidad).
– Cuantizar esa medición continua para producir un valor entero y luego
escribir estos datos en un dispositivo de almacenamiento.
Adquisición
• El esquema de subdivisión más común es la grilla de muestreo
rectangular.
• Un digitalizador debe tener cinco elementos fundamentales:
– Muestreador, que le permita acceder a cada pixel individualmente.
– Mecanismo de barrido que le permita recorrer toda la imagen.
– Sensor (transductor) que mida la brillantez de la imagen en cada pixel.
– Cuantizador encargado de convertir la señal eléctrica entregada por el
sensor en valores enteros proporcionales a la intensidad de luz,
típicamente es un circuito electrónico llamado Conversor Analógico
Digital.
– Medio de salida. Los niveles de gris producidos por el cuantizador
deben almacenarse en un formato apropiado para que puedan ser
procesados posteriormente.
Características.
Entre las características mas importantes de un digitalizador
podemos citar:
– El ancho del muestreo.
– El espaciado entre pixeles adyacentes
– El tamaño de la imagen de salida (determinado por el
numero máximo de líneas y el numero máximo de muestras por
línea.)
– El parámetro físico que el digitalizador mide y cuantiza
(transmitancia o densidad óptica).
– Linealidad de la digitalización.
– El numero de niveles de gris o color.
– El nivel de ruido que se mide a través de una imagen
constante de entrada, este ultimo es una
medida de la degradación de la imagen.
Preprocesado.
Conjunto de técnicas que buscan mejorar la apariencia
visual de una imagen a una forma más adecuada para
el observador humano ó análisis artificial.
Incluye técnicas de eliminación de ruido y realce de
detalles (en este caso el realce se logra mediante la
iluminación).
• Se debe dividir la imagen de acuerdo a una característica de
homogeneidad predefinida (binarización de imágenes, y
técnicas de detección de bordes.
VISIÓN DE NIVEL INTERMEDIO
Segmentación.
Realizar una partición de la imagen en regiones significativas. Los
resultados de la misma serán utilizados en etapas sucesivas para su
descripción, reconocimiento e interpretación.
El término regiones significativas depende del problema que se este
considerando.
• Ejemplo, en el caso de escenas 3-D, identificar regiones que
correspondan a objetos físicos como extraer regiones de la imagen
que correspondan a zonas residenciales, agrícolas, terrenos
naturales, etc.
• Los métodos de la segmentación asumen que las regiones a extraer
poseen algunas características homogéneas distintivas. Pueden
existir limites físicos entre regiones similares que no aparecen como
tales en la imagen.
• De igual manera pueden aparecer limites que no corresponden a
limites físicos, la textura y el ruido.
Segmentación.
El problema de la segmentación puede verse como un
proceso de reconocimiento de patrones (regiones
deseadas) o como un proceso de decisión (si un pixel
pertenece a una u otra región de segmentación), proceso
cuyo fin último es establecer limites entre regiones.
El proceso de decisión utiliza en su forma mas simple una
única variable, por ejemplo, el nivel de gris de un pixel.
Las técnicas utilizadas en segmentación se pueden
clasificar como:
➢ de discontinuidad
➢ de similitud
Representación y descripción
d) Representación y Descripción
A la salida los datos de pixeles están en bruto, que
constituyen bien el contorno de una región o bien todos los
puntos de una región determinada.
Es necesario convertir los datos a una forma adecuada.
• Considerar los datos si se presentaran con un contorno
o como una región completa.
Representación y descripción
La representación regional puede tener propiedades
internas, como la textura o la estructura de un objeto.
En cuanto al reconocimiento de caracteres,
descriptores tales como lagos (agujeros) y bahías
proporcionan rasgos poderosos que ayudan a
diferenciar una parte del alfabeto de otra.
Reconocimiento e
Interpretación
e) Reconocimiento e Interpretación
El reconocimiento es el proceso que asigna una etiqueta a
un objeto basándose en la información proporcionada por
sus descriptores.
La interpretación implica asignar significado a un conjunto
de objetos reconocidos.
El conocimiento sobre un dominio del problema está
codificado en un sistema de procesamiento de imágenes
como una base de datos de conocimiento.
Pixeles
• Es la menor unidad homogénea en color que
forma parte de una imagen digital.
• Entonces, los píxeles son submuestras de una
imagen que, al combinarse, nos da la imagen
completa
Resolución de Imagenes
• La resolución de imagen es el número de
píxeles presentes en una imagen. A mayor
número de píxeles, mejor calidad.
PPI - DPI
Unidades de medida para la resolución de imagen.
▪ PPI significa “píxeles por pulgada”
▪ DPI "puntos por pulgada".
➢ PPI, medida de densidad de imagen que relaciona
el número total de pixeles de un monitor con su
tamaño en pulgadas (inches), en la dirección
horizontal y en la dirección vertical.
➢ DPI, Está relacionado a la impresión. Cuando
imprimimos una imagen y miramos una pulgada
de la impresión, la el número de puntos de tinta
utilizados está representado por DPI.
PPI - DPI
• PPI se ve más suave mientras que DPI es más
nítido.
Imágenes Bitmap
• Los valores de píxeles, son un rango de números
enteros. Pero, cuando convertimos el rango de
enteros en bytes, tenemos un mapa de bits imagen.
• Un mapa de bits es una imagen
binaria en la que cada píxel tiene
Representan el blanco o el negro
Compresión de Imágenes
• La compresión de datos se refiere al proceso
de reducir la cantidad de datos necesarios
para representar una determinada cantidad
de información. Sabemos que una
característica común seguida por todas las
imágenes es la vecina de píxeles y todos los
píxeles están correlacionados entre sí, por lo
que existe la posibilidad de que exista
información redundante.
Compresión de Imágenes
Tipos de redundancia en el contexto de píxeles vecinos:
en términos generales, tenemos tres tipos de
redundancia en píxeles de imágenes
➢ Redundancia espacial: En la redundancia espacial
existe una correlación entre los valores de los píxeles
vecinos .
➢ Redundancia espectral: en la redundancia espectral
existe una correlación entre diferentes planos de color
o bandas espectrales .
➢ Redundancia temporal: en la redundancia temporal
existe una correlación entre fotogramas adyacentes en
la secuencia de la imagen.
Compresión de imagen.
Compresión de imagen con pérdida. La compresión de
imagen puede ser con pérdida (Lossy) o sin pérdida
(LossLess).

• Codificación sin pérdida →transmisión a UDP.


• Compresión con pérdida→ imagen comprimida
→sobre un protocolo sin pérdida de datos como TCP.
Compresión de imagen
Métodos de codificación de compresión con pérdida:
• Codificación predictiva con pérdidas.
• Codificación de la transformada.
Métodos de codificación de compresión sin pérdida:
• Codificación de longitud variable (Codificación Huffman y
otros).
• Codificación en planos de bits: descomposición y RLE.
• Fundamentos de LZW y CCYTT.
• Codificación predictiva sin pérdidas.
Lectura de Imágenes
• Las imágenes se codifican como matrices. En
particular, las imágenes de intensidad o escala
de grises se codifican como una matriz de dos
dimensiones, donde cada número representa
la intensidad de un pixel.

• Pero eso significa que cualquiera de estas


matrices que generamos se puede visualizar
como una matriz.
Formato de Imágenes de
archivo
• Los formatos de archivos más utilizados son:
Operaciones básicas con imágenes digitales
en escala de grises
Histograma
Un histograma es una gráfica en donde se
muestra la frecuencia con las que aparecen los
distintos niveles de intensidad de una imagen a
escala de grises.
– Nivel Intensidad (0 a 255), 0 valor en negro, 255
blanco
– Con un histograma podemos modificar
características de una imagen (brillo y contraste)
Histograma
Profundidad de color
Intensidad
• Intensidad: La intensidad determina la presencia de brillo en
el color y puede ser considerada débil (baja) o fuerte (alta),
por ejemplo, el color amarillo tiene una tonalidad fuerte o
alta en comparación con el color marrón, más opaco, por lo
tanto, de poca intensidad
Profundidad de color
Intensidad
• Es el valor de gris que puede adoptar cada píxel.
• La cantidad de valores posibles que puede adoptar
un píxel se denomina Profundidad de Color.
• Usualmente se mide en potencias de 21, 28, 216
Pixel
• Profundidad de tonos grises.
Pixel
• Profundidad de tonos grises.
Pixel
• Profundidad de tono grises.
Grillado - resolución

También podría gustarte