Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estado de México.
Centro Universitario UAEMEX Valle de Chalco
Fundamentos
Índice
• Conceptos Fundamentales de procesamiento de Imágenes
• Operaciones básicas con imágenes digitales en escala de ...
• Filtrado espacial en imágenes digitales
• Espacios de color y transformaciones colorimétricas
• Procesamiento morfológico
Conceptos Fundamentales de
procesamiento de Imágenes
Sistema visual humano
El sistema visual humano es uno de los mecanismos
de procesamiento de imágenes más poderosos que
existen. Este sistema es capaz de detectar, analizar y
almacenar imágenes con un gran poder de
procesamiento.
En general, el procesamiento de imágenes consiste
en alterar la información visual para obtener
mejores resultados o para aislar algunas
características particulares de las imágenes.
El ojo
• El ojo es el detector de las señales visuales.
Efectúa la focalización de las imágenes
provenientes del exterior para que la retina
pueda recibir la imagen.
La retina
• La retina es la capa sensorial del ojo. Ella lleva a cabo
la transducción de una señal electromagnética (la
imagen) a electroquímica (impulsos nerviosos) y
efectúa un pre-tratamiento de la información antes
de enviarla al cerebro por medio del nervio óptico.
Visión Humana
Input: Estímulo Visual (espacial/temporal)
Output: Modelo interno del mundo
Goal: Medir, clasificar, e interpretar información
visual
Visión Computacional
Métodos computacionales y algoritmos usados
para:
❖Simular visión humana / cognición
❖Input: imagenes and video (datos 3d?)
❖Output: modelo del mundo
❖Goal (objetivo): medir, clasificar, interpretar
información visual
Campos de la visión
computacional
Visión y otros campos
Gráficos de computadora
Metrología
Algunas áreas
Diversas Aplicaciones
▪ AI: visión es la entrada “input stage”
▪ Medicina: comprendiendo la visión humana/ cirugía
aumentada
▪ Ingeniería y computación: Extracción de modelos
▪ Graficas: Generación de contenido /”authoring”
Objetivo de la visión
computacional
El objetivo de la visión computacional (VC) es
tomar decisiones útiles acerca de los objetos
físicos reales del mundo (de escenas) en base a
imágenes adquiridas digitalmente.
Por lo tanto, la tarea de la VC es la construcción
de:
– Descriptores de la escena en base a características
– Relevantes contenidas en una imagen
PROCESAMIENTO DE BAJO NIVEL,
NIVEL INTERMEDIO, ALTO NIVEL
VISIÓN DE BAJO NIVEL
Adquisición
a) Adquisición
• Las computadoras solo pueden procesar imágenes digitales, es necesario
utilizar un digitalizador para el procesamiento de imágenes
• Un digitalizador de imágenes debe ser capaz de:
– Dividir la imagen en pixeles
– Medir el nivel de gris de la imagen para cada pixel (intensidad).
– Cuantizar esa medición continua para producir un valor entero y luego
escribir estos datos en un dispositivo de almacenamiento.
Adquisición
• El esquema de subdivisión más común es la grilla de muestreo
rectangular.
• Un digitalizador debe tener cinco elementos fundamentales:
– Muestreador, que le permita acceder a cada pixel individualmente.
– Mecanismo de barrido que le permita recorrer toda la imagen.
– Sensor (transductor) que mida la brillantez de la imagen en cada pixel.
– Cuantizador encargado de convertir la señal eléctrica entregada por el
sensor en valores enteros proporcionales a la intensidad de luz,
típicamente es un circuito electrónico llamado Conversor Analógico
Digital.
– Medio de salida. Los niveles de gris producidos por el cuantizador
deben almacenarse en un formato apropiado para que puedan ser
procesados posteriormente.
Características.
Entre las características mas importantes de un digitalizador
podemos citar:
– El ancho del muestreo.
– El espaciado entre pixeles adyacentes
– El tamaño de la imagen de salida (determinado por el
numero máximo de líneas y el numero máximo de muestras por
línea.)
– El parámetro físico que el digitalizador mide y cuantiza
(transmitancia o densidad óptica).
– Linealidad de la digitalización.
– El numero de niveles de gris o color.
– El nivel de ruido que se mide a través de una imagen
constante de entrada, este ultimo es una
medida de la degradación de la imagen.
Preprocesado.
Conjunto de técnicas que buscan mejorar la apariencia
visual de una imagen a una forma más adecuada para
el observador humano ó análisis artificial.
Incluye técnicas de eliminación de ruido y realce de
detalles (en este caso el realce se logra mediante la
iluminación).
• Se debe dividir la imagen de acuerdo a una característica de
homogeneidad predefinida (binarización de imágenes, y
técnicas de detección de bordes.
VISIÓN DE NIVEL INTERMEDIO
Segmentación.
Realizar una partición de la imagen en regiones significativas. Los
resultados de la misma serán utilizados en etapas sucesivas para su
descripción, reconocimiento e interpretación.
El término regiones significativas depende del problema que se este
considerando.
• Ejemplo, en el caso de escenas 3-D, identificar regiones que
correspondan a objetos físicos como extraer regiones de la imagen
que correspondan a zonas residenciales, agrícolas, terrenos
naturales, etc.
• Los métodos de la segmentación asumen que las regiones a extraer
poseen algunas características homogéneas distintivas. Pueden
existir limites físicos entre regiones similares que no aparecen como
tales en la imagen.
• De igual manera pueden aparecer limites que no corresponden a
limites físicos, la textura y el ruido.
Segmentación.
El problema de la segmentación puede verse como un
proceso de reconocimiento de patrones (regiones
deseadas) o como un proceso de decisión (si un pixel
pertenece a una u otra región de segmentación), proceso
cuyo fin último es establecer limites entre regiones.
El proceso de decisión utiliza en su forma mas simple una
única variable, por ejemplo, el nivel de gris de un pixel.
Las técnicas utilizadas en segmentación se pueden
clasificar como:
➢ de discontinuidad
➢ de similitud
Representación y descripción
d) Representación y Descripción
A la salida los datos de pixeles están en bruto, que
constituyen bien el contorno de una región o bien todos los
puntos de una región determinada.
Es necesario convertir los datos a una forma adecuada.
• Considerar los datos si se presentaran con un contorno
o como una región completa.
Representación y descripción
La representación regional puede tener propiedades
internas, como la textura o la estructura de un objeto.
En cuanto al reconocimiento de caracteres,
descriptores tales como lagos (agujeros) y bahías
proporcionan rasgos poderosos que ayudan a
diferenciar una parte del alfabeto de otra.
Reconocimiento e
Interpretación
e) Reconocimiento e Interpretación
El reconocimiento es el proceso que asigna una etiqueta a
un objeto basándose en la información proporcionada por
sus descriptores.
La interpretación implica asignar significado a un conjunto
de objetos reconocidos.
El conocimiento sobre un dominio del problema está
codificado en un sistema de procesamiento de imágenes
como una base de datos de conocimiento.
Pixeles
• Es la menor unidad homogénea en color que
forma parte de una imagen digital.
• Entonces, los píxeles son submuestras de una
imagen que, al combinarse, nos da la imagen
completa
Resolución de Imagenes
• La resolución de imagen es el número de
píxeles presentes en una imagen. A mayor
número de píxeles, mejor calidad.
PPI - DPI
Unidades de medida para la resolución de imagen.
▪ PPI significa “píxeles por pulgada”
▪ DPI "puntos por pulgada".
➢ PPI, medida de densidad de imagen que relaciona
el número total de pixeles de un monitor con su
tamaño en pulgadas (inches), en la dirección
horizontal y en la dirección vertical.
➢ DPI, Está relacionado a la impresión. Cuando
imprimimos una imagen y miramos una pulgada
de la impresión, la el número de puntos de tinta
utilizados está representado por DPI.
PPI - DPI
• PPI se ve más suave mientras que DPI es más
nítido.
Imágenes Bitmap
• Los valores de píxeles, son un rango de números
enteros. Pero, cuando convertimos el rango de
enteros en bytes, tenemos un mapa de bits imagen.
• Un mapa de bits es una imagen
binaria en la que cada píxel tiene
Representan el blanco o el negro
Compresión de Imágenes
• La compresión de datos se refiere al proceso
de reducir la cantidad de datos necesarios
para representar una determinada cantidad
de información. Sabemos que una
característica común seguida por todas las
imágenes es la vecina de píxeles y todos los
píxeles están correlacionados entre sí, por lo
que existe la posibilidad de que exista
información redundante.
Compresión de Imágenes
Tipos de redundancia en el contexto de píxeles vecinos:
en términos generales, tenemos tres tipos de
redundancia en píxeles de imágenes
➢ Redundancia espacial: En la redundancia espacial
existe una correlación entre los valores de los píxeles
vecinos .
➢ Redundancia espectral: en la redundancia espectral
existe una correlación entre diferentes planos de color
o bandas espectrales .
➢ Redundancia temporal: en la redundancia temporal
existe una correlación entre fotogramas adyacentes en
la secuencia de la imagen.
Compresión de imagen.
Compresión de imagen con pérdida. La compresión de
imagen puede ser con pérdida (Lossy) o sin pérdida
(LossLess).