tratamiento óptico de imágenes DARÍO JOSÉ MENDOZA CHIPANTASI Tipos y selección de cámaras
ING. DARÍO J. MENDOZA CH
¿Qué es una cámara? ❑Aparato que sirve para registrar imágenes estáticas o en movimiento. ❑Dispositivo que intenta emular el funcionamiento del ojo humano. ❑Generar imágenes 2D a partir de una escena 3D. ❑Captar la intensidad de luz correspondiente a cada color por medio de un sensor fotosensible y se puede clasificar en: ❑Señal analógica: señal de vídeo, foto impresa, diapositiva, etc. ❑Digitalizadores: digitalizador de vídeo, escáner, etc.
ING. DARÍO J. MENDOZA CH
¿Qué es una cámara?
ING. DARÍO J. MENDOZA CH
¿Qué es una cámara?
ING. DARÍO J. MENDOZA CH
¿Qué es una cámara?
ING. DARÍO J. MENDOZA CH
¿Qué es una cámara?
ING. DARÍO J. MENDOZA CH
¿Qué es una cámara?
ING. DARÍO J. MENDOZA CH
Atributos de una cámara
ING. DARÍO J. MENDOZA CH
Importancia Evitar distorsión geométrica de la lente Se manifiesta en cambios en la forma de los objetos en la imagen hay dos tipos ◦ positiva (cojín) ◦ negativa (barril) puede aparecer en imágenes perfectamente enfocadas
ING. DARÍO J. MENDOZA CH
Objetivos Resolución de la óptica Función de Modulación de Transferencia (MTF). La óptica actual como un filtro paso bajo La resolución de la lente define el mínimo detalle capaz de ser proyectado sobre el sensor (tamaño del detalle / la distancia de trabajo). Vignetting: Las ópticas producen una variación de intensidad luminosa desde el centro hacia los bordes.
ING. DARÍO J. MENDOZA CH
Tipos de ópticas usadas en visión artificial Ópticas Estándar Ópticas Zoom Estándar Ópticas de Alta Resolución (Alta sensibilidad) Ópticas de Gran Formato (Sensor de gran dimensión) Ópticas para Microcámaras Ópticas zoom de precisión ◦ Alta magnificación ◦ Enfoque a pequeñas distancias Ópticas telecéntricas.
ING. DARÍO J. MENDOZA CH
Fundamentos de óptica Es necesario utilizar lentes para conseguir: ◦ Suficiente luminosidad. ◦ Correspondencia de punto a punto. Lente es: ◦ Sistema óptico centrado formado por dos dioptrios de los cuales al menos uno es esférico y dos medios externos con el mismo índice de refracción que la limitan. ◦ Componente de vidrio o plástico transparente, usualmente circular, que tiene dos superficies primarias que son talladas y pulidas de una forma específica, diseñada para producir bien convergencia o bien divergencia de la luz que atraviesa el material
ING. DARÍO J. MENDOZA CH
Enfoque Una imagen, o punto de imagen o región está enfocada si la luz procedente de los puntos del objeto converge tan bien como sea posible en la imagen.
La frontera entre estas dos condiciones viene dada por el círculo de
confusión
ING. DARÍO J. MENDOZA CH
Desenfoque se refiere a una traslación sobre el eje óptico fuera del plano de enfoque óptimo. reduce la precisión y el contraste de la imagen ◦ los bordes bien definidos se transforman en transiciones graduales ◦ los detalles pequeños se emborronan o pierden Casi todos los dispositivos ópticos tienen algún tipo de ajuste de enfoque para minimizar el desenfoque y maximizar la calidad de la imagen
ING. DARÍO J. MENDOZA CH
Círculo de confusión En óptica: Es una mancha causada por un cono de rayos de luz que procede de una fuente puntual y que al atravesar la lente no se enfoca perfectamente. En fotografía: Es el mayor círculo borroso que todavía se percibe como un punto por el ojo humano cuando se observa a una distancia de 25 cm.
ING. DARÍO J. MENDOZA CH
Analogía a la agudeza visual humana Agudeza visual: a 25 cm (límite cercano de visión) un observador normal distingue cinco líneas por milímetro, es decir, detalles de 0.2 mm.
Condiciones de observación: una distancia cómoda de observación es la que ofrece un
ángulo de visión 60º, lo que a 25 cm se corresponde con el tamaño letter; si la imagen es mayor, se alejará más de 25 cm y se permitirá un CoC mayor.
ING. DARÍO J. MENDOZA CH
Profundidad de campo (DOF) sólo hay una distancia a la que el objeto está enfocado perfectamente ◦ el enfoque decae gradualmente a ambos lados de ese punto ◦ si no supera el círculo de confusión aparece enfocado ◦ esta región es mayor en el lado lejano que en el cercano
ING. DARÍO J. MENDOZA CH
Apertura Es el orificio a través del que la luz penetra en la cámara. Más específicamente, la apertura de un sistema óptico es el orificio que determina el ángulo del cono de un haz que se enfoca sobre el plano de imagen.
ING. DARÍO J. MENDOZA CH
Cámaras
ING. DARÍO J. MENDOZA CH
Sensor de Imagen – Dispositivos de captura ❑Captar la intensidad de luz correspondiente a cada color por medio de un sensor fotosensible y se puede clasificar en: ❑Señal analógica: señal de vídeo, foto impresa, diapositiva, etc. ❑Digitalizadores: digitalizador de vídeo, escáner, etc.
ING. DARÍO J. MENDOZA CH
Cámaras ❑Elementos fundamentales ❑Óptica ❑Proyectar la información luminosa sobre los elementos fotosensibles. ❑Elementos fotosensibles ❑Convierte la señal luminosa en señal eléctrica. ❑Electrónica asociada ❑Corrige y trata la señal eléctrica proporcionada por el elemento fotosensible
ING. DARÍO J. MENDOZA CH
Características de un digitalizador ❑Tamaño de la imagen. ❑Tamaño del píxel. ❑Propiedad física medida. ❑Linealidad. ❑Nivel de ruido.
ING. DARÍO J. MENDOZA CH
Cámara – Tamaño de la imagen ❑Ancho y alto de las imágenes tomadas. ❑Depende del número de píxeles de fotodetector. ❑En cámaras fotográficas se mide en megapíxeles. ❑Por ejemplo, resolución máxima: 2048x1536 → 3,34 megapíxeles. ❑En cámaras de vídeo suele ser mucho menor. No suele pasar de 800x600 0,48 megapíxeles.
ING. DARÍO J. MENDOZA CH
Cámara – Densidad de píxel ❑Determina la cantidad de píxeles en una determinada área ❑Es más relevante, por ejemplo, en escáneres. ❑Píxel = unidad básica de la imagen.
ING. DARÍO J. MENDOZA CH
Cámara – Propiedad física de medida ❑Luz ❑Infrarroja ❑Ultravioleta ❑Etc.
ING. DARÍO J. MENDOZA CH
Sensor de color
ING. DARÍO J. MENDOZA CH
Sensor de color
ING. DARÍO J. MENDOZA CH
Nivel de ruido Ante una escena de color uniforme todos los píxeles deberían ser iguales. Pero nunca lo son. El ruido se mide en relación al nivel de contraste en la imagen.
ING. DARÍO J. MENDOZA CH
CCD - Charge Coupled Device – (Dispositivos de carga acoplada) Se han impuesto en muchos ámbitos: fotografía digital, vídeo digital, cámaras de TV, astronomía, microscopía, escáneres, etc. Utilizan sensores de silicio. El CCD es un chip que integra una matriz de fotodetectores. Cuando llega un fotón, el semiconductor libera electrones. Cada celda es un pozo, que acumula los electrones que han saltado (similar a un condensador). El nº de electrones es proporcional a la intensidad de luz
ING. DARÍO J. MENDOZA CH
CCD - Charge Coupled Device – (Dispositivos de carga acoplada)
ING. DARÍO J. MENDOZA CH
CCD – (Dispositivos de carga acoplada) – Características. Son muy usados en muchos ámbitos, pero también tienen sus limitaciones: Corriente oscura (dark current): los electrones saltan al llegar un fotón, pero también pueden hacerlo por el calor. Campo de estrellas: las imperfecciones provocan algunos píxeles con alta corriente oscura. Aunque no llegue luz, aparecen iluminados. Ruido fotónico: debido a la naturaleza cuántica de la luz. Es mayor con escasa iluminación. Rebosamiento (blooming): cuando un pozo se llena de electrones, se desparrama su contenido a los píxeles cercanos.
ING. DARÍO J. MENDOZA CH
CCD – (Dispositivos de carga acoplada) – Características.
ING. DARÍO J. MENDOZA CH
CMOS - Complementary Metal Oxide Semiconductor – (Semiconductor complementario de Óxido Metálico) También basados en semiconductores de silicio. Diferencia con CCD: cada píxel incorpora su propia circuitería, se pueden leer y seleccionar independientemente (sin necesidad de desplazamientos).
ING. DARÍO J. MENDOZA CH
CMOS - Complementary Metal Oxide Semiconductor – (Semiconductor complementario de Óxido Metálico) Ventajas: suelen ser más rápidos, tienen mejor integración (necesitan menos circuitería) y disminuyen el blooming. Inconvenientes: hay menos espacio de captura en el chip (menos luz), son menos uniformes (hay más ruido) y necesitan búfferes. Las cámaras fotográficas digitales suelen usar CCD. Las cámaras de videoconferencia suelen usar CMOS, aunque las de más calidad usan CCD. Las diferencias entre unas y otras son cada vez menores.
ING. DARÍO J. MENDOZA CH
CMOS - (Semiconductor complementario de Óxido Metálico)
Los chips CMOS suelen usarse en
aplicaciones que necesitan una velocidad de muestreo muy alta.
ING. DARÍO J. MENDOZA CH
CMOS - Complementary Metal Oxide Semiconductor – (Semiconductor complementario de Óxido Metálico) Las imágenes capturadas por una cámara no siempre corresponden a lo que ve el ojo humano. Lo que el ojo no ve: tanto los chips CCD como los CMOS son sensibles a la radiación infrarroja.
ING. DARÍO J. MENDOZA CH
Iluminación
ING. DARÍO J. MENDOZA CH
Iluminación ❑Capturar la imagen en las mejores condiciones posibles para su posterior análisis. ❑Técnicas básicas: ❑Frontal ❑Retroiluminación ❑Iluminación estructurada
Iluminación – Frontal - Omnidireccional ❑Elimina sombras ❑Análisis de objetos de superficies suaves
ING. DARÍO J. MENDOZA CH
Iluminación – Frontal - Direccional ❑Potencia la aparición de sombras ❑Imágenes de alto contraste ❑Localización y reconocimiento de texturas / piezas
ING. DARÍO J. MENDOZA CH
Iluminación – Frontal - Estroboscópica ❑Iluminación disparo controlado, alta potencia y bajo tiempo de activación. ❑Objetos en movimiento.
ING. DARÍO J. MENDOZA CH
Iluminación - Retroiluminación – Campo luminoso ❑Resalte de los contornos ❑Obtención de imágenes con dos niveles de gris ❑Localización de piezas ❑Análisis dimensional
ING. DARÍO J. MENDOZA CH
Iluminación - Retroiluminación – Campo oscuro ❑Detecta contornos de materiales transparentes / translúcidos ❑Aprovecha las propiedades de reflexión del material ❑Genera una especie de sección transversal ❑Genera imágenes de alto contraste en este tipo de material
ING. DARÍO J. MENDOZA CH
Iluminación – Estructurada - Polarizada ❑Se permite un plano de vibración del campo E de la luz ❑Eliminación de reflejos (agua, espejismo) ❑Polarizando verticalmente ❑Fotoelasticidad ❑Se estudia el efecto de tensiones en materiales transparentes
ING. DARÍO J. MENDOZA CH
Iluminación – Estructurada – Patrón Plano Láser ❑Proyecta un patrón conocido sobre la pieza. ❑La deformación del patrón da información 3D de la pieza. ❑Detección de objetos. ❑Medida. ❑Visión 3D.
ING. DARÍO J. MENDOZA CH
Iluminación – Estructurada - Polarizada
ING. DARÍO J. MENDOZA CH
Imagen digital
ING. DARÍO J. MENDOZA CH
Introducción a laposee Punto en una imagen adquisición coordenadasde x,yimágenes ◦ 𝑥 = 𝑥, 𝑦 = 𝑝𝑡1 Puede ser representado con coordenadas homogéneas ◦ 𝑥ҧ = 𝑥, 𝑦, 𝑤 =𝑤 𝑥, 𝑦, 1 = 𝑤 𝑥 donde 𝑥 = 𝑥, 𝑦, 1 es el vector aumentado. Líneas 2D ◦ 𝑙ሚ = 𝑎, 𝑏, 𝑐 ; 𝑥ҧ 𝑙ሚ = 𝑎𝑥 + 𝑏𝑦 + 𝑐 = 0 Línea 2D normalizada l = 𝑛ො 𝑥 , 𝑛ො 𝑦 , 𝑑 = 𝑛, ො 𝑑 con 𝑛ො = 1 ◦ En este caso 𝑛ො es el vector normal perpendicular (distancia) desde la línea al origen. ◦ También se puede expresar 𝑛ො en función de rotación de un ángulo θ, ො 𝑛ො x , 𝑛ො 𝑦 = (𝑐𝑜𝑠θ, 𝑠𝑖𝑛θ) → usado en la transformada Hough 𝑛= Introducción a la adquisición de imágenes Introducción a la adquisición de imágenes – Transformaciones 2D Traslación Rotación Introducción a la adquisición de imágenes ¿Qué es una imagen digital? ◦ Puede considerarse como una representación de información tanto espacial (ubicación) como de intensidad (color). ◦ Ubicación – disposición ◦ Una imagen de 2D discreta es representada por (m,n), I(m,n) Formatos de almacenamiento
ING. DARÍO J. MENDOZA CH
Formatos de almacenamiento. Diferencias entre los formatos: Niveles de profundidad admitidos: ◦ 1 bit → Imágenes en blanco y negro ◦ 1 byte → Escala de grises o paleta de 256 colores ◦ 3 bytes → Modelo RGB Tipo de compresión: Sin pérdida: Run Length Encoding RLE, Lempel Ziv Welch Con pérdida: mediante Fast Fourier Transform FFT, Discrete Cosine Transform DCT, wavelets
ING. DARÍO J. MENDOZA CH
Formatos de almacenamiento. Paleta de colores: es una tabla de tamaño n, donde cada posición es un color (normalmente en RGB).
ING. DARÍO J. MENDOZA CH
Formatos de almacenamiento. Compresión sin pérdida: si se comprime y luego se descomprime se obtiene la misma imagen. Compresión con pérdida: no se obtiene la misma imagen, hay una pérdida de calidad en la imagen.
ING. DARÍO J. MENDOZA CH
Formatos de almacenamiento -RLE. Sin pérdida. Se basa en detectar la repetición de un mismo valor. Un valor no repetido se almacena directamente. Un valor repetido se almacena de forma especial, mediante un par (Valor, Nº repeticiones). Ejemplo. Dibujo bandera: 3, 3, 3, 4, 4, 4, 4, 4, 4, 0, 1, 1, ...Imagen comprimida: (3, 3), (4, 6), 0, (1, 2), ...
ING. DARÍO J. MENDOZA CH
Formatos de almacenamiento – FFT – DCT - Wavelets. Idea: si se permite cierta pérdida en la calidad de las imágenes es posible alcanzar cotas más altas de compresión. Cuanta más compresión, más pérdida de calidad. La mayoría de las técnicas están basadas en análisis frecuencial de las imágenes. Recordatorio. Descomposición en series de Fourier: cualquier señal continua se puede expresar como una suma de señales sinusoidales.
ING. DARÍO J. MENDOZA CH
Formatos de almacenamiento – FFT – DCT - Wavelets.