Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 1: Introducción
Sentidos: Los medios por los que interaccionamos con el mundo que nos rodea
Definiciones:
Análisis de las imágenes a través de computadores para obtener una descripción de los objetos
físicos que son captados por la cámara.
Aplicaciones industriales:
Sociedad de la imagen:
Tecnologías implicadas
Tecnología electrónica
Ingeniería de software
Inteligencia artificial
Grados de libertad
Exactitud
Elementos de hardware
Ópticas
Objetivo
Captar los rayos luminosos y concentrarlos sobre el elemento sensible de la cámara. Está
compuesto por la disposición de un cierto número de lentes que actúan como una sola lente
convexa
Distancia Focal f
Los rayos paralelos que pasan por una lente convexa convergen hacia un punto (punto focal).
Cuanto menor sea la distancia focal mayor será el ángulo de visión del objetivo, incrementando
así el tamaño de la escena que vemos.
Cuanto mayor sea la distancia focal, menor es el ángulo de visión y, por tanto, disminuye ese
encuadre o tamaño de la escena.
Los autores que incluyen la visión periférica consideran que los objetivos normales son los de
35mm. Los que prefieren no incluirla, optan por los 50mm
Apertura máxima (Luminosidad)
Hace referencia a la cantidad de luz que puede llegar a entrar a través de su lente frontal
Número de lentes
Material de fabricación
Recubrimientos
Tamaño
Luminosidad
Los objetivos más luminosos serán aquellos en los que su apertura de diafragma sea mayor.
Siendo esta apertura el diámetro D del diafragma situado en el interior del objetivo.
Esta apertura se mide con el Número f/. El número f/ es una escala universal de aperturas que
se basa en unidades llamadas pasos de diafragma.
Cada paso dobla o reduce a la mitad la cantidad de luz que entra por el objetivo.
Este parámetro indica la relación entre la distancia focal y el diámetro del diafragma.
En objetivos zoom lo común es encontrar dos inscripciones de las aperturas máximas. Por
ejemplo, un objetivo zoom con una distancia focal 18 - 200 mm y la inscripción 1: 3.5 - 5.6
significa que la apertura máxima cuando usemos el objetivo en 18 mm será de f/3.5 y cuando
lo usemos a 200 mm será de f/5.6.
Ópticas (Tipos)
Presentan una gran calidad óptica, introducen menos aberraciones en la imagen y son más
livianas y compactas.
De longitud focal variable (zoom).
Teleobjetivo: 70 mm o mas
Todoterreno: amplios rangos focales en una sola lente (entre 18-300 mm)
Profundidad de campo
La zona que comprende desde el punto más cercano y el más lejano de nuestro campo que sea
aceptable en cuanto a nitidez, una vez formada su imagen en el mismo plano de enfoque.
Parámetros:
Numero f/
Distancia focal
Distancia del objeto
Cámaras digitales
Todos los sensores utilizan una superficie plana formada por minúsculos receptores de luz
Sensores CCD:
La información generada por todos los pixeles se combina y se envía a la salida, donde se hará
el procesado necesario de la señal (Conversión A/D, amplificar, eliminar ruido)
Tienen mayor sensibilidad a la luz
Más calidad de imagen y rango dinámico
Mayor precio
Mayor consumo eléctrico
Pueden ser más lentos que los otros sensores
Desventaja
Al desplazar las cargas de un lado a otro se puede producir una contaminación de los pixeles
adyacentes
Smear:
Lag:
Sensores CMOS:
Almacenamiento de datos: El frame es captado línea a línea desde arriba hacia abajo
Cada celda se convierte en fotosensible en diferente instante de tiempo
Lectura de datos: Cada pixel es independiente por lo que no será necesario desplazar
las cargas para realizar A/D
Skew effect:
Wobble o tambaleo:
Matriciales
Blanco y negro
Color
o 1 sensor
o 3 sensores
Lineales
Blanco y negro
Color
o 1 sensor
o 3 sensores
Cámaras de color
Filtro Bayer
3-Sensores
Estereovisión
Consiste en capturar una misma escena desde dos o más puntos de vista y calcular el un mapa
de disparidad
Tiempo de vuelo
1. Imágenes digitales
2. Histogramas y tablas de consulta
3. Operaciones matemáticas y lógicas
Imágenes digitales
Por estos dos valores se dice que las imágenes son digitales. Toman valores discretos tanto en
el espacio xy como en la amplitud de la señal
Muestreo espacial
Imágenes digitales
Operaciones Aritméticas
AND
OR
NOT
XOR
1. Filtrado de imágenes
2. Transformaciones geométricas
3. Interpolación
Filtrado
Definición
Son aquellos algoritmos de los que se obtiene una imagen g(x,y) a partir de la imagen original
f(x,y)
Finalidad
Favorecer alguna característica de la imagen o eliminar alguna para poder analizar mejor la
imagen
Dominios:
Transformaciones geométricas
Utilidad
El valor de un píxel en la imagen de salida dependerá de las coordenadas (x,y) de ese píxel.
Solución:
Es un método básico.
Requiere un tiempo de procesado bajo.
Solo tiene en cuenta un píxel: el más cercano al punto interpolado.
Simplemente aumenta el tamaño de cada píxel.
Resultado muy pixelado y contornos muy escalonados
Método Bilineal
Tiene en cuenta los valores en los píxeles conocidos que rodean a uno dado en una
vecindad de los 2x2 píxeles más cercanos.
Se toma el promedio ponderado de estos 4 píxeles y se calcula el valor interpolado.
El resultado está más suavizado que las imágenes obtenidas utilizando el método del
píxel más cercano.
Necesita más tiempo de procesado.
Imagen con apariencia más suaves
Método Bicúbica
Un paso más allá del caso bilineal es considerar la vecindad de los 4x4 píxeles
conocidos más cercanos, es decir, un total de 16 píxeles.
Como están situados a distancias distintas del píxel de valor desconocido, se da mayor
peso en el cálculo a los más cercanos.
Produce imágenes más nítidas que los dos métodos anteriores.
Es un buen compromiso entre tiempo de procesado y calidad de resultado.
Es un procedimiento estándar en programas de edición de imágenes, drivers de
impresoras e interpolación en cámaras.
Tema 4: Ruido, contraste y bordes
1. Reducción de Ruido
2. Modificación del contraste
3. Realce de borde
4. Detección de bordes
Reducción de ruido
Efecto
Debido a:
Al sensor de la cámara
Al medio de transmisión de la señal
Alimentación de la cámara
Gaussiano
Impulsional
Frecuencial
Multiplicativo
Filtros no lineales
Mediana: En una secuencia impar de números, la mediana es aquel valor que cumple que tiene
el mismo número de valores inferiores que superiores
Modificación del contraste
Imagen ideal
La iluminación es uniforme.
La ganancia entre la luz de entrada y la imagen es lineal.
Amplitud de la escala
𝑃 = 𝑚𝑎
Realce de bordes
Resaltar aquellos pixeles que presentan un valor de gris distinto del de sus vecinos.
Ventaja:
1. Detección de movimiento
2. Segmentación
3. Transformaciones morfológicas
4. Extracción de descriptores
Restricciones:
Métodos:
Diferencias de imágenes:
Menos preciso
Más simple
Más rápido
Segmentación (Umbralización)
Fundamentos
Discontinuidad
Los objetos destacan del entorno y tienen por tanto unos bordes definidos
Similitud
Cada uno de los elementos tiene propiedades parecidas de color, textura, etc.
Segmentación (Mean-shift)
Fundamentos
Transformaciones morfológicas
Elemento estructural
La morfología presenta una forma más rápida pero inexacta para obtener este parámetro
Extracción de descriptores
Características de la región:
Características de la forma:
Descriptores topológicos.
Códigos encadenados.
Signatura.
Descriptores de Fourier.