Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Visión Artificial - Capítulo 1
Visión Artificial - Capítulo 1
Visin Artificial
Visin Artificial
El objetivo general de una mquina vidente es describir una escena, analizando una o mas
imgenes de la misma. En algunas situaciones la escena es bsicamente bidimensional. Por
ejemplo, en el caso de la medicin de cueros el sistema de visin artificial trabaja sobre
superficies planas, analizando las posibles perforaciones que stos tiene, es por esto que la
visin para situaciones bidimensionales es ms fcil que para las tridimensionales
Para que una mquina reconozca partes, perforaciones, etc. en una superficie, y en general
objetos, debe distinguir primero las zonas de inters del resto de la superficie. En otras
palabras, debe ser capaz de "destacar" partes de la imagen que corresponden a esas zonas.
Este proceso de extraer partes de una imagen que corresponden a lo ms relevantes de una
escena se denomina SEGMENTACION.
Cuando se ha extrado una parte de una imagen, generalmente es necesario medir varias
propiedades geomtricas de tal segmento (tamao, forma, etc.) tales medidas pueden ser la
base para reconocer si el subconjunto representa o no un objeto dado, as como para
determinar la posicin y orientacin del mismo. Tambin pueden servir de base para una
posterior segmentacin dentro del segmento; por ejemplo, si dos objetos se tocan o
superponen, puede ocurrir que hayan sido extrados como un solo segmento, y puede ser
Capitulo I
Visin Artificial
necesario dividir este subconjunto en dos partes basndose en criterios geomtricos, por
ejemplo descomponindolo en partes convexas. Esta etapa del proceso de visin se denomina
ANALISIS GEOMETRICO.
El reconocer objetos por medio del anlisis de segmentos de una imagen puede variar su
dificultad, dependiendo de la complejidad de los objetos. Si los objetos que pueden estar
presentes en la escena difieren mucho entre s, se puede usar una comparacin relativamente
sencilla con patrones o plantillas; en esta situacin, puede incluso ser innecesario extraer
explcitamente los objetos del resto de la imagen. A menudo, los objetos pueden reconocerse
porque cumplen un conjunto caracterstico de valores de sus parmetros geomtricos.
principal
Capitulo I
Visin Artificial
En la figura 1.1. se puede observar cada uno de los componentes que intervienen en un
sistema de visin artificial.
El xito de un sistema de visin industrial depende ms, del buen diseo del sistema de
iluminacin que de un anlisis sofisticado de la imagen.
Capitulo I
Visin Artificial
Los rayos de luz, en su trayectoria desde la fuente hasta la cmara, son alterados de
diferentes formas por los objetos de la escena, de manera que la luz medida por la cmara en
un punto de la misma, es representada por el valor del pxel.
Capitulo I
Visin Artificial
Un observador percibe una serie de sensaciones que le permiten reconocer y distinguir los
objetos que le rodean y al contrario, si el ambiente es privado de luz, el observador deja de
percibir las sensaciones que le permiten distinguir y reconocer objetos.
En la figura 1,3 podemos apreciar los diferentes tipos de iluminacin utilizados en la captura
de una imagen de un sistema de visin , se usan los siguientes tipos de iluminacin:
-
Capitulo I
Visin Artificial
Para un sistema de visin son interesantes aquellos procesos que permiten radiaciones
pticas, es decir, luz en el infrarrojo visible y en el ultravioleta.
La fuente de luz de un sistema de visin ha de ser seleccionada dependiendo:
En la siguiente tabla 1.1 se podr apreciar las diferentes fuentes de luz con sus respectivas
ventajas y desventajas que presentan.
Fuente
Incandescente
Ventaja
Barata
Muchas configuraciones
Tungsten-Halogeno
Fluorescente
He Ne laser
IR Laser
Larga Vida
Buena coincidencia CCD
Compacto
IR Diodos
Larga Vida
Buena coincidencia CCD
Optica Sencilla
Alta potencia
Alta eficacia
Gas Estroboscpico
Desventaja
Baja eficacia
Corta vida
Exceso de calor
Exceso de calor
Pocas configuraciones
Vibra
Frgil, corta vida
Cara, voluminoso
Sujeta a regulaciones
Gubernamentales
Optica compleja
Rayo de luz altamente divergente
Sujeta a regulaciones
Gubernamentales
Baja Potencia de Salida
Caro, voluminoso
Vida limitada
Demasiado azul para CCDs
Capitulo I
Visin Artificial
1.2.3 Adquisicin
Luego de definido el tipo de iluminacin que se va ha utilizar se desarrolla el proceso de
adquisicin de la imagen para lo cual se debe de disponer de los siguientes dispositivos:
-
Una cmara que sea sensible a una banda del espectro de energa electromagntica
(visible, infrarrojo, ultravioleta) y que produzca una seal elctrica de salida
proporcional al nivel de energa percibido.
Un digitalizador que convierta la seal elctrica de salida del dispositivo en una seal
digital.
Una tarjeta digitalizadora, que es un elemento de hardware que acepta seal de vdeo
analgica y la convierte en una seal digital.
Capitulo I
Visin Artificial
Capitulo I
Visin Artificial
Por lo tanto digitalmente una imagen en color puede ser modelada como una imagen
monocroma con tres bandas correspondiendo cada una de ellas a un color, si nuestro sistema
esta basado en una cuantificacin de ocho bit, cada uno de los colores tendr una gama de 0 a
255 niveles de intensidad.
Al igual que en los colores de pintura tenemos en los colores de luz , los colores primarios y
los colores secundarios, estos segundos son producto de la combinacin de los primeros.
Los colores secundarios, amarillo, cian y magenta se obtienen de combinar dos colores
primarios en su mxima intensidad.
figura 1.7.
Una imagen de grises se puede definir como una funcin bivariada de intensidad luminosa
f(x,y). El valor de la funcin f en el espacio de coordenadas (x,y) indica la intensidad de la luz
en ese punto (ver Ec 1.1.).
Capitulo I
Visin Artificial
Ec( 1.1.)
Irradiacin i(x,y): cantidad de luz que incide en la escena, se determina por la fuente de luz, se
mide en candelas, por ejemplo en un da claro en la superficie de la tierra se pueden recoger
unas 9000 candelas.
Reflectancia r(x,y): Cantidad de luz que reflejan los objetos de la escena, la determinan las
caractersticas del objeto. Es un factor que nos indica la capacidad del objeto de reflejar la luz,
por ejemplo 0.01 para el terciopelo negro, 0.65 para el acero, 0.93 para la nieve. Es una
magnitud a-dimensional.
f(x,y) = i(x,y) r(x,y)
Ec( 1.2.)
Ec( 1.3.)
[ Fmin, Fmax ] recibe el nombre de escala o niveles de gris. En ambientes interiores los
valores tpicos son: Fmin = 0.005 y Fmax =100.
figura 1.8. Gama de gris en formato de ocho bits (Fmin = 0 y Fmax = 255)
10
Capitulo I
Visin Artificial
figura 1.9. Muestreo de una imagen a 8bits a)diagrama de bloques de una imagen b)muestreo
de 250x250 pxeles c)muestreo de 64x64 pxeles d)muestreo de 32x32 pxeles
11
Capitulo I
Visin Artificial
Lo usual es disponer de al menos 8 bits, es decir, 256 niveles de gris como se pudo apreciar
en la figura 1.10. en donde podemos ver como la escala de grises va disminuyendo llegando a
ser crtica en la figura 1.10. (c) en donde tenemos tan solo dos estados.
Mapas de bits: estn formados por un conjunto de valores numricos que especifican
los colores de los pxeles. Otros tipos de formatos son: multimedia, hipertexto,
hipermedia, 3D, etc.
12
Capitulo I
Visin Artificial
Existen multitud de formatos para ficheros de imgenes expresadas como mapas de bits:
gif, tif, tga, bmp, pbm, pgm, etc .
Todos estos ficheros estn formados de dos componentes:
- La cabecera, donde se guarda informacin acerca del tipo de imagen, el tamao
en filas y columnas, los bits por pxel, etc.
- El mapa de bits, donde reside la imagen y que puede estar almacenada por filas
por columnas o por planos de bits.
una paleta de colores o lookup table. Varias imgenes pueden ser almacenadas
en un solo fichero.
13
Capitulo I
Visin Artificial
(A)
(B)
(C)
14
Capitulo I
Visin Artificial
Como se ve en al figura 1.13. un gran nmero de pxeles con un mismo nivel de gris se
agrupan en el histograma, por lo tanto no sabremos cuantos pxeles de un mismo valor se
agruparn, esto da que en una imagen no se pueda predecir este nmero, por tal motivo el
histograma se lo normaliza, esto se logra con una divisin entre el nmero de niveles de gris
para el nmero total de pxeles de la imagen.
El histograma normalizado [0,1] se obtiene como resultado de dividir cada una de sus
columnas por la columna de mayor altura(figura 1,14).
15
Capitulo I
Visin Artificial
El rango dinmico.- En la imagen son todos los posibles niveles de gris que se
encuentran presentes. Una imagen con un rango dinmico reducido presenta una
calidad muy pobre y con un elevado nivel de ruido. Manipulando el histograma de la
imagen original es posible aumentar el rango y por tanto mejorar la calidad.
Ejemplos de histogramas:
1.3.6 Umbralizado
El umbralizado es un caso especial del recortado donde a = b ser el nivel de umbral para
definir los pxeles agrupados en el histograma, stos tomaran el valor de cero si es menor que
a=b y tomara su mayor valor si los valores del histograma son mayores o iguales que en nivel
de umbral, el resultado es una imagen binaria.
Ejemplo: Una imagen obtenida de una pgina impresa con un scanner no es binaria, mediante
16
Capitulo I
Visin Artificial
conformada por dos niveles, [1] color blanco y [0] color negro.
(a)
(b)
(c)
En la siguiente figura tenemos tres casos en los que se ha ido variando el nivel de umbral
de la imagen de la figura 1.16.(b). Cada una de las imgenes de la figura 1.17. tiene un nivel
de umbral diferente y claramente se puede apreciar como la informacin de la imagen es
alterada.
(a)
(b)
(c)
17