Está en la página 1de 17

Capitulo I

Visin Artificial

Visin Artificial

1.1. Concepto de visin por computador

Los sensores proporcionan a la mquina informacin sobre su entorno, esta informacin


puede usarse para guiar sus acciones o procesos. La visin es un sentido muy importante
porque puede dar informacin con una resolucin relativamente alta a distancias
relativamente grandes. Se han desarrollado muchos tipos de sistemas de visin los cuales
entran en uso prctico cada vez con ms frecuencia.

El objetivo general de una mquina vidente es describir una escena, analizando una o mas
imgenes de la misma. En algunas situaciones la escena es bsicamente bidimensional. Por
ejemplo, en el caso de la medicin de cueros el sistema de visin artificial trabaja sobre
superficies planas, analizando las posibles perforaciones que stos tiene, es por esto que la
visin para situaciones bidimensionales es ms fcil que para las tridimensionales

Para que una mquina reconozca partes, perforaciones, etc. en una superficie, y en general
objetos, debe distinguir primero las zonas de inters del resto de la superficie. En otras
palabras, debe ser capaz de "destacar" partes de la imagen que corresponden a esas zonas.
Este proceso de extraer partes de una imagen que corresponden a lo ms relevantes de una
escena se denomina SEGMENTACION.

Cuando se ha extrado una parte de una imagen, generalmente es necesario medir varias
propiedades geomtricas de tal segmento (tamao, forma, etc.) tales medidas pueden ser la
base para reconocer si el subconjunto representa o no un objeto dado, as como para
determinar la posicin y orientacin del mismo. Tambin pueden servir de base para una
posterior segmentacin dentro del segmento; por ejemplo, si dos objetos se tocan o
superponen, puede ocurrir que hayan sido extrados como un solo segmento, y puede ser

Capitulo I

Visin Artificial

necesario dividir este subconjunto en dos partes basndose en criterios geomtricos, por
ejemplo descomponindolo en partes convexas. Esta etapa del proceso de visin se denomina
ANALISIS GEOMETRICO.

Se pueden disear diferentes algoritmos para realizar anlisis geomtricos, dependiendo de


la manera como estn representados los segmentos de la imagen dentro del computador, por
esto el tema de la REPRESENTACION GEOMETRICA de subconjuntos de la imagen est
estrechamente relacionado con el anlisis geomtrico.

El reconocer objetos por medio del anlisis de segmentos de una imagen puede variar su
dificultad, dependiendo de la complejidad de los objetos. Si los objetos que pueden estar
presentes en la escena difieren mucho entre s, se puede usar una comparacin relativamente
sencilla con patrones o plantillas; en esta situacin, puede incluso ser innecesario extraer
explcitamente los objetos del resto de la imagen. A menudo, los objetos pueden reconocerse
porque cumplen un conjunto caracterstico de valores de sus parmetros geomtricos.

1.2 Procesamiento digital de imgenes

Este trmino hace referencia al procesamiento de una imagen en dos dimensiones .

El procesamiento esta basado por las siguientes propiedades:

Propiedades geomtricas tales como la forma, el tamao y la localizacin.

Propiedades de los materiales tales como el color, la iluminacin, la textura y la


composicin.

La informacin visual, transmitida en forma de imgenes digitales, es uno de los


principales mtodos de comunicacin de la edad moderna.

Las imgenes por computador adquieren gran importancia, ya que nuestro

principal

sentido es el de la vista (una imagen vale ms que 1000 palabras).

Un sistema de visin es un compromiso entre dos tipos de componentes:

Capitulo I

Visin Artificial

Hardware.- Subsistema de adquisicin; computador con tarjeta digitalizadora, y un


subsistema de visualizacin (cmara digital, iluminacin)

Software.- Subsistema de manipulacin de imgenes, cuya funcin es la de adquirir,


digitalizar, procesar y control la imagen.

En la figura 1.1. se puede observar cada uno de los componentes que intervienen en un
sistema de visin artificial.

figura 1.1. Componentes de un sistema de visin artificial

En los sistemas de visin artificial, el xito de las fases de preprocesamiento y anlisis


dependen altamente de la calidad de la informacin en las imgenes y esta calidad depende de
tres factores:
la iluminacin.
la ptica.
los sensores utilizados para capturar la imagen.
1.2.1 Iluminacin

El xito de un sistema de visin industrial depende ms, del buen diseo del sistema de
iluminacin que de un anlisis sofisticado de la imagen.

Capitulo I

Visin Artificial

Es as que el sistema de iluminacin debe cumplir ciertas caractersticas que influye


directamente sobre las prestaciones del sistema de visin.

Con condiciones de iluminacin inestables o variables, ocasionar un preprocesamiento


muy costoso y complejo de la imagen, puesto que la imagen no es mas que la representacin
de la informacin de la luz,( figura 1.2.) .

Por lo tanto la imagen al ser una representacin de la informacin de la escena estar en


funcin de :

Las fuentes de luz.

Las caractersticas de la superficie (reflexin, rugosidad).

Las relaciones espaciales (distancia y ngulos) entre sensores, superficies y fuentes.

figura 1.2. Representacin de la informacin de la escena

Los rayos de luz, en su trayectoria desde la fuente hasta la cmara, son alterados de
diferentes formas por los objetos de la escena, de manera que la luz medida por la cmara en
un punto de la misma, es representada por el valor del pxel.

El espectro resultante de un sistema de visin debe tener en cuenta las caractersticas de la


fuente de luz, del medio atenuante, de la ptica del sistema y de la respuesta del sistema
sensorial.

Capitulo I

Visin Artificial

Un observador percibe una serie de sensaciones que le permiten reconocer y distinguir los
objetos que le rodean y al contrario, si el ambiente es privado de luz, el observador deja de
percibir las sensaciones que le permiten distinguir y reconocer objetos.

Un buen sistema de iluminacin reduce la complejidad de la imagen resultante a analizar y


debe resaltar o suprimir caractersticas de la escena u objeto.

En la figura 1,3 podemos apreciar los diferentes tipos de iluminacin utilizados en la captura
de una imagen de un sistema de visin , se usan los siguientes tipos de iluminacin:
-

Frontal (difusa o direccional) que es la que enfatiza caractersticas en superficies


planas (deformidades, hoyos, marcas, rayas).

Retroiluminacin (difusa o direccional), es la que obtiene directamente una imagen en


blanco y negro. Apropiada para obtener siluetas.

Estructurada, apropiada para medir distorsiones en patrones y obtener las


caractersticas superficiales de un objeto 3D.

figura 1.3. tipos de iluminacin


1.2.2 Fuentes de luz
Hay muchos procesos fsicos y qumicos que generan luz a continuacin se definen algunos
tipos de fuentes:

Capitulo I

Visin Artificial

Incandescente: Emisin de luz por excitacin trmica.

Luminiscente: Excitacin electrnica por energa no trmica.

Descarga de arco: Ionizacin de un gas.

Para un sistema de visin son interesantes aquellos procesos que permiten radiaciones
pticas, es decir, luz en el infrarrojo visible y en el ultravioleta.
La fuente de luz de un sistema de visin ha de ser seleccionada dependiendo:

Del nivel particular de iluminacin requerido.

Del grado de direccionalidad deseado.

De la salida espectral (colores).

En la siguiente tabla 1.1 se podr apreciar las diferentes fuentes de luz con sus respectivas
ventajas y desventajas que presentan.
Fuente
Incandescente

Ventaja
Barata
Muchas configuraciones

Tungsten-Halogeno
Fluorescente

Alta Potencia de Salida


Eficiente
Fria
Infinito ancho de campo
Optica simple

He Ne laser

IR Laser

Larga Vida
Buena coincidencia CCD
Compacto

IR Diodos

Larga Vida
Buena coincidencia CCD
Optica Sencilla
Alta potencia
Alta eficacia

Gas Estroboscpico

Desventaja
Baja eficacia
Corta vida
Exceso de calor
Exceso de calor
Pocas configuraciones
Vibra
Frgil, corta vida
Cara, voluminoso
Sujeta a regulaciones
Gubernamentales
Optica compleja
Rayo de luz altamente divergente
Sujeta a regulaciones
Gubernamentales
Baja Potencia de Salida

Caro, voluminoso
Vida limitada
Demasiado azul para CCDs

Tabla 1.1. Fuentes de Luz


En el prototipo de medicin se harn diferentes pruebas para la iluminacin del sistema para
el cual se tendr en cuenta:

Capitulo I

Visin Artificial

Forma (puntual, esfrica, lineal) y tamao fsico.

Intensidad de la fuente y radiacin potencia de la fuente y voltaje.

Precauciones de seguridad. ngulo de emisin, requerimientos de refrigeracin.

Compatibilidad con el equipamiento existente costo (adquisicin y mantenimiento).

Estabilidad en el tiempo y tiempo de vida, regulacin de intensidad, vibraciones o


parpadeos.

1.2.3 Adquisicin
Luego de definido el tipo de iluminacin que se va ha utilizar se desarrolla el proceso de
adquisicin de la imagen para lo cual se debe de disponer de los siguientes dispositivos:
-

Una cmara que sea sensible a una banda del espectro de energa electromagntica
(visible, infrarrojo, ultravioleta) y que produzca una seal elctrica de salida
proporcional al nivel de energa percibido.

Un digitalizador que convierta la seal elctrica de salida del dispositivo en una seal
digital.

Una tarjeta digitalizadora, que es un elemento de hardware que acepta seal de vdeo
analgica y la convierte en una seal digital.

figura 1.4. Adquisicin de la informacin de la imagen


1.3 Caractersticas de una imagen
La imagen es una pintura, una fotografa o cualquier otra forma de representacin visual
de un objeto o escena, cuya proyeccin de mundo de tres dimensiones es convertida a dos
dimensiones (plano de la imagen), para luego ser transformada en una imagen digital.

Capitulo I

Visin Artificial

La imagen digital es una matriz bidimensional de nmeros reales o complejos


representados por un nmero finito de bits, como se puede apreciar en la figura 1.5.

figura 1.5. Matriz de una imagen digital


La imagen a digitalizarse se compondr de elementos llamados pxeles, que son
pequeas reas a la cual se le asigna un nico numero que llevara la informacin de la
imagen.
El tamao del rea fsica representada por un pxel es llamada resolucin espacial del
pxel.
Si la resolucin espacial es el rea fsica la frecuencia espacial hace referencia a la
rapidez con que la seal cambia de valor en el espacio.

1.3.1 Definicin Formal de una Imagen:


Debido a la estructura de la visin humana la imagen en color puede ser representada como
una combinacin de tres colores bsicos: Rojo(R), Verde (G) y Azul(B), y la combinacin de
stos brindar la otra gama de colores, segn se seala en la figura 1.6.

figura 1.6. Estructura de colores en la visin humana

Capitulo I

Visin Artificial

Por lo tanto digitalmente una imagen en color puede ser modelada como una imagen
monocroma con tres bandas correspondiendo cada una de ellas a un color, si nuestro sistema
esta basado en una cuantificacin de ocho bit, cada uno de los colores tendr una gama de 0 a
255 niveles de intensidad.

Al igual que en los colores de pintura tenemos en los colores de luz , los colores primarios y
los colores secundarios, estos segundos son producto de la combinacin de los primeros.

Los colores secundarios, amarillo, cian y magenta se obtienen de combinar dos colores
primarios en su mxima intensidad.

El resto de colores se obtiene realizando combinaciones de R, G y B variando la intensidad


de cada uno. El propsito de un modelo de color es facilitar la especificacin de colores en
algn formato estndar.

Un modelo de color es una especificacin de un modelo de coordenadas 3D y un subes_


pacio dentro de este sistema donde cada punto corresponde a un color.

figura 1.7.

Un modelo de color en coordenadas 3D

Una imagen de grises se puede definir como una funcin bivariada de intensidad luminosa
f(x,y). El valor de la funcin f en el espacio de coordenadas (x,y) indica la intensidad de la luz
en ese punto (ver Ec 1.1.).

Capitulo I

Visin Artificial

Ec( 1.1.)

Irradiacin i(x,y): cantidad de luz que incide en la escena, se determina por la fuente de luz, se
mide en candelas, por ejemplo en un da claro en la superficie de la tierra se pueden recoger
unas 9000 candelas.
Reflectancia r(x,y): Cantidad de luz que reflejan los objetos de la escena, la determinan las
caractersticas del objeto. Es un factor que nos indica la capacidad del objeto de reflejar la luz,
por ejemplo 0.01 para el terciopelo negro, 0.65 para el acero, 0.93 para la nieve. Es una
magnitud a-dimensional.
f(x,y) = i(x,y) r(x,y)

Ec( 1.2.)

En la prctica no se conoce ninguna fuente de luz capaz de producir una irradiacin


infinita, por lo que f(x,y) ser siempre acotada.

Ec( 1.3.)
[ Fmin, Fmax ] recibe el nombre de escala o niveles de gris. En ambientes interiores los
valores tpicos son: Fmin = 0.005 y Fmax =100.

En el procesamiento digital de imgenes se utilizan a menudo 8 bits para representar cada


valor de gris, por lo que Fmin = 0 y Fmax = 255 (ver figura 1.8.).

figura 1.8. Gama de gris en formato de ocho bits (Fmin = 0 y Fmax = 255)

10

Capitulo I

Visin Artificial

1.3.2 Muestreo y Cuantificacin

El requerimiento bsico para poder procesar una imagen mediante un computador es la


adquisicin y su posterior digitalizacin, es decir, su conversin a una matriz de nmeros.

Para poder digitalizar una imagen es necesario:

Muestrear: la imagen es transformada en una rejilla discreta.

Cuantificar: cada muestra o pxel de la rejilla es dividida utilizando un nmero


determinado de bits.

Los procesos de muestreo y cuantificacin producen perdida de informacin cuando su


valor disminuye, como se podr apreciar en la figura 1.9. se tienen tres casos en los cuales
tenemos en la figura (b) un muestreo de 8bit con una cuantificacin de 250x250 rejillas o
pxeles, en la figura (c) y (d) tenemos igual cuantificacin pero el muestreo es de 64x64 y
32x32 respectivamente.

figura 1.9. Muestreo de una imagen a 8bits a)diagrama de bloques de una imagen b)muestreo
de 250x250 pxeles c)muestreo de 64x64 pxeles d)muestreo de 32x32 pxeles

11

Capitulo I

Visin Artificial

El muestreo tiene el efecto de reducir la resolucin espacial, se observa una prdida de


informacin al aumentar el tamao de las celdas de la rejilla de muestreo (pxeles), esta
prdida de informacin se denomina aliasing y es un ruido introducido en forma de
patrones rectangulares.

figura 1.10. Cuantificacin de una imagen a 250x250 pxeles a) Cuantificacin a 8 bits b)


Cuantificacin a 4 bits s c) Cuantificacin a1 bits.
Es imposible disponer de un rango infinito de valores para representar la intensidad
luminosa (nivel de gris) de los pxeles.

Lo usual es disponer de al menos 8 bits, es decir, 256 niveles de gris como se pudo apreciar
en la figura 1.10. en donde podemos ver como la escala de grises va disminuyendo llegando a
ser crtica en la figura 1.10. (c) en donde tenemos tan solo dos estados.

1.3.3 Formato de ficheros para imgenes digitales.

Existen diferentes tipos de formatos, porque los requerimientos de algunas imgenes y


aplicaciones varan. Los datos y ficheros grficos se dividen normalmente en dos clases:

Datos vectoriales: se refieren a una forma de representar lneas polgonos o curvas, y


en general, objetos que se puedan dibujar fcilmente con lneas, especificando
numricamente puntos clave.

Mapas de bits: estn formados por un conjunto de valores numricos que especifican
los colores de los pxeles. Otros tipos de formatos son: multimedia, hipertexto,
hipermedia, 3D, etc.

12

Capitulo I

Visin Artificial

Existen multitud de formatos para ficheros de imgenes expresadas como mapas de bits:
gif, tif, tga, bmp, pbm, pgm, etc .
Todos estos ficheros estn formados de dos componentes:
- La cabecera, donde se guarda informacin acerca del tipo de imagen, el tamao
en filas y columnas, los bits por pxel, etc.
- El mapa de bits, donde reside la imagen y que puede estar almacenada por filas
por columnas o por planos de bits.

En algunos casos existe:


- un pie de fichero.
-

una paleta de colores o lookup table. Varias imgenes pueden ser almacenadas
en un solo fichero.

figura 1.11. Formato de una imagen

La tabla de lookup es utilizada como una indexacin para encontrar la combinacin


apropiada R,G,B para cada pxel, utilizando nicamente 8 bits.

En general, un funcin de dos dimensiones contiene informacin que puede ser


considerada como una imagen (ver figura 1.11.).

13

Capitulo I

Visin Artificial

1.3.4 Conectividad y adyacencia.


La imagen adquirida esta formada por pxeles los mismos que forman conjuntos de
vecindades entre ellos, es as que cada pxel esta rodeado por pxeles vecinos teniendo los
siguientes casos:

4-vecinos N 4 (p(x,y)): Un pixel de coordenadas p(x,y) tiene 4 vecinos, 2 horizontales


y 2 verticales cuyas coordenadas son: (x+1,y) (x-1,y) (x,y+1) (x,y-1) (ver figura
1.12.(a) .

4-vecinos diagonales N D (p(x,y)): Un pixel de coordenadas p(x,y) tiene 4 vecinos en


diagonal cuyas coordenadas son: (x+1,y+1) (x+1,y-1) (x-1,y+1) (x-1,y-1) (ver figura
1.12.(b)).

8-vecinos N 8 (p(x,y)): Un pixel p(x,y) tiene 4 vecinos, 2 horizontales y 2 verticales,


ms 4 vecinos en la diagonal cuyas coordenadas son: (x+1,y) (x-1,y)(x,y+1)(x,y-1)
(x+1,y+1) (x+1,y-1)(x-1,y+1)(x-1,y-1) (ver figura 1.12.(c)).

S p(x,y) es un pxel de borde de la imagen, el conjunto de sus vecinos no estar completo.

(A)

(B)

(C)

figura 1.12. Vecindad de un pxel

1.3.5 Histograma de una imagen:


El histograma es una herramienta en la cual una imagen es representada por la frecuencia
de aparicin de los distintos niveles de gris en la imagen y proporciona la distribucin de los
niveles de gris pero ignorando sus coordenadas.

14

Capitulo I

Visin Artificial

Por lo tanto una imagen proporciona un histograma.


Con el uso de histograma se reduce notablemente la carga computacional antes del
procesamiento como en la segmentacin de la imagen.

Como se ve en al figura 1.13. un gran nmero de pxeles con un mismo nivel de gris se
agrupan en el histograma, por lo tanto no sabremos cuantos pxeles de un mismo valor se
agruparn, esto da que en una imagen no se pueda predecir este nmero, por tal motivo el
histograma se lo normaliza, esto se logra con una divisin entre el nmero de niveles de gris
para el nmero total de pxeles de la imagen.

figura 1.13.Histograma de una imagen

El histograma normalizado [0,1] se obtiene como resultado de dividir cada una de sus
columnas por la columna de mayor altura(figura 1,14).

figura 1.14. Normalizacin del histograma

15

Capitulo I

Visin Artificial

El histograma posee dos caractersticas:

El rango dinmico.- En la imagen son todos los posibles niveles de gris que se
encuentran presentes. Una imagen con un rango dinmico reducido presenta una
calidad muy pobre y con un elevado nivel de ruido. Manipulando el histograma de la
imagen original es posible aumentar el rango y por tanto mejorar la calidad.

El grado de contraste.- Por contraste se entiende la existencia de cambios abruptos de


la frecuencia relativa del nmero de pxeles para diferentes niveles de gris. En los
sistemas de visin por computador interesa que las imgenes presenten un alto
contraste, ya que esto redunda en una mejor segmentacin.

Ejemplos de histogramas:

figura 1.15. Rango dinmico y grado de contraste del histograma

1.3.6 Umbralizado

El umbralizado es un caso especial del recortado donde a = b ser el nivel de umbral para
definir los pxeles agrupados en el histograma, stos tomaran el valor de cero si es menor que
a=b y tomara su mayor valor si los valores del histograma son mayores o iguales que en nivel
de umbral, el resultado es una imagen binaria.
Ejemplo: Una imagen obtenida de una pgina impresa con un scanner no es binaria, mediante

16

Capitulo I

Visin Artificial

el umbralizado finalmente quedara en binario por

lo que la gama de grises estara

conformada por dos niveles, [1] color blanco y [0] color negro.

Como ejemplo tenemos en la figura 1.16.(a). La funcin de umbralizacin en donde el


valor del pxel es cero si es menor al nivel de umbral y es 1 si es mayor o igual al nivel de
umbral, la figura 1.16.(b) es la imagen original y en la figura 1.16.(c) tenemos el histograma
de la imagen.

(a)

(b)

(c)

figura 1.16. Umbralizacin de la imagen

En la siguiente figura tenemos tres casos en los que se ha ido variando el nivel de umbral
de la imagen de la figura 1.16.(b). Cada una de las imgenes de la figura 1.17. tiene un nivel
de umbral diferente y claramente se puede apreciar como la informacin de la imagen es
alterada.

(a)

(b)

(c)

figura 1.17. Imagen umbralizada a diferentes niveles. a)Umbral=50 , b) Umbral=170


c)Umbral=225

17

También podría gustarte