290 522 1 PB

Adquisicin y Reconocimiento de Imgenes
por Medio de Tcnicas de Visin

e Inteligencia Artificial
Diana Carolina Ramrez Gonzlez Guillermo Pulido Sarmiento

Ingeniera Electrnica, Universidad Escuela Ingeniero Electrnico, Universidad Escuela
Colombiana de Ingeniera Julio Garavito Colombiana de Ingeniera Julio Garavito
Bogot, Colombia. Bogot, Colombia.
Dianita_ramirezg@hotmail.com ingepulido@hotmail.com
Beatriz Gerardino Arvalo Jos Manuel Cruz Romero

Ingeniera Electrnica, Universidad Escuela Ingeniero Electrnico, Universidad Escuela
Colombiana de Ingeniera Julio Garavito Colombiana de Ingeniera Julio Garavito
Bogot, Colombia. Bogot, Colombia.
ingchapatina@hotmail.com zeus098@hotmail.com
Enrique Estupin Escalante Sandra Cancino Surez

MSc. Profesor de la Universidad Escuela MSc. Profesor de la Universidad Escuela Colombiana
Colombiana de Ingeniera Julio Garavito de Ingeniera Julio Garavito
enrique.estupinan@escuelaing.edu.co sandra.cancino@escuelaing.edu.co
Resumen Este proyecto presenta un sistema que per- to de Imgenes, Red Neuronal, Controlador Difuso (FLC),
mite reconocer diferentes figuras geomtricas, que se en- Pixeles,
cuentran en una banda transportadora. Para el posiciona-
miento de la banda transportadora se utiliza la tcnica de Abstract This project presents a system that recognizes
lgica difusa. El control de posicionamiento presenta un different figures that are in a conveyor belt. For the conve-
error aceptable debido a los protocolos de comunicacio- yor positioning fuzzy logic control is used. The positioning
nes usados. El reconocimiento de imgenes se realiza a control presents an acceptable error due to the communi-
travs de tcnicas de Visin Artificial y Redes Neuronales. cations protocol used. The techniques used for image re-
cognition are machine vision and neural networks as well.
El sistema de reconocimiento de imgenes consta de tres
etapas: adquisicin de imgenes digitales a color, proce- The image recognition system the system is formed by
samiento de imgenes y extraccin de las diferentes ca- three stages: image acquisition, image processing and
ractersticas de las imgenes e identificacin de la figura characteristics extraction and geometric form identifica-
geomtrica. Este sistema puede diferenciar siete formas tion. This system differentiate seven geometric shapes
geomtricas (crculo, cuadrado, tringulo, rectngulo, elip- (Circle, Square, Triangle, Rectangle, Ellipse, Rhombus,
se, rombo, estrella de cinco puntas), doce colores (Rojo, five-pointed Star), twelve different colours (Red, Light Red,
rojo claro, rojo oscuro, azul, azul claro, azul oscuro, azul Dark Red, Blue, Light Blue, Dark Blue, Lila Blue, Green,
lila, verde, verde claro, verde oscuro, amarillo, amarillo Light Green, Dark Green, Yellow, Dark Yellow) and three
quemado) y tres tamaos (grande, mediano, pequeo). El sizes (Large, Medium, Small). Several techniques are used
tratamiento de las imgenes de las figuras requiere tcni- for different form classification such us: metric and major
cas diversas para la identificacin de forma como: mtrica length axes difference. These image characteristics are
y diferencia entre ejes principales. Estas caractersticas used in the geometric identification forms stage by machi-
de las imgenes son usadas en la etapa de identificacin ne vision techniques and these are also the input vectors
de las figuras por medio de las tcnicas clsicas de visin for the Neuronal Networks.
artificial y a su vez conforma los vectores de entrada a las
The results in the image recognition stage are used to
redes neuronales.
compare Machine Vision and Neuronal Network techni-
Con los resultados obtenidos se comparan las tcnicas de ques to stablish which one has a better performance for
visin artificial y redes neuronales, con el fin de determi- this problem set up.
nar qu herramienta presenta un mejor desempeo en el
KeywordsBackpropagation, Robberts Filter, Median
problema planteado.
Filter, Alfa trimmed Filter, Fuzzy Logic, Image Processing,
Palabras clave Backpropagation, Filtro Robberts, Filtro Neural Network, fuzzy logic controller (FLC), Pixels.
Mediana, Filtro Alfa Trimmed, Lgica Difusa, Procesamien-
ITECKNE Vol. 6 Nmero 1 Junio 2009 5 - 13

6 ITECKNE Vol. 6 Nmero 1 Junio 2009 5 - 13
I. INTRODUCCIN FIG. 2. HARDWARE QUE CONFORMA EL SISTEMA DE CONTROL DE POSI-

CIN DE LA BANDA TRANSPORTADORA
El proyecto realiza el reconocimiento de figuras

geomtricas sobre una banda transportadora por
medio de tcnicas de visin e inteligencia artificia-
les. El control de posicin de la banda se realiza
mediante un controlador de lgica difusa, el cual
centra la imagen bajo la cmara y permite la ad-
quisicin de la imagen de la figura que se desea
clasificar; la clasificacin de figuras geomtricas
en la banda transportadora requiere primero de
un procesamiento que incluye el filtrado del ruido,
la segmentacin por umbralizacin y la aplicacin Fuente: Autores del proyecto.
de filtros de realce de bordes como el filtro Rob-
berts [1], esto para mejorar la imagen y facilitar
la extraccin de las caractersticas tiles para un Para evitar que el ambiente afecte significativa-
anlisis posterior. Luego, se usan tcnicas tradi- mente el sistema se adiciona una lmpara de luz
cionales de procesamiento de visin artificial y blanca y se asla la iluminacin externa con una
de computacin flexible, especficamente, redes estructura de color negro que rodea la banda
neuronales para clasificar las figuras geomtri- transportadora.
cas de acuerdo a los criterios de forma, tamao y
color definidos previamente. Finalmente, se hace Para la clasificacin de las figuras se definieron
un anlisis y una comparacin de las dos tcnicas las siguientes categoras:
implementadas.
1) Forma: cuadrado, rectngulo, tringulo, crcu-
lo, elipse, rombo, estrella de cinco puntas.
El sistema de control de posicin se muestra en
la Fig. 1, la referencia est dada por la cantidad 2) Tamao: pequeo (rea figura < 19 cm2), me-
de pxeles negros esperados en la imagen toma- diano (19 cm2 rea figura 38 cm2), grande
da y el sistema de adquisicin extrae la cantidad (38 cm2 rea figura 56 cm2).
de pxeles negros en la imagen adquirida, el error
es la entrada al controlador difuso (FLC) [5] y la 3) Color: 12 colores (rojo, rojo claro, rojo oscuro,
salida es el porcentaje de PWM. El controlador azul, azul claro, azul oscuro, azul lila, verde,
difuso (FLC) est implementado en un microcon- verde claro, verde oscuro, amarillo, amarillo
trolador PIC 16F877A como se muestra en la Fig. quemado) definidos por el modelo RGB.
2, este microcontrolador se encarga de recibir la
referencia del computador y genera el PMW que
va a alimentar el motor DC que mueve la banda. II. DESARROLLO
FIG. 1. SISTEMA DE CONTROL DE POSICIN DE LA BANDA TRANSPORTA- A. Construccin del Sistema

DORA CON UN CONTROLADOR DIFUSO (FLC)
La primera etapa es la construccin fsica de la

banda transportadora que est compuesta por:
+
FLC Planta G(s) un motor elctrico (16 Voltios DC), una cmara
Pixeles
(340 Px) -
Posicin
Web digital con una resolucin de 480X640 pxe-
Sensor (Cmara digital para
les, un soporte para la cmara digital, rodillos, un
control por visin)
acople mecnico motor-rodillo, soporte para los
rodillos, la tela con la que se forma la banda y un
computador personal.
Fuente: Autores del proyecto
Adquisicin y reconocimiento de imgenes por medio de tcnicas de visin e inteligencia artificial 7
En el proceso de la adecuacin de la planta fsi- la cmara detecta los 340 pxeles de color negro
ca se definen los parmetros como la altura en la entre las dos franjas blancas, el motor debe parar.
que se encuentra la cmara de la banda que es
de 35 cm, el rea til para reconocimiento es de La Fig. 4 presenta una imagen en donde el posi-
56 cm2 donde se ubican las figuras geomtricas, cionamiento de la banda tiene un error de posi-
el material de la banda es una tela semielstica cin cero, por tanto, el motor se detiene.
de color negro, la cual permite una friccin ade-
cuada con los rodillos de la estructura y un con- FIG. 4. IMAGEN QUE GENERA UN ERROR DE POSICIN CERO EN EL CON-
traste alto en la imagen. TROLADOR DE LA BANDA TRANSPORTADORA
B. Sistema de Control Difuso
Para realizar el control de posicin del motor DC,

se utiliza como elemento sensor la misma cmara
Web usada para el reconocimiento de figuras, la Fuente: Autores del proyecto.
cual registra peridicamente el movimiento de la
banda. Para simplificar la tarea se agregan unas En la Fig. 5 se observan unas imgenes de la ban-
lneas de color blanco uniformemente separadas da, en donde su error es distinto de cero, obsrve-
a lo ancho de toda la banda; las lneas establecen se que en estos casos existe un proceso de conteo
el rea donde se posiciona la figura analizada y de la cantidad de pxeles de color negro (Y) que
permiten encontrar la distancia a la que se en- hay despus de que se detecta la primera lnea
cuentra la banda de la posicin central del foco de blanca y basndose en esta informacin se obtie-
la cmara, es decir, la imagen centrada tiene las ne el error de posicin para usarlo como parme-
dos lneas blancas en cada uno de sus extremos tro de entrada al controlador (Ecuacin 1).
como puede verse en la Fig. 3. La banda se mue-
ve lentamente y la cmara entrega la informacin FIG. 5. DOS EJEMPLOS CON UN ERROR DE POSICIN DIFERENTE DE
CERO DE LA BANDA TRANSPORTADORA
al computador que realiza el clculo del error de
posicin.
FIG. 3. IMAGEN CENTRADA ENTRE DOS LNEAS BLANCAS DE LA BANDA

TRANSPORTADORA
Fuente: Autores del proyecto.
Ecuacin 1. ERROR DE POSICIN DEL CONTROLADOR

DE LA BANDA TRANSPORTADORA
(340-Y) *100
% error de posicin =
Fuente: Autores del proyecto.
340
La cmara Web adquiere una imagen a color con

una resolucin de 480 filas por 640 columnas, 1) Implementacin del Controlador Difuso
la cual es umbralizada con el objetivo de obtener En la implementacin del controlador difuso se
una imagen binaria (blanco y negro). Para realizar tiene como entrada el porcentaje de error y como
el control por lgica difusa, se establece un rea salida una seal de PWM, como se observa en la
de trabajo sobre la imagen binaria de 340 pxeles Fig. 6 [6].
que corresponde al rea de color negro. Cuando
FIG. 6. BLOQUE DE IMPLEMENTACIN N DEL CONTROLADOR DIFUSO 3) Definicin de Reglas
REGLAS
Se definieron las siguientes variables: la variable
de entrada es el error, es decir, la diferencia en-
FUSIFICADOR DEFUSIFICADOR PWM tre la posicin actual y la referencia, son cinco los
Error (%)
INFERENCIA
conjuntos de entrada; y la variable de salida es la
velocidad del motor, son 4 los conjuntos de sali-
da. A cada conjunto de entrada le corresponde un
Fuente: [6]. Autores del proyecto conjunto de salida y las reglas se definen:
1. If (error is cero) then (pwm is quieto) (1).

2) Definicin de los Conjuntos Difusos
2. If (error is poco) then (pwm is despacio) (1).
a. Conjuntos de Entrada 3. If (error is muy poco) then (pwm is lento) (1).
Para la entrada al controlador se tienen los si- 4. If (error is mucho) then (pwm is rpido) (1).
guientes valores lingsticos de la variable del por- 5. If (error is medio) then (pwm is despacio) (1).
centaje de error: Cero, Muy poco, Poco, Medio y
Mucho. El universo de discurso est en el rango
de 0% al 100%, como muestra la Fig. 7 [11]. 4) Salida del Defusificador (Tcnica centroide)
Para el clculo de la salida se utiliza la tcnica del

FIG. 7. CONJUNTOS DE ENTRADA AL FLC
centroide para mapear los datos. La Fig. 9 mues-
tra dos ejemplos grficos de la salida del defusi-
ficador [11].
FIG. 9. EJEMPLO DE LA SALIDA DEL DEFUSIFICADOR

PARA EL CONTROL DE LA BANDA TRANSPORTADORA
Fuente: Autores del proyecto (Matlab Fuzzy Logic Toolb ox)
b. Conjuntos de Salida
Para los conjuntos de salida que establecen el
valor de PWM que se aplica al motor, se tiene
un universo de discurso de 0 a 127, donde cero
corresponde a la velocidad ms alta que alcanza
el motor y 127 cuando el motor detiene la banda
transportadora. Las variables lingsticas defini-
das para la salida son: Rpido, Despacio, Lento y
Quieto, como puede observarse en la Fig. 8 [11].
Fuente: Autores del proyecto (Matlab Fuzzy Logic Toolbox)
FIG. 8. CONJUNTOS DE SALIDA DEL FLC
Para su implementacin se generaron tablas con
valores de error igualmente espaciados cada
2 seg para obtener el valor correspondiente de
PWM. Esta tabla fue almacenada en la posicin
de memoria del PIC.
Fuente: Autores del proyecto (Matlab Fuzzy Logic Toolbox)

C. Sistema de Visin Artificial FIG. 11. IMAGEN BINARIZADA E IMAGEN CON FILTRO DE ROBBERTS
1) Adquisicin de la Imagen
Al posicionar de manera correcta la banda trans-

portadora, se procede a capturar la imagen digi-
tal de la figura que se va a clasificar. Esta imagen
es cargada en el computador en formato de color
RGB con una resolucin espacial de 480X640 Fuente: Autores del proyecto.
pxeles.
b) Extraccin de Caractersticas de las Figuras
2) Procesamiento de la Imagen y Extraccin de La extraccin de las caractersticas de las figuras
las Caractersticas de las Figuras permite clasificar la forma, el tamao y el color de
la figura.
a) Procesamiento de la Imagen
Uno de los objetivos de esta etapa es eliminar Extraccin de las caractersticas de Forma de
el ruido que introduce la cmara digital (determi- la figura
nado experimentalmente como ruido gaussiano), Para la extraccin de forma se utiliza la imagen
para corregirlo se aplica un filtro de mediana a binarizada que destaca el rea de la figura y la
las tres capas de color de la imagen (rojo, azul, imagen luego del filtro Robberts que destaca el
verde); pero se observa que el ruido es ms fuer- permetro de la figura (ver Fig. 11.), se realiza
te en la capa roja por lo que se decide usar en un clculo numrico del rea y del permetro por
esta componente un filtro de tipo alfa-trimmed conteo de pxeles blancos. Posteriormente, con la
[3]. El siguiente paso es hacer un remuestreo es- mtrica [3] de las diferentes figuras geomtricas
pacial [2] de la imagen obtenida en el paso an- y otros atributos como la diferencia entre las lon-
terior, que consiste en eliminar 70 pxeles en la gitudes de los ejes principales se realiza la clasifi-
parte superior e inferior para eliminar las lneas cacin de forma. Esta distancia es til para poder
blancas, obteniendo una imagen como se mues- diferenciar entre figuras como cuadrado de rec-
tra en la Fig. 10. tngulo y crculo de elipse ya que su mtrica es
similar. Por ejemplo: en la Fig. 12. se muestra el
FIG. 10. IMAGEN CON REMUESTREO caso de un crculo y una elipse, el crculo tiene sus
ejes principales iguales, por tanto, la diferencia de
sus longitudes de ejes es cero, pero en el caso de
la elipse la diferencia de sus longitudes de ejes es
distinta a cero.
FIG. 12. LONGITUDES DE LOS EJES DE LA FIGURA DEL CRCULO Y LONGU-

TUDES DE LOS EJES DE LA FIGURA DE LA ELIPSE
A continuacin, se realiza la binarizacin de la

imagen que facilita la segmentacin de las figuras
como puede verse en la Fig. 11. Luego se aplica
un filtro de Robberts el cual realza los bordes de
las figuras basado en el clculo del gradiente en-
tre niveles de grises de pxeles vecinos [1], se ob-
tiene as una imagen que destaca el permetro del Fuente: Autores del proyecto
objeto como se muestra en la Fig. 11.
Extraccin de las caractersticas de color de de referencia generados por un observador huma-

la figura no el cual determin los rangos para cada uno de
El modelo RGB asigna un valor de intensidad a los siguientes colores: rojo, rojo claro, rojo oscuro,
cada pxel que oscila entre 0 (negro) y 255 (blan- verde, verde claro, verde oscuro, azul, azul claro,
co) para cada una de las componentes RGB de azul oscuro, azul lila, amarillo, amarillo quemado.
una imagen en color. Por ejemplo, una gama del
color rojo podra tener un valor R de 146, un va- c) Clasificacin del Tamao de la Figura.
lor G de 20 y un valor B de 50. El rojo ms puro
que se puede conseguir es el R: 255, G: 0 y B: 0. Para la clasificacin de tamao se extrae de la
Cuando los valores de las tres componentes son imagen de la figura el valor del rea y se compa-
idnticos, se obtiene un matiz gris. Si el valor de ra con los siguientes rangos predefinidos y as
todas las componentes es de 255, el resultado establecer el tamao de la figura: figura peque-
ser blanco y ser negro si todas las componentes a de 6000 hasta 17000 pxeles, figura mediana
tienen un valor 0 [1]. de 17000 hasta 30000 pxeles, figura grande de
30000 hasta 50000 pxeles.
Para la identificacin de color se utilizan los his-

togramas de cada componente de la imagen re- D. Sistema de Computacin Flexible
muestreada la cual puede verse en la Fig. 10. Con El mtodo de computacin flexible utilizado es la
los histogramas se obtiene el valor pico de cada tcnica de Redes Neuronales. Se usa la red neu-
componente de color, conforma un nuevo vector ronal Backpropagation, ya que este tipo de red
de color, as se puede clasificar el tono ms repre- neuronal permite un aprendizaje supervisado en
sentativo de la figura. el cual se determina la salida deseada para cada
Extraccin de las caractersticas del tamao conjunto de entrada y el ajuste de pesos de las
de la figura conexiones entre neuronas se realiza desde la sa-
lida hasta la entrada [4].
Para la extraccin de las caractersticas del tama-
o solamente se usa la imagen binarizada, con la
cual se calcula el rea de la figura por medio del Esta red se ajusta a la definicin del problema, ya
conteo de pxeles blancos. que se tienen las figuras referentes a las que se
asimilan las figuras obtenidas por la adquisicin
de imgenes. Las figuras referentes son analiza-
3) Identificacin de la Figura das y se determinan las caractersticas de rea
normalizada, permetro normalizado, la diferencia
a) Clasificacin de Forma de la Figura
de ejes normalizada, mtrica y color, que confor-
Para la clasificacin de forma se utiliza los valores man los vectores de los parmetros de entrada a
extrados del rea y del permetro, con los cua- cada una de las redes implementadas.
les se realiza una relacin denominada mtrica
Loa parmetros de entrada se normalizan con el
[3] para determinar la forma que tiene la figura
fin de minimizar el tiempo de entrenamiento.
que se analiza. Sin embargo, en algunos casos
mencionados anteriormente, se necesita el valor
de la diferencia entre las longitudes de los ejes
principales de la figura para identificar su forma 1) Desarrollo de la red para la clasificacin de
geomtrica. forma de la figura
La red de clasificacin de forma tiene 3 entradas:
b) Clasificacin del Color de la Figura el rea normalizada con un rango [0 1], el perme-
tro normalizado con un rango [0 1] y la diferen-
La identificacin de color de la figura se realiza cia de ejes normalizada con un rango [0 1]. Estas
con los valores extrados de los histogramas de entradas son los mismos valores usados en las
las tres componentes: rojo, verde y azul (RGB). El tcnicas de visin artificial.
nuevo vector de color es comparado con valores
El nmero de capas de la red es cinco, una capa Esta salida es un vector binario, el cual tiene 3
de entrada con tres neuronas, tres capas ocultas valores diferentes que se establecieron en la red
y una capa de salida con tres neuronas. La fun- antes del entrenamiento como posibles salidas,
cin de activacin para las primeras cuatro capas cada valor tiene una clasificacin: pequeo: [0 0],
es la funcin tangente sigmoidea [12]. La salida mediano:[0 1] y grande: [1 0].
es un vector de valores binarios que permite clasi-
ficar la forma as: cuadrado [0 0 0], rectngulo [0
0 1], circulo [0 1 0], Elipse [0 1 1], tringulo [1 0 III. PRUEBAS Y RESULTADOS
0], rombo [1 0 1] y estrella [1 1 0].
A. Control de Posicin de la Banda
Transportadora
2) Desarrollo de la red para la clasificacin de
color de la figura El control de posicin por lgica difusa, tiene un
error mximo del 5% en el posicionamiento de-
La red de clasificacin de color tiene 3 entradas: bido a los retardos naturales en el protocolo de
la componente roja con un rango [0 255], la com- comunicaciones usado, ya que hay que regular la
ponente azul con un rango [0 255] y la compo- velocidad a la que se transmiten los datos al mi-
nente verde con un rango [0 255]. Estas entradas crocontrolador. Para este sistema se implementa
son los mismos valores usados en las tcnicas de un retardo de 2 segundos cada vez que se enva
visin artificial. un dato al microcontrolador para no congestionar
el puerto.
El nmero de capas de la red es cuatro, una capa
de entrada con tres neuronas, dos capas ocultas y
una capa de salida. La funcin de activacin para B. Identificacin de Forma, Color y Tamao de
las primeras tres capas es la funcin tangente sig- las Figuras
moidea y la capa de salida tiene 5 neuronas de
Para realizar las pruebas se escogi una cantidad
salida lineal [12]. La salida es un nmero binario
definida de catorce figuras, con cada figura se
que permite identificar el color, los posibles valo-
realizan 3 pruebas, las figuras estn enumeradas
res de salida que puede tener la red neuronal son
y descritas en la Tabla I.
12 colores, la clasificacin de color en la salida
con el vector binario es: azules [0 0 0 0 0] al [0 0 TABLA I
0 1 1], rojos [0 0 1 0 0] al [0 0 1 1 1], verdes [0 DESCRIPCIN DE LAS FIGURAS UTILIZADAS
PARA LAS PRUEBAS DEL SISTEMA
1 0 0 0] al [0 1 0 1 1] y amarillos [0 1 1 0 0] al [0
1 1 0 1]. No. Figura Color Tamao Forma
1 Verde oscuro Pequeo Cuadrado
2 Azul claro Grande Estrella
3) Desarrollo de la red para la clasificacin de 3 Rojo Pequeo Elipse
tamao de la figura 4 Rojo Mediano Crculo
Rojo pasin
La red de tamao tiene una sola entrada que es 5 (oscuro) Mediano Cuadrado
el rea normalizada con un rango de [0 100] pxe- 6 Amarillo

quemado Mediano Estrella
les, la cual tiene los mismos valores que se utili- 7 Azul lila Pequeo Crculo
zan en las tcnicas de visin artificial. 8 Azul claro Pequeo Tringulo
9 Verde claro Pequeo Rectngulo
10 Verde claro Pequeo Tringulo
El nmero total de capas de la red es cuatro, una
Rojo suave
capa de entrada que tiene tres neuronas, dos ca- 11 (claro) Grande Cuadrado
pas ocultas y una capa de salida lineal que tiene 12 Verde Pequeo Estrella
dos neuronas. La funcin de activacin para las 13 Amarillo claro Pequeo Cuadrado
Amarillo
dos capas ocultas es la funcin tangente sigmoi- 14 quemado Mediano Crculo
dea [12].
C. Clasificacin por tcnicas de Visin Artificial Inicialmente se implementa el entrenamiento por

mnimo gradiente, ste presenta un largo tiem-
La identificacin de forma presenta problemas, ya
po de entrenamiento con poca eficiencia en los
que no slo se usa la mtrica de las figuras sino
casos de clasificacin de forma de las figuras y
que fue necesario implementar algunas, la distan-
clasificacin de colores de las figuras, por tanto,
cia entre ejes para poder diferenciar figuras, como
se decidi realizar un segundo entrenamiento por
se mencion anteriormente. Este mtodo de la di-
mnima longitud, el cual gasta menos tiempo de
ferencia de ejes en visin artificial no funciona de
entrenamiento y una mayor eficiencia.
una manera ptima, ya que su error es aproxima-
TABLA III
damente del 65%, posiblemente es por los rangos RESULTADOS DE LAS PRUEBAS HECHAS AL SISTEMA
que se establecieron en la diferencia de longitud DE CLASIFICACIN POR REDES NEURONALES
de ejes. En la identificacin de color se producen Acierto
No. Acierto en tama- Acierto en
cambios notables con slo alterar la iluminacin Figura en Color o forma
sobre la banda. En la Tabla II se puede observar 1 Si Si No
2 Si No Si
los resultados obtenidos de las diferentes prue-
3 Si Si No
bas por tcnicas de visin artificial. El porcentaje 4 Si No No
de aciertos en forma con mtrica y diferencia de 5 Si No Si
longitud de ejes es de 50% de acierto, as mismo 6 Si No Si
7 No Si No
el color tiene un acierto de 78.57% y la clasifica- 8 No Si Si
cin del tamao un 64.28% de acierto. 9 No Si Si
10 Si Si Si
TABLA II 11 Si No Si
RESULTADOS DE LAS PRUEBAS HECHAS AL SISTEMA DE CLASIFICACIN 12 Si Si Si
POR TCNICAS DE VISIN ARTIFICIAL 13 No Si Si
14 Si No No
No. Acierto en Acierto en Acierto en

Figura Color tamao forma Fuente: Autores del proyecto
1 Si No No
2 Si No Si La Fig. 13. muestra la interfaz grfica del sistema
3 No Si No
4 Si No No
implementado, en donde se incluyen imgenes
5 No Si Si de la Figura de la prueba 5 mencionada en las
6 Si No Si tablas: Tabla I., Tabla II., Tabla III.; histogramas y
7 Si Si Si resultados de las tcnicas de visin artificial y re-
8 Si Si Si
9 Si Si No
des neuronales.
10 Si Si Si
11 Si Si No FIG. 13. INTERFAZ GRFICA DEL SISTEMA
12 Si Si Si IMPLEMENTADO QUE OBSERVA EL USUARIO
13 No Si No
14 Si No No
D. Clasificacin por Redes Neuronales

La clasificacin por redes neuronales de color, ta-
mao y forma, se muestran en la Tabla III donde
se puede observar los resultados de las pruebas
realizadas por medio de redes neuronales con las
figuras seleccionadas. El porcentaje de aciertos
de la red neuronal de la clasificacin de forma
tiene un acierto de 64.28%, as mismo la red neu-
ronal de color tiene un 71.43% de acierto y la cla-
sificacin de tamao tiene un acierto de 57.14%.
la capacidad de acierto es pequea, no se puede

concluir cul de las dos tcnicas es ms eficien-
te para la clasificacin de atributos de las figuras
seleccionadas para este estudio. Por otra parte, la
tcnica de redes neuronales requiere del trabajo
adicional de entrenamiento y ajuste hacindola
menos atractiva para el problema estudiado.
REFERENCIAS
[1] R. Gonzlez, P. Wintz., Digital Image Processing, 3a.
Fuente: Autores del proyecto. edicin, Prentice Hall.
[2] M. Sonka, V. Hlvac, R. Boyle, Image Processing, Analy-

IV. CONCLUSIONES sis, and Machine Vision, Brooks/Cole Publishing Co,
1999.
Con base en los resultados para la identificacin
de forma, se puede concluir que la tcnica de re- [3] R. Gonzlez, Woods, and Eddins, Digital Image Proces-
sing Using Matlab, 2nd Ed, Prentice Hall.
des neuronales es ms exacta con un 64.28% de
acierto, que por medio de tcnicas de visin artifi- [4] Fausett L, Fundamentals of Neural Networks: Architec-
cial, la cual obtuvo un 50% de acierto. ture, Algorithms, and Applications Prentice Hall, 1994.
[5] Klir G, Yuan B, Fuzzy Set Theory. Foundations and

Para la identificacin de color los porcentajes Applications, Prentice Hall, 1998.
muestran que la tcnica de visin artificial es ms
exacta con un 78.57% de acierto que la tcnica [6] Pasino K, Yurkovich S, Fuzzy Control, Addison Wesley,
1998.
de redes neuronales con un 71.43% de acierto,
sin embargo, dada la poca diferencia se requiere [7] www.Omega.ilece.edu.mx:3000/sites/ciencia.htm
realizar ms pruebas.
[8] www.itba.edu.ar/capis/public_html/roboticacogniti-
va/REDES-NEURONALES.pdf
La tcnica de redes neuronales es un poco menos
exacta para la identificacin de tamao, ya que [9] http://www.answermath.com/neuralnetworks/tuto-
presenta un 57.14% de asertividad contra la tcni- rial-esp-7-aprendizaje.htm
ca de visin artificial que presenta un porcentaje
[10] http://www.monografias.com/trabajos12/redneuro/
de 64.28% de acierto. redneuro.shtml
[11] http://www.gc.ssr.upm.es/inves/neural/ann2/anntu-
Dado que las tcnicas de visin artificial se requie- tor.htm
ren para el procesamiento y la extraccin de las
caractersticas de la imagen digital, utilizadas en [12] Toolbox, MATLAB, Redes Neuronales.
ambas tcnicas de clasificacin, y la diferencia en
[13] Toolbox, MATLAB, Logical Fuzzy.

290 522 1 PB

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

290 522 1 PB

Cargado por

Copyright:

Formatos disponibles

Adquisicin y Reconocimiento de Imgenes

por Medio de Tcnicas de Visin

Diana Carolina Ramrez Gonzlez Guillermo Pulido Sarmiento

Beatriz Gerardino Arvalo Jos Manuel Cruz Romero

Enrique Estupin Escalante Sandra Cancino Surez

ITECKNE Vol. 6 Nmero 1 Junio 2009 5 - 13

I. INTRODUCCIN FIG. 2. HARDWARE QUE CONFORMA EL SISTEMA DE CONTROL DE POSI-

El proyecto realiza el reconocimiento de figuras

FIG. 1. SISTEMA DE CONTROL DE POSICIN DE LA BANDA TRANSPORTA- A. Construccin del Sistema

La primera etapa es la construccin fsica de la

B. Sistema de Control Difuso

Para realizar el control de posicin del motor DC,

FIG. 3. IMAGEN CENTRADA ENTRE DOS LNEAS BLANCAS DE LA BANDA

Fuente: Autores del proyecto.

Ecuacin 1. ERROR DE POSICIN DEL CONTROLADOR

La cmara Web adquiere una imagen a color con

FIG. 6. BLOQUE DE IMPLEMENTACIN N DEL CONTROLADOR DIFUSO 3) Definicin de Reglas

1. If (error is cero) then (pwm is quieto) (1).

Para el clculo de la salida se utiliza la tcnica del

FIG. 9. EJEMPLO DE LA SALIDA DEL DEFUSIFICADOR

Fuente: Autores del proyecto (Matlab Fuzzy Logic Toolb ox)

Fuente: Autores del proyecto (Matlab Fuzzy Logic Toolbox)

Al posicionar de manera correcta la banda trans-

FIG. 12. LONGITUDES DE LOS EJES DE LA FIGURA DEL CRCULO Y LONGU-

Fuente: Autores del proyecto

A continuacin, se realiza la binarizacin de la

Extraccin de las caractersticas de color de de referencia generados por un observador huma-

Para la identificacin de color se utilizan los his-

el rea normalizada con un rango de [0 100] pxe- 6 Amarillo

C. Clasificacin por tcnicas de Visin Artificial Inicialmente se implementa el entrenamiento por

No. Acierto en Acierto en Acierto en

Fuente: Autores del proyecto

D. Clasificacin por Redes Neuronales

la capacidad de acierto es pequea, no se puede

[2] M. Sonka, V. Hlvac, R. Boyle, Image Processing, Analy-

[5] Klir G, Yuan B, Fuzzy Set Theory. Foundations and

También podría gustarte