Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen Este proyecto presenta un sistema que per- to de Imgenes, Red Neuronal, Controlador Difuso (FLC),
mite reconocer diferentes figuras geomtricas, que se en- Pixeles,
cuentran en una banda transportadora. Para el posiciona-
miento de la banda transportadora se utiliza la tcnica de Abstract This project presents a system that recognizes
lgica difusa. El control de posicionamiento presenta un different figures that are in a conveyor belt. For the conve-
error aceptable debido a los protocolos de comunicacio- yor positioning fuzzy logic control is used. The positioning
nes usados. El reconocimiento de imgenes se realiza a control presents an acceptable error due to the communi-
travs de tcnicas de Visin Artificial y Redes Neuronales. cations protocol used. The techniques used for image re-
cognition are machine vision and neural networks as well.
El sistema de reconocimiento de imgenes consta de tres
etapas: adquisicin de imgenes digitales a color, proce- The image recognition system the system is formed by
samiento de imgenes y extraccin de las diferentes ca- three stages: image acquisition, image processing and
ractersticas de las imgenes e identificacin de la figura characteristics extraction and geometric form identifica-
geomtrica. Este sistema puede diferenciar siete formas tion. This system differentiate seven geometric shapes
geomtricas (crculo, cuadrado, tringulo, rectngulo, elip- (Circle, Square, Triangle, Rectangle, Ellipse, Rhombus,
se, rombo, estrella de cinco puntas), doce colores (Rojo, five-pointed Star), twelve different colours (Red, Light Red,
rojo claro, rojo oscuro, azul, azul claro, azul oscuro, azul Dark Red, Blue, Light Blue, Dark Blue, Lila Blue, Green,
lila, verde, verde claro, verde oscuro, amarillo, amarillo Light Green, Dark Green, Yellow, Dark Yellow) and three
quemado) y tres tamaos (grande, mediano, pequeo). El sizes (Large, Medium, Small). Several techniques are used
tratamiento de las imgenes de las figuras requiere tcni- for different form classification such us: metric and major
cas diversas para la identificacin de forma como: mtrica length axes difference. These image characteristics are
y diferencia entre ejes principales. Estas caractersticas used in the geometric identification forms stage by machi-
de las imgenes son usadas en la etapa de identificacin ne vision techniques and these are also the input vectors
de las figuras por medio de las tcnicas clsicas de visin for the Neuronal Networks.
artificial y a su vez conforma los vectores de entrada a las
The results in the image recognition stage are used to
redes neuronales.
compare Machine Vision and Neuronal Network techni-
Con los resultados obtenidos se comparan las tcnicas de ques to stablish which one has a better performance for
visin artificial y redes neuronales, con el fin de determi- this problem set up.
nar qu herramienta presenta un mejor desempeo en el
KeywordsBackpropagation, Robberts Filter, Median
problema planteado.
Filter, Alfa trimmed Filter, Fuzzy Logic, Image Processing,
Palabras clave Backpropagation, Filtro Robberts, Filtro Neural Network, fuzzy logic controller (FLC), Pixels.
Mediana, Filtro Alfa Trimmed, Lgica Difusa, Procesamien-
En el proceso de la adecuacin de la planta fsi- la cmara detecta los 340 pxeles de color negro
ca se definen los parmetros como la altura en la entre las dos franjas blancas, el motor debe parar.
que se encuentra la cmara de la banda que es
de 35 cm, el rea til para reconocimiento es de La Fig. 4 presenta una imagen en donde el posi-
56 cm2 donde se ubican las figuras geomtricas, cionamiento de la banda tiene un error de posi-
el material de la banda es una tela semielstica cin cero, por tanto, el motor se detiene.
de color negro, la cual permite una friccin ade-
cuada con los rodillos de la estructura y un con- FIG. 4. IMAGEN QUE GENERA UN ERROR DE POSICIN CERO EN EL CON-
traste alto en la imagen. TROLADOR DE LA BANDA TRANSPORTADORA
(340-Y) *100
% error de posicin =
Fuente: Autores del proyecto.
340
REGLAS
Se definieron las siguientes variables: la variable
de entrada es el error, es decir, la diferencia en-
FUSIFICADOR DEFUSIFICADOR PWM tre la posicin actual y la referencia, son cinco los
Error (%)
INFERENCIA
conjuntos de entrada; y la variable de salida es la
velocidad del motor, son 4 los conjuntos de sali-
da. A cada conjunto de entrada le corresponde un
Fuente: [6]. Autores del proyecto conjunto de salida y las reglas se definen:
b. Conjuntos de Salida
Para los conjuntos de salida que establecen el
valor de PWM que se aplica al motor, se tiene
un universo de discurso de 0 a 127, donde cero
corresponde a la velocidad ms alta que alcanza
el motor y 127 cuando el motor detiene la banda
transportadora. Las variables lingsticas defini-
das para la salida son: Rpido, Despacio, Lento y
Quieto, como puede observarse en la Fig. 8 [11].
Fuente: Autores del proyecto (Matlab Fuzzy Logic Toolbox)
FIG. 8. CONJUNTOS DE SALIDA DEL FLC
Para su implementacin se generaron tablas con
valores de error igualmente espaciados cada
2 seg para obtener el valor correspondiente de
PWM. Esta tabla fue almacenada en la posicin
de memoria del PIC.
C. Sistema de Visin Artificial FIG. 11. IMAGEN BINARIZADA E IMAGEN CON FILTRO DE ROBBERTS
1) Adquisicin de la Imagen
El nmero de capas de la red es cinco, una capa Esta salida es un vector binario, el cual tiene 3
de entrada con tres neuronas, tres capas ocultas valores diferentes que se establecieron en la red
y una capa de salida con tres neuronas. La fun- antes del entrenamiento como posibles salidas,
cin de activacin para las primeras cuatro capas cada valor tiene una clasificacin: pequeo: [0 0],
es la funcin tangente sigmoidea [12]. La salida mediano:[0 1] y grande: [1 0].
es un vector de valores binarios que permite clasi-
ficar la forma as: cuadrado [0 0 0], rectngulo [0
0 1], circulo [0 1 0], Elipse [0 1 1], tringulo [1 0 III. PRUEBAS Y RESULTADOS
0], rombo [1 0 1] y estrella [1 1 0].
A. Control de Posicin de la Banda
Transportadora
2) Desarrollo de la red para la clasificacin de
color de la figura El control de posicin por lgica difusa, tiene un
error mximo del 5% en el posicionamiento de-
La red de clasificacin de color tiene 3 entradas: bido a los retardos naturales en el protocolo de
la componente roja con un rango [0 255], la com- comunicaciones usado, ya que hay que regular la
ponente azul con un rango [0 255] y la compo- velocidad a la que se transmiten los datos al mi-
nente verde con un rango [0 255]. Estas entradas crocontrolador. Para este sistema se implementa
son los mismos valores usados en las tcnicas de un retardo de 2 segundos cada vez que se enva
visin artificial. un dato al microcontrolador para no congestionar
el puerto.
El nmero de capas de la red es cuatro, una capa
de entrada con tres neuronas, dos capas ocultas y
una capa de salida. La funcin de activacin para B. Identificacin de Forma, Color y Tamao de
las primeras tres capas es la funcin tangente sig- las Figuras
moidea y la capa de salida tiene 5 neuronas de
Para realizar las pruebas se escogi una cantidad
salida lineal [12]. La salida es un nmero binario
definida de catorce figuras, con cada figura se
que permite identificar el color, los posibles valo-
realizan 3 pruebas, las figuras estn enumeradas
res de salida que puede tener la red neuronal son
y descritas en la Tabla I.
12 colores, la clasificacin de color en la salida
con el vector binario es: azules [0 0 0 0 0] al [0 0 TABLA I
0 1 1], rojos [0 0 1 0 0] al [0 0 1 1 1], verdes [0 DESCRIPCIN DE LAS FIGURAS UTILIZADAS
PARA LAS PRUEBAS DEL SISTEMA
1 0 0 0] al [0 1 0 1 1] y amarillos [0 1 1 0 0] al [0
1 1 0 1]. No. Figura Color Tamao Forma
1 Verde oscuro Pequeo Cuadrado
2 Azul claro Grande Estrella
3) Desarrollo de la red para la clasificacin de 3 Rojo Pequeo Elipse
tamao de la figura 4 Rojo Mediano Crculo
Rojo pasin
La red de tamao tiene una sola entrada que es 5 (oscuro) Mediano Cuadrado
pas ocultas y una capa de salida lineal que tiene 12 Verde Pequeo Estrella
dos neuronas. La funcin de activacin para las 13 Amarillo claro Pequeo Cuadrado
Amarillo
dos capas ocultas es la funcin tangente sigmoi- 14 quemado Mediano Crculo
dea [12].
Fuente: Autores del proyecto
12 ITECKNE Vol. 6 Nmero 1 Junio 2009 5 - 13
REFERENCIAS
[1] R. Gonzlez, P. Wintz., Digital Image Processing, 3a.
Fuente: Autores del proyecto. edicin, Prentice Hall.
[11] http://www.gc.ssr.upm.es/inves/neural/ann2/anntu-
Dado que las tcnicas de visin artificial se requie- tor.htm
ren para el procesamiento y la extraccin de las
caractersticas de la imagen digital, utilizadas en [12] Toolbox, MATLAB, Redes Neuronales.
ambas tcnicas de clasificacin, y la diferencia en
[13] Toolbox, MATLAB, Logical Fuzzy.