RECONOCIMIENTO DE CARACTERES OPTICOS (OCR)
USANDO MATLAB
Resumen.- el presente articulo muestra la forma de usar Matlab y funciones
de su toolbox de proeesamiento de imigenes para reconocer en una imagen
tuna palabra o conjunto de palabras y niimeras,
Se usa la correlacién para determina la semenjanza de las letra de entrada eon
las plantilla. El tomato de las letras debe ser mayor o igual a 24 x 42 pixeles,
de Lal forma que se ajuste al tamaio de la plantilla
Este programa fue probado sobre Matlab 7.1,
MATLAB; OPTICAL CHARACTER RECOGNITION ...
INTRODUCCION
La teenologia OCR proporeiona a los sistemas de repraduceién por esedner y
sistemas de imagenes la habilidad de convertir imagenes de caracteres en letra
de maquina, en caracteres eapaces de ser interpretades o reconocidos por una
computadora, Asi, lag imagenes de caraeteres en letea de méquina son
extraidas de un mapa de bits de la imagen repraducida por el escdner [1]El proceso OCR envuelve varios aspectos como segmentacidn, extraccién de
caracteristicas y clasificacién [2]
Image Processing Toolbox proporciona a MATLAB un conjunto de funciones
que amplia las capacidades del producto para realizar desarrollo de
aplicaciones y de nuevos algoritmes en el campo del proceso y andlisis de
imagenes. El entorno matemstico y de ereacion de MATLAB es ideal para el
Procesado de imdgenes, ya quie estas imégenes son, al fin y al cabo, matrices
Este toolbox incorpora funciones para:
® Disefio de filtros.
* Mejora y retocado de imagenes,
® Analisis y estadistica de imigenes,
* Operaciones morfoligicas, geomeétricas y de color.
* Transformaciones 2D,
El procesamiento de imagenes es un campo de trabajo absolutamente crucial
para aquellos colectives e industrias que estén trabajando en areas como
diagnéstico médico, astronomia, geofisia, ciencias medioambientales, andlisis
de datas en lnboratorios, inspeccién industrial, etc. [3].
DESARROLLO DEL PROGRAMA,
SEGMENTACION
Como primer paso, se recorta la imagen para ajustarla al texto. Luego de esto,
se separa linea por linea. La finciGn que realiza el recorte de la imagen se
‘muestra acontinuaciin:La siguiente figura muestra ebmo trabaja esta funcidn:
Fenvecorte > at
mt
www.matpic.com
Tal como se ve en la funeién, el umbral para la transformacton a imagen
binaria es 0.99 (bn=imabw{imagen,o,99)). Este umbral se tomé para que
colores con valores RGB muy cercanos a 255 (valor maximo) sean
considerados coma en la imagen binaria.
Una vez recortada 1a imagen, ef siguiente paso es separar cada linea. Para esto
se usd la siguiente funeian: