Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Trabajo de Graduacin
2013
Trujillo, Diciembre del 2013
Diseo de una tcnica basada en procesamiento de imgenes con tecnologa mvil UNIVERSIDAD
para mejorar la seleccin de productos de una tienda virtual NACIONAL DE
TRUJILLO
RESUMEN
INDICE GENERAL
INTRODUCCION................................................................................................................... 7
1.3 Hiptesis................................................................................................................ 14
1.5.2 Empresarial.................................................................................................... 15
2.2.1 Tcnicas......................................................................................................... 17
INDICE DE FIGURAS.
Figura 1Ejemplo cdigo de barra ........................................................................................ 20
Figura 2: Formatos de cdigos Bidi. ................................................................................... 21
Figura 3 Ejemplo de cdigo QR .......................................................................................... 22
Figura 4 Ejemplo de etiqueta RFID ..................................................................................... 23
Figura 5 Ejemplo de cdigo Bokode ................................................................................... 25
Figura 6 Cdigo QR micro................................................................................................... 26
Figura 7 Cdigo QR Standard ............................................................................................. 26
Figura 8 Comparacin de tamao de impresin entre cdigo barra y cdigo QR............. 27
Figura 9 Capacidad de correccin del Cdigo QR ............................................................. 28
Figura 10 Capacidad de lectura desde cualquier ngulo del cdigo QR ........................... 28
Figura 11 Capacidad de concatenacin del Cdigo QR .................................................... 28
Figura 12 Estructura de un Cdigo QR versin 7 ............................................................... 29
Figura 13 Patrn localizador de un cdigo QR. .................................................................. 30
Figura 14 Margen de seguridad para cdigos QR.............................................................. 31
Figura 15 Factores de decisin de tamao de cdigo QR ................................................. 32
Figura 16 Versin y nmero de mdulos de los cdigos QR ............................................. 33
Figura 17 Formato de Informacin de un cdigo QR ......................................................... 34
Figura 18 Ejemplo tamao de los mdulos en un cdigo QR Versin 1(21x21 mdulos) 36
Figura 19 Tipos de Imgenes Digitales; (a) RGB; (b) Indexada; (c) Escala de Grises; (d)
Binaria .................................................................................................................................. 45
Figura 20 Ruido que afecta a una imagen; (a) original; (b). ............................................... 46
Figura 21 Diferentes ruidos afectando a una imagen; (a) Original; (b) Gaussiano; (c)
Multiplicativo; (d) Sal y Pimienta ............................................................................................ 47
Figura 22 Vecindad (p). ................................................................................................. 48
Figura 23 Vecindad por (p). .......................................................................................... 49
Figura 24 Conectividad de Pixeles ...................................................................................... 49
Figura 25 Distancia euclidiana para una imagen de 5 por 5. ............................................. 50
Figura 26 Distancia tablero de ajedrez para una imagen de 5 por 5. ................................ 51
Figura 27 Calidad de una imagen de Smartphone vs. Cmara Digital .............................. 52
Figura 28 Tamao de Sensor de una cmara digital.......................................................... 53
Figura 29 Apertura de Diafragma de una cmara digital.................................................... 54
Figura 30 Distancia focal de una cmara digital. ................................................................ 55
Figura 31 Ejemplo de binarizacin por histograma ............................................................ 58
Figura 32 Algoritmo con umbralizacin fija ......................................................................... 59
Figura 33 Algoritmo con umbralizacin automtica. ........................................................... 60
INDICE DE TABLAS.
Tabla 1 Ventajas y desventajas de los cdigos RFID ........................................................ 24
Tabla 2 Capacidad de almacenamiento de cdigos QR .................................................... 27
Tabla 3 Capacidad de un QR Code segn su versin ....................................................... 33
Tabla 4 Capacidad de correccin de cdigos QR .............................................................. 35
Tabla 5 Niveles de visin y procesos del PDI..................................................................... 38
Tabla 6 Entradas y salidas de los mtodos del PDI ........................................................... 39
Tabla 7 Tamao de una Imagen ......................................................................................... 48
Tabla 8Comparativa de la rapidez en segundos de los algoritmos de umbralizacin local y
global con una ventana de 3x3. .......................................................................................... 62
Tabla 9 Valores de evaluacin de cuadros comparativos .................................................. 84
Tabla 10 Cuadro comparativo de las formas de seleccionar productos. ........................... 85
Tabla 11 Cuadro comparativo de las formas de captura de una imagen digital................ 87
Tabla 12 Cuadro comparativo de tipos de cmaras digitales............................................. 87
Tabla 13 Cuadro comparativo de los tipos de formato de imagen..................................... 88
Tabla 14 Cuadro comparativo de algoritmos de binarizacin ............................................ 89
Tabla 15 Cuadro comparativo de algoritmos de filtrado ..................................................... 89
Tabla 16 Cuadro comparativo de algoritmos de segmentacin ......................................... 90
INTRODUCCION
El presente trabajo de investigacin, tiene como objetivo disear una tcnica basada en
procesamiento de imgenes con tecnologa mvil para mejorar la seleccin de productos
de una tienda virtual, para lo cual el documento se ha estructurado en 4 captulos,
conclusiones y las referencias; a fin de obtener un panorama ms amplio del tema a
tratar.
En el cuarto captulo, metodologa del trabajo, se detallan cada uno de los pasos que se
sigue en la metodologa usada, empezando por el paso 1: recoleccin de informacin, la
cual fue realizada en el marco terico. El paso 2: anlisis de informacin, se realizaron
cuadros comparativos para elegir los algoritmos que mejor se adapten al diseo de la
tcnica. Finalmente en el paso 3: Diseo de la tcnica, se muestra el diseo
arquitectnico y algoritmos de los pasos que conforman la tcnica.
En conclusin, el desarrollo del este trabajo de graduacin busca que con el diseo de la
tcnica se pueda agilizar el proceso de seleccin de productos desde la captura del
cdigo del producto con la cmara de un celular, hasta la interpretacin de ste usando
algoritmos de procesamiento de imgenes. El uso de sta tcnica servir como modelo
para la creacin de futuras aplicaciones rpidas y confiables, que faciliten la vida
cotidiana de los usuarios peruanos.
1.1 Problema:
realizar una tarea que antes poda llegar a resultar tediosa, permitindonos
disminuir el tiempo empleado con el uso de las formas de seleccin
acostumbradas.
Resumen:
El propsito general del proyecto fue el estudio de las funcionalidades de la
tecnologa NFC as como de los cdigos QR para la futura creacin de
Resumen:
Este proyecto presentado con el afn de formar conciencia sobre las especies
vegetales que se tienen al alcance, del cual naci la idea de implementar una
gua de campo en la que sea fcil hacer bsquedas, tan fcil como hacer una
observacin de la planta en cuestin, esta observacin correspondi a la toma
de una fotografa a partir de la cual se entregue el nombre de la especie. Una
aplicacin que hace esta tarea es leafsnap para el sistema operativo iOS, en
esta memoria se present el desarrollo de un prototipo que implement una
alternativa para la identificacin de especies vegetales por reconocimiento de
imgenes para el sistema operativo android. El desarrollo de este trabajo apunt
ampliar el impacto de leafsnap, considerando un rea geogrfica distinta,
usuarios de dispositivos android. Adems, de contar un servicio web que realice
las bsquedas para la identificacin de especies, que no requiera la interaccin
de una aplicacin especfica sino que sea accesible por cualquiera que desee
usarlo. (Valenzuela Prez, 2013)
1.3 Hiptesis.
A. Variable Independiente.
B. Variable Dependiente.
1.4 Objetivos:
1.5.2 Empresarial.
1.5.4 Social.
2.1.1 Poblacin.
Formada por todas las imgenes que tienen cdigo QR, generadas
para una tienda virtual indeterminada.
2.1.2 Muestra.
Dnde:
n = tamao de la muestra
p = Proporcin (Prevalencia) de la variable. de literatura, prueba piloto o
maximizar con p=0.5.
q = Complemento de P. (q=1-p).
d= Precisin depende del investigador. Costo y tiempo.
= nivel de significancia.
-1 = nivel de confianza.
Z^2 = Valor crtico correspondiente al nivel de confianza elegido: siempre se
opera con valor sigma. E^2 = Margen de error o de imprecisin permitido (lo
determinar el director del estudio).
Reemplazando: Para una precisin del 50%, y un nivel de confianza del 95%
2.2.2 Instrumentos.
Desde el lado del usuario: Recrea el escaparate de una tienda real mostrando
las imgenes y descripcin de los productos del negocio, en la portada hay una
seccin de ltimos productos o novedades, rea de productos en oferta; el
producto ms popular, descuentos por campaa, etc.
3.2.1 El Producto:
Cdigos Qr:
Constituyen un sistema para almacenar informacin en
una matriz de puntos de dos dimensiones (2D). Tambin se les
1
ISO/IE C 15420:2009. Information technology Automatic identification and dat a capture
techniques EAN/UPC bar code symbology specification
2
ISO/IE C 18004:2000. Information technology Automatic identification and dat a capture
techniques Bar code symbology QR Code.
3
ISO 18.000 Information technology Radio frequency identification for tem management.
3.2.2.4 Bokode
El MIT Media Lab est desarrollando un tipo de etiqueta
ptica llamada Bokode y que por sus caractersticas podra situarse a
medio camino entre un cdigo de barras o QR convencional y un chip
RFID.
Por un lado se trata de una etiqueta ptica. Es decir, debe
permanecer visible para ser legible. Pero, como sucede con los chips
RFID, no es necesario que sean perceptibles para las personas ni es
necesario capturarlos a corta distancia y de forma especfica, sino
que la informacin que contiene es accesible siempre y cuando los
bokodes sean capturados en la imagen, esttica o de vdeo, de una
cmara, directa o indirectamente.
Son dos, uno vertical y otro horizontal. Estn formados por una
lnea o columna de mdulos blancos y negros alternados,
comenzando y terminando en un mdulo negro. Posibilitan que
la versin del smbolo y las coordenadas de los mdulos
4
Los mdulos son los puntos blancos y negros que conforman un cdigo QR.
. . . . . . . .
. . . . . . . .
L 2 956 23 648 7 089 4 296 2 953 1 817
M 2 334 18 672 5 596 3 391 2 331 1 435
40 1 666 13 328 3 993 2 420 1 663 1 024
Q
1 276 10 208 3 057 1 852 1 273 784
H
Fuente: (Ordez, 2009)
5
Cdigo cclico no binario de correccin de error usado en los CDs de msica, telefona mvil y
sondas espaciales.
6
Ree-Salomon requiere el doble de la cantidad de cdigos de palabras para ser corregidos.
3. Segmentacin Medio
4. Descripcin
5. Reconocimiento
6. Interpretacin Alto
Fuente: (Esqueda Elizondo & Palafox Maestre, 2005)
Como se puede apreciar, agrupamos los mtodos y/o procesos del PDI en dos
categoras principales:
1. Mtodos cuya entrada y salida son imgenes.
2. Mtodos cuyas entradas pueden ser imgenes y las salidas son atributos
extrados de esas imgenes.
Una imagen puede definirse como una funcin bidimensional f(x,y) donde x
y y son coordenadas en el plano y la amplitud f es llamada intensidad o nivel
de gris en ese punto.
El valor es relativo a alguna propiedad del punto que representa, como por
ejemplo su brillo o su matiz.
Figura 19 Tipos de Imgenes Digitales; (a) RGB; (b) Indexada; (c) Escala de Grises; (d) Binaria
Fuente: (Esqueda Elizondo & Palafox Maestre, 2005)
Figura 21 Diferentes ruidos afectando a una imagen; (a) Original; (b) Gaussiano; (c) Multiplicativo;
(d) Sal y Pimienta
Fuente: (Esqueda Elizondo & Palafox Maestre, 2005)
3.4.5.2 Conectividad
La conectividad es un concepto importante utilizado para
establecer los lmites de objetos en regiones dentro de una imagen
digital. Para determinar si dos pxeles estn conectados se determina
si son adyacentes en algn sentido, sea (p) o (p) por ejemplo,
y si sus niveles de gris satisfacen algn criterio de similitud (si son
iguales o parecidos). Por ejemplo, en una imagen binaria con valores
de 1 y 0, dos pxeles pueden ser vecinos (p), pero se dice que
estn conectados slo cuando tienen el mismo valor.
En la figura 3.7 se observa la conectividad de pxeles en una
imagen binaria. El pxel 6 est conectado con el 2 y 8. El pxel 3 est
conectado con el 5.
3.4.5.3 Distancia
La distancia o transformada de distancia proporciona una
medicin de la separacin existente entre dos puntos dentro de una
imagen. Dados dos pxeles p y q con coordenadas (x,y) y (s,t),
respectivamente, se puede definir una funcin de distancia D si se
cumple:
D(p,q) 0
D(p,q) = 0, si p=q
D(p,q) = D(q,p)
a) A travs de la red
b) Cmaras digitales:
Las cmaras digitales se han convertido en un accesorio
bastante habitual de las instalaciones domsticas. El
abaratamiento de su precio, la facilidad de uso y la calidad de las
fotografas han propiciado un notable incremento de su difusin
entre usuarios informticos y aficionados a la imagen, que
actualmente hacen uso de diferentes tipos de cmaras digitales:
cmaras de un Smartphone, cmara digital compacta, Cmara
tipo rflex, Cmara profesional tipo rflex.
Tipo de sensor:
El sensor captura la luz y mientras ms grande, mejor luz
podr capturar. Podemos diferenciar y marcar las siguientes
referencias por las que un smarthphone no puede igualar la
calidad de una imagen tomada con una cmara:
Tipo de lente:
El lente adapta una imagen de varios metros a unos pocos
milmetros.
Existen varios fabricantes de lentes, de las cuales depende,
en cierta forma, la velocidad de captura de imagen, los
efectos de profundidad de campo y la estabilidad en las
imgenes, entre otras muchas caractersticas. (O., 2011)
La distancia focal:
Bsicamente, este trmino se refiere a un nmero
expresado en milmetros que nos indica los grados que el
lente de una cmara digital es capz de abarcar. Es decir, a
menor distancia focal, mayor ser el campo de imagen
capturado por nuestra lente (el cual se expresa en grados).
Tradicionalmente las cmaras fotogrficas contaban con un
ngulo de 63 grados, lo cual equivale a una distancia focal
de 35 mm. En los celulares este nmero suele ser fijo a 60.
(Acosta, 2011)
La captura del cdigo no ser suficiente para identificar los datos que
contiene, ya que podemos encontrarlo rotado, estirado o con
diferentes tipos de zoom. Por tanto debemos de procesar la imagen
antes de poder aplicarla a un algoritmo de decodificacin de cdigo
QR.
1. Binarizacin de la imagen:
El proceso de binarizacin de la imagen tiene una gran
importancia en el proceso de identificacin de cdigos QR.
Mtodos de Binarizacin:
1 si f(x,y) umbral
g(x,y) = 0 si f(f,y) < umbral
Binarizacin automtica
Mtodo de Otsu
( ) ( )
( ) ( ) ( )
Dnde:
() ()
() ()
Dnde: 1tL
( ) ()
( ) ()
( ) ( ) ( )
( ) ( ) ( ) ( ) ( )
( )
( )
Las respuestas en frecuencia de estas mscaras son filtros pasos
cuyos anchos de banda dependen de sus varianzas. No
presentan rizados o lbulos secundarios en el mdulo y son de
fase lineal. Al igual que los filtros binomiales, las mscaras de
Gauss bidimensionales se construyen a partir de las
unidimensionales. Su ventaja, respecto a los filtros binomiales,
est en su parametrizacin dependiendo de la varianza. A
medida de que la varianza sea ms elevada significar que tiene
en cuenta a vecinos ms alejados, por el contrario, si la varianza
es ms pequea indicar que slo ponderar con los ms
prximos. La varianza funciona como grado de ponderacin en la
vecindad. sta es la interpretacin en el dominio espacial. Desde
el punto de vista frecuencial, la varianza determina el ancho de
banda del filtro paso bajo que supone la mscara de Gauss. El
lbulo principal del mdulo de la respuesta frecuencia viene
determinado por la varianza. A mayor varianza menor ancho de
banda.
89 87 14
92 75 56
99 78 90
{89 87 14 92 75 | 56 99 78 90} {14 56 75 78 87 | 89 90 92 99}
[ ] [ ] []
3.4.6.3 Segmentacin
El anlisis de imgenes comprende todos los mtodos y tcnicas que
se utilizan para extraer informacin de una imagen. La segmentacin
de imgenes se ocupa de descomponer una imagen en sus partes
constituyentes, es decir, los objetos de inters y el fondo, basndose
en ciertas caractersticas locales que nos permiten distinguir un
objeto del fondo y objetos entre si.
Descomposicin de rbol X Y
3.4.6.4 Descripcin
Descriptores de Forma.
Cdigo de Cadena
rea
Permetro
Circularidad
3.4.6.5 Reconocimiento
1. Heursticas
Esta metodologa es la que hace uso de la experiencia y la
intuicin humana. Por lo general, los sistemas que son
desarrollados bajo estos mtodos, estn hechos a la medida del
problema que se desea resolver.
2. Matemticas
Este tipo de metodologa hace uso de las propiedades comunes
de los patrones y se basan en las reglas de clasificacin
formuladas en un marco matemtico. Adems, este enfoque se
divide a su vez en otras dos categoras: las determinsticas y las
estadsticas.
a. Determinsticas
No requieren de propiedades estadsticas, pero son limitadas.
Entre los mtodos determinsticos podemos encontrar, por
ejemplo, la clasificacin por distancia Euclidea.
b. Estadsticas
La aproximacin ms simple (y no por ello la menos eficiente)
consiste en representar cada patrn mediante un vector de
nmeros, y cada clase por uno o varios patrones prototipo. Dado
que existe variabilidad en las medidas registradas, cada
componente del vector es una variable aleatoria y cada uno de
sus valores es una realizacin de esa variable aleatoria.
3. Lingsticas (sintcticas)
Las tcnicas de este tipo reducen un objeto (habitualmente ya
binarizado) a un conjunto de elementos estructurales o
primitivas. Si a esto unimos una sintaxis para relacionar estos
elementos de forma espacial, obtenemos lo que se llama una
representacin sintctica. Se trata de descomponer objetos
complejos en trminos de conjuntos de primitivas simples (como
son arcos, ngulos, rectas, etc.) con reglas para describir la
relacin espacial entre ellas.
f. Portabilidad 4 3 2 1
g. Conectividad 4 2 1 0
1. Binarizacin:
4.1.2.3 Segmentacin
Para elegir el algoritmo de segmentacin, se utiliz el siguiente
cuadro comparativo:
FUENTE: Propia.
FUENTE: Propia.
Capitulo 5: CONCLUSIONES
Capitulo 6: REFERENCIAS