Documentos de Académico
Documentos de Profesional
Documentos de Cultura
IZCALLI
PERIODO 19-20/1
INGENIERÍA MECATRÓNICA
Proyecto Integrador
Banda con Visión Artificial
GRUPO: 961-M
Índice
Introducción………………………………………………………………3
Justificación ……………………………………………………………..4
Objetivos ………………………………………………………………….5
Capítulo 1 …………………………………………………………………6
Desarrollo ……………………………………………………………….25
Conclusiones …………………………………………………………..33
2
Introducción
Una de las formas innovadoras que está surgiendo hoy en día es el uso de visión
artificial, el cual, por medio de cámaras y software especializado, puede manejar
procesos y verificar que el sistema funcione de manera óptima y acorde a los
parámetros requeridos por el usuario.
Son muchas las ventajas que se pueden destacar al momento de reemplazar los
medios tradicionales de trabajo por nuevas alternativas. Entre estos se encuentran
los sistemas de control automatizados, los cuales pueden generar un mayor
desempeño durante la producción; y permiten mejorar las actividades realizadas
manualmente, aquellas que puedan ser de riesgo vital para el ser humano, haciendo
factible el reemplazo de los operarios.
Por todos los aspectos mencionados anteriormente, esta investigación busca crear
un sistema que, mediante el uso de visión artificial, ayude a evaluar los elementos
que pasen a través de la banda transportadora, identificando por el momento el
color de los objetos que este enfoque.
3
Justificación
Todo esto conlleva a la reducción del error causado por el factor humano para el
proceso de separación de objetos, los cuales se pueden ver afectados por el estado
anímico o cansancio físico del empleado, sugiriendo entonces esta nueva
alternativa de automatización. Sabiendo que los sistemas automáticos no sufren de
dichos factores humanos, debido a que tienen disponibilidad de trabajo las 24 horas
del día, pueden trabajar sin padecer errores por agotamiento físico y/o mental.
De igual manera, algunas empresas utilizan materiales que son nocivos para la
salud del trabajador; o ambientes hostiles que imposibilitan el desempeño ideal de
un empleado. En cambio, los sistemas automatizados pueden ser robustos y
trabajar a temperaturas altas o bajas y tener el mismo ritmo de producción.
Por esto, con esta investigación se pretende generar nuevas alternativas que
puedan solucionar diferentes conflictos en la empresa mediante el uso de esta
tecnología, la cual puede ser de gran impacto en cualquier ambiente que se le
disponga.
4
Objetivos
Objetivo general
Objetivos específicos
5
Capítulo 1
Marco Teórico
Este capítulo está orientado a detallar aspectos importantes en el ámbito del control
de calidad y los usos que tiene la visión artificial para mejorar este campo.
Empezando desde los conceptos básicos, se pretende explicar cómo ha ido
incrementando el uso de visión computarizada en todos los campos industriales y
las ventajas que conlleva.
Visión artificial
En las industrias son comunes los controles de calidad, estos mediante operarios
aceptan o rechazan piezas u objetos que estén superficialmente defectuosos. Pero,
estas son tareas repetitivas, y el ser humano tiende a distraerse y a generar errores
con el paso del tiempo por el cansancio y/o envejecimiento, por esta razón, una gran
parte de las grandes industrias han optado por implementar la visión artificial en sus
procesos, debido a que los errores que se manejan son bajos o casi nulos.
6
Figura 1. Componentes de un sistema de visión artificial
Para la adquisición de todos y cada uno de estos componentes, los cuales existen
en gran variedad en el mercado actual, solo es necesario conocer cuáles son las
principales características del sistema y que datos se desean adquirir.
Iluminación
Esta es la parte más importante del sistema, debido a que es necesario resaltar las
características más relevantes de los objetos a analizar.
Esto a su vez ayuda a que las cámaras obtengan una buena captura de la imagen
que posteriormente será procesada. Los objetos siempre deben estar iluminados de
forma adecuada y estos pueden variar dependiendo del resultado que se desee
obtener.
7
Adquisición
Esta tarea se describe como la captura de los rayos reflejados por los objetos, los
cuales son convertidos en señales eléctricas para poder ser procesados.
Es realizada por la cámara, y en ocasiones por otros dispositivos como rayos X o
ultrasonidos.
Procesamiento
En este punto del proceso, es cuando la imagen previamente capturada pasa a ser
introducida en memoria, y el sistema de adquisición o el procesador pueden aplicar
distintas técnicas de pre procesamiento que permitan la extracción de
características importantes, necesarias y requeridas por el usuario para su
interpretación.
Actuadores
Debido a que los sistemas de visión artificial, generalmente forman parte de grandes
procesos en grandes sistemas, sus resultados son entregados a robots, cintas
transportadoras y todo tipo de actuadores los cuales se encargan de realizar el
procedimiento mecánico del sistema.
Tipos de Iluminación
Hay distintos tipos de iluminación, en los cuales se destacan:
Iluminación Direccional
Esta consiste principalmente en aplicar un haz de luz directamente orientado al
objeto, y es utilizado en aplicaciones como localización y reconocimiento de piezas.
8
Iluminación Difusa
Este tipo de iluminación consiste en lograr que los haces luminosos incidan desde
diferentes direcciones. Esto para proporcionar un bajo contraste y ausencia de
sombras, se utiliza principalmente para analizar superficies suaves y regulares.
Iluminación a Contraluz
Consiste en iluminar el objeto por la parte posterior, contraria a la cámara, de
manera que este se encuentre alineado con el lente, dando como resultado
imágenes binarias. Su uso principal es la localización de piezas y análisis de
agujeros.
9
Iluminación Oblicua
Este tipo de iluminación tiene como objetivo principal la creación de sombras
encargados de aumentar el contraste de las partes tridimensionales, las cuales
destacan detalles como pequeños relieves, entre otros.
Iluminación Estructurada.
Esta forma de iluminar los objetos utiliza la proyección de puntos o franjas sobre la
superficie de trabajo, obteniendo así una mayor facilidad en el análisis de las
características 3D del objeto, debido a que existe un patrón conocido y las
diferencias con este patrón facilitan el análisis de la imagen.
10
Iluminación Coaxial.
Se ilumina de manera que la luz incida en la misma dirección que la luz que entra
en la cámara. Para ello se suelen emplear materiales especiales que ayudan a
desviar la luz con cierta inclinación, esto contribuye a eliminar los brillos que
dificultan el análisis de detalles.
Iluminación Dark-Ground
Este tipo de iluminación consiste en iluminar el objeto por la parte posterior, contraria
a la cámara, con la diferencia que se debe bloquear el paso de la mayor parte de la
luz de la fuente. Es usado principalmente en el análisis de objetos transparente, en
particular para iluminar únicamente los bordes.
11
Fuentes de Iluminación.
Teniendo en cuenta que no solo se debe escoger el método de iluminación más
óptimo, también se debe decidir qué tipo de fuente de iluminación se escogerá
dependiendo de las características que se desean resaltar. Esto se debe hacer de
manera que no afecte el lente de la cámara y la calidad de la imagen capturada.
Existen diferentes fuentes de iluminación, entre los que destacan:
Halógena
Este tipo de iluminación presenta gran luminosidad, pero desprende calor, su luz es
caliente y su precio es alto. Además, presentan un rápido envejecimiento.
12
Xenón
La luz Xenón presenta aún mayor luminosidad, aunque los mismos inconvenientes
que la luz halógena, y un precio mayor.
Led
La iluminación de tipo LED, admite multitud de configuraciones y están disponibles
en multitud de colores. Estos son estables, duraderos y funcionan en baja tensión,
aunque su precio es elevado.
13
Láser
La iluminación mediante láser o luz estructurada, se utiliza normalmente para
resaltar o determinar la tercera dimensión de un objeto.
El método utilizado es colocar la fuente de luz láser en un ángulo conocido con
respecto al objeto a iluminar y con respecto a la cámara. Viendo la distorsión de la
luz puede interpretarse la profundidad de los objetos a medir.
14
Características ópticas de los materiales
En cada uno de los casos de sistemas de visión artificial, es muy importante saber
las características de los materiales cuando un haz de luz incide sobre el cuerpo de
estos mismos, debido a que pueden darse el caso de que sean reflejados,
absorbidos o transmitidos.
Propiedades Reflexivas
En esta propiedad se destacan dos tipos de materiales:
Materiales especulares
Son aquellos que reflejan la luz de manera directa y en un ángulo determinado, que
posteriormente puede afectar al sensor de la cámara. Estas son poco confiables
debido a que en muchos casos son comparables con la intensidad de la luz que
proviene de la fuente de iluminación, y al menos que estos ángulos estén bien
controlados, es mejor evitar la presencia de este tipo de reflexiones.
15
Figura 16. Reflexión Difusa
Propiedades Absorbentes
Los materiales con este tipo de propiedades, son aquellos que pueden ser o no
selectivos al espectro, según las longitudes de onda que absorban. Siendo así de
color negro, aquel material capaz de absorber todas las longitudes de onda, pero,
si no absorbe ninguna onda de incidencia, quiere decir que el material es totalmente
de color blanco.
Propiedades Transmitivas
Los objetos afectados por esta propiedad, son aquellos cuyos materiales tienen la
capacidad de dejar pasar la luz a través de sus cuerpos. Hay 3 tipos de transmisión
que cumplen con esta propiedad:
16
Transmisión directa
Sucede cuando la luz atraviesa un objeto y no se producen cambios en la salida de
la dirección o la calidad de ese haz de luz.
Transmisión difusa
Esta se produce cuando la luz atraviesa un objeto, el cual ya sea de características
semi-transparente o posea texturas en su cuerpo. Esto conlleva a que la luz de
salida no viaje en una única dirección, sino que esta es desviada en muchas
direcciones y de igual manera va a tener menos contraste. Siendo así menos
intensa, generando sombras más claras.
Transmisión selectiva
Este tipo de transmisión se genera cuando un haz de luz incide sobre objetos de
color, el cual va a ser absorbido y solo dejará pasar una parte, que generalmente
será del mismo color de la superficie iluminada. Por lo tanto del otro lado de la
superficie del objeto, la luz transmitida va a ser igual al color del cuerpo del objeto.
17
Figura 20. Transmisión Selectiva
18
Dejan pasar la luz sin
Transparentes dispersión o reflexión
apreciable.
Dejan pasar la mayor
Transparentes parte de la luz incidente
Translúcidos pero con una
componente importante
de difusión.
Opacos No permiten el paso de
la luz en ningún caso.
Tabla 1. Características ópticas de los materiales
Tipos de cámara
Para enfocar el proceso de elección, se destacan dos tipos de cámaras, las cuales
son:
19
Cámaras Analógicas
Son aquellas cámaras que poseen una señal de salida analógica de video, la cual
puede venir acompañada o no, por otras señales de sincronización. La señal de
video viene limitada por la anchura de banda y por el ruido análogo que puede
proporcionar el cable.
20
Sensor CCD
Un charge-coupled device o CCD, convierte las cargas de las celdas de la matriz en
voltajes y entrega una señal analógica en la salida, que será posteriormente
digitalizada por la cámara.
En los sensores CCD, se hace una lectura de cada uno de los valores
correspondientes a cada una de las celdas. Entonces, es esta información la que
un convertidor analógico-digital traduce en forma de datos. En este caso, la
estructura interna del sensor es muy simple, pero se tiene como inconveniente la
necesidad de un chip adicional que se encargue del tratamiento de la información
proporcionada por el sensor, lo que se traduce en un gasto mayor y equipos más
grandes.
Sensor CMOS
En el caso del sensor de tipo CMOS (Complementary Metal Oxide Semiconductor),
aquí cada celda es independiente. La diferencia principal es que la digitalización de
los píxeles se realiza internamente en unos transistores que lleva cada celda, por lo
que todo el trabajo se lleva a cabo dentro del sensor y no se hace necesario un chip
externo encargado de esta función. Con esto conseguimos reducir costes y equipos
más pequeños.
21
Figura 25. Sensor CMOS
Software
Actualmente, las técnicas de proceso y análisis de imagen han dado un giro rotundo
en cuanto a la evaluación de los productos en tiempo real.
Hace pocos años era imposible realizar este tipo de procesos, debido a que los
ordenadores no eran lo suficientemente rápidos para realizar los cálculos de las
22
tamaño, y poder extraer todas las características necesarias en cada uno de los
procesos.
Banda transportadora.
Esta banda es principalmente un accesorio de la compañía Intelitek, utilizada como
un equipo didáctico. Se utiliza para el transporte automatizado de las botellas, y es
alimentada manualmente simulando que provienen de la línea de producción.
23
Figura 28. WebCam FaceCam 1010.
24
DESARROLLO
Empezaremos con la elaboración de esta banda transportadora la cual tiene como
fin automatizar ciertos sistemas de producción en distintas áreas o ramas de la
industria tal como son la alimenticia, el área de polímeros, área farmacéutica,
entre otras áreas en las cuales es muy amplia esta selección de trabajo.
Para el desarrollo de la banda se utilizo un material conocido como hule
antiestático. Un dispositivo antiestático es cualquier dispositivo que reduce,
amortigua, o de otra manera inhibe la descarga electroestática; el aumento o
descarga de la electricidad estática12, la cual puede dañar componentes
electrónicos como discos duros de computadora, e incluso prender líquidos
inflamables y gases. Un tapete antiestático o un tapete conectado a tierra elimina
la electricidad estática. Lo hace gracias a que tiene una resistencia baja
controlada: un tapete de metal mantendría las piezas a tierra, pero podría hacer
cortocircuito en las partes expuestas; un tapete aislante no proveería conexión a
tierra. La resistencia típica está en el orden de 105 a 108 ohms entre los puntos
del tapete y el suelo. El tapete necesita estar conectado a tierra. Esto es
importante para hacer la descarga a una velocidad lenta, por lo que una
resistencia debe ser usada para hacer tierra en el tapete, también previene el
peligro de electrocutarse cuando se trabaja con partes de bajo voltaje. Algunos
tapetes conectados a tierra permiten conectar una pulsera antiestática a ellos. Hay
versiones diseñadas para ser colocadas en el suelo y en el escritorio.
Ocupamos unos coples de acero para unir los rodillos con el movimiento del
motor. Los rodillos son hechos de cilindros huecos de polipropileno lo cual es mas
resistente que el PVC. Estos tubos se encuentran, uno en cada extremo de la
banda y un cilindro adicional al centro de la misma para evitar que la banda se
cuelgue si se le coloca mas peso.
El polipropileno (PP) es el polímero termoplástico, parcialmente cristalino, que se
obtiene de la polimerización del propileno (o propeno). Pertenece al grupo de
las poliolefinas y es utilizado en una amplia variedad de aplicaciones que incluyen
empaques para alimentos, tejidos, equipo de laboratorio, componentes
automotrices y películas transparentes. Tiene gran resistencia contra diversos
solventes químicos, así como contra álcalis y ácidos. El Polipropileno isotáctico,
comercialmente conocido como Polipropileno, PP o hPP, es muy similar
al polietileno, excepto por las siguientes propiedades:
Menor densidad: el PP tiene un peso específico entre 0,9 g/cm³ y 0,91
g/cm³, mientras que el peso específico del PEBD (polietileno de baja
densidad) oscila entre 0,915 y 0,935, y el del PEAD (polietileno de alta
densidad) entre 0,9 y 0,97 (en g/cm³)
Temperatura de reblandecimiento más alta
Gran resistencia al stress cracking
25
Mayor tendencia a ser oxidado (problema normalmente resuelto mediante
la adición de antioxidantes)
El PP tiene un grado de cristalinidad intermedio entre el polietileno de alta y el de
baja densidad.
Este polímero es parecido al caucho y es un buen elastómero. Esto es porque los
bloques isotácticos forman cristales. Pero dado que los bloques isotácticos están
unidos a los bloques atácticos, cada pequeño agrupamiento de polipropileno
cristalino isotáctico quedaría fuertemente enlazado por hebras del dúctil y gomoso
polipropileno atáctico, como usted puede ver en la figura de la derecha.
Para ser honestos, el polipropileno atáctico sería parecido a la goma sin ayuda de
los bloques isotácticos, pero no sería muy fuerte. Los bloques isotácticos rígidos
mantienen unido al material atáctico gomoso, dándole más resistencia. La mayoría
de los tipos de caucho deben ser entrecruzados para darles fuerza, pero eso no
ocurre con los elastómeros del polipropileno.
El polipropileno elastomérico, como es llamado este copolímero, es una clase
de elastómero termoplástico.
La sincronización del motor con la banda se llevó a cabo a través de unas bandas
elásticas que trasmiten el movimiento rotatorio. Una banda de goma es un pequeño
trozo de goma de látex en forma de un bucle. Las bandas de goma se utilizan
normalmente para mantener varios objetos juntos.
La banda de goma fue patentada en Inglaterra el 17 de marzo de 1845 por Stephen
Perry.
Las bandas de caucho, son hechas:
Para la extrusión de la goma en un tubo largo.
Para proporcionar su forma general.
Como transmisores de movimiento.
26
Para poner los tubos en los mandriles.
Para curar la goma con el calor.
Los productos de caucho pueden utilizar el caucho sintético, y las bandas de
caucho, que están principalmente fabricadas con caucho natural debido a una
superior elasticidad.
El caucho natural proviene de la savia del árbol del caucho.
El caucho natural se fabrica a partir del látex, que se obtiene al aprovechar las capas
de la corteza del árbol del caucho. Los árboles de caucho pertenecen a la familia
del tártago (Euphorbiaceae) y viven en zonas cálidas y tropicales.
Los árboles de caucho sólo sobreviven en climas cálidos y húmedos, cerca del
ecuador, por lo que la mayoría de látex se produce en el sureste de los países
asiáticos de Malasia, Tailandia e Indonesia.
La parte eléctrica constituye una botonera que tiene dos botones normalmente
abiertos con un foco led incluido en cada uno, y un botón de paro de emergencia
que en su conjunto hacen funcionar un relevador o bobina de relevador que al ser
energizado tiene como característica cerrar contactos incluidos en el mismo y al
conectar un contacto directo a un motor de corriente directa a 24 Volts podremos
hacer funcionar la banda optimamente con arranque, paro y un paro de emergencia
de seguridad. Dicho motor esta
conectado a los coples antes
mencionados para transmitir el
movimiento hacia la banda.
El relé o relevador es un dispositivo
electromecánico. Funciona como un
interruptor controlado por un circuito
eléctrico en el que, por medio de
una bobina y un electroimán, se acciona
un juego de uno o varios contactos que
permiten abrir o cerrar otros circuitos
eléctricos independientes. Dado que el
relé es capaz de controlar un circuito de salida de mayor potencia que el de entrada,
puede considerarse, en un amplio sentido, como un amplificador eléctrico. Como tal
se emplearon en telegrafía, haciendo la función de repetidores que generaban una
nueva señal con corriente procedente de pilas locales a partir de la señal débil
recibida por la línea. Se les llamaba “relevadores”. De ahí “relé”.
La gran ventaja de los relés electromagnéticos es la completa separación eléctrica
entre la corriente de accionamiento, la que circula por la bobina del electroimán, y
los circuitos controlados por los contactos, lo que hace que se puedan manejar
altos voltajes o elevadas potencias con pequeñas tensiones de control. También
ofrecen la posibilidad de control de un dispositivo a distancia mediante el uso de
pequeñas señales de control. En el caso presentado podemos ver un grupo de relés
en bases interfases que son controlado por módulos digitales programables que
27
permiten crear funciones de temporización y contador como si de un mini PLD
(Dispositivo Lógico Programable) se tratase. Con estos modernos sistemas los relés
pueden actuar de forma programada e independiente lo que supone grandes
ventajas en su aplicación aumentando su uso en aplicaciones sin necesidad de
utilizar controles como PLD’s u otros medios para comandarlos. Se puede encender
por ejemplo una bombilla o motor y al encenderlo se apaga el otro motor o bombilla.
Los motores de Corriente Directa o motor DC(correspondiente a las iniciales en
inglés “direct current”) es también conocidos como motor de Corriente Continua o
motor CC, son muy utilizados en diseños de ingeniería debido a las características
torque-velocidad que poseen con diferentes configuraciones eléctricas o
mecánicas.
Una gran ventaja de los motores de CD se debe a que es posible controlarlos con
suavidad y en la mayoría de los casos son reversibles, responden rápidamente
gracias a que cuentan con una gran razón de torque a la inercia del rotor. Otra
ventaja es la implementación del frenado dinámico, donde la energía generada por
el motor se alimenta a un resistor disipador, y el frenado regenerativo donde la
energía generada por el motor retroalimenta al suministro de potencia CD, esto es
muy utilizado en aplicaciones donde se deseen frenados rápidos y de gran
eficiencia.
El resto de la estructura está conformado por madera que soporta principalmente la
banda y todos sus componentes y en la parte superior de la banda se encuentra un
marco o caja de madera que es por donde se colocara una cámara para por esta
misma cámara realizar el trabajo de la visión artificial. La cámara mandara la imagen
al software de programación LabVIEW el cual por medio del código de visión
artificial reconocerá los distintos objetos
entrando por la banda y por este medio arrojara
un valor de compatibilidad hacia la
computadora o PC.
LabVIEW (acrónimo de Laboratory Virtual
Instrument Engineering Workbench) es una
plataforma y entorno de desarrollo para
diseñar sistemas, con un lenguaje
de programación visual gráfico pensado para
sistemas hardware y software de pruebas,
control y diseño, simulado o real y embebido.
Este programa fue creado por National
Instruments (1976) para funcionar en
máquinas MAC, salió al mercado por primera
vez en 1986, teniendo versiones disponibles
para las plataformas Windows, UNIX, MAC y GNU/Linux actualmente. La
penúltima versión es la 2013, con la increíble demostración de poderse usar
simultáneamente para el diseño del firmware de un instrumento RF de última
generación, a la programación de alto nivel del mismo instrumento, todo ello con
código abierto. Y posteriormente la versión 2014 disponible en versión demo para
28
estudiantes y profesional, la versión demo se puede descargar directamente de la
página National Instruments.
Los programas desarrollados con LabVIEW se llaman Instrumentos Virtuales, o VIs,
y su origen provenía del control de instrumentos, aunque hoy en día se ha
expandido ampliamente no sólo al control de todo tipo de electrónica
(Instrumentación electrónica) sino también a su programación embebida,
comunicaciones, matemáticas, etc. Un lema tradicional de LabVIEW es: "La
potencia está en el Software", que con la aparición de los sistemas multinúcleo se
ha hecho aún más potente. Entre sus objetivos están el reducir el tiempo de
desarrollo de aplicaciones de todo tipo (no sólo en ámbitos de Pruebas, Control y
Diseño) y el permitir la entrada a la informática a profesionales de cualquier otro
campo. LabVIEW consigue combinarse con todo tipo de software y hardware, tanto
del propio fabricante -tarjetas de adquisición de datos, PAC, Visión, instrumentos y
otro Hardware- como de otros fabricantes.
Como se ha dicho es una herramienta gráfica de programación, esto significa que
los programas no se escriben, sino que se dibujan, facilitando su comprensión. Al
tener ya prediseñados una gran cantidad de bloques, se le facilita al usuario la
creación del proyecto, con lo cual en vez de estar una gran cantidad de tiempo en
programar un dispositivo/bloque, se le permite invertir mucho menos tiempo y
dedicarse un poco más en la interfaz gráfica y la interacción con el usuario final.
Cada VI consta de dos partes diferenciadas:
Panel Frontal: El Panel Frontal es la interfaz con el usuario, la utilizamos para
interactuar con el usuario cuando el programa se está ejecutando. Los usuarios
podrán observar los datos del programa actualizados en tiempo real (como van
fluyendo los datos, un ejemplo sería una calculadora, donde tú le pones las
entradas, y te pone el resultado en la salida). En esta interfaz se definen
los controles (los usamos como entradas, pueden ser botones, marcadores etc..)
e indicadores (los usamos como salidas, pueden ser gráficas).
Diagrama de Bloques: es el programa propiamente dicho, donde se define su
funcionalidad, aquí se colocan íconos que realizan una determinada función y se
interconectan (el código que controla el programa --. Suele haber una tercera
parte icono/conector que son los medios utilizados para conectar un VI con otros
VIs.--
En el panel frontal, encontraremos todo tipos de controles o indicadores, donde cada
uno de estos elementos tiene asignado en el diagrama de bloques una terminal, es
decir el usuario podrá diseñar un proyecto en el panel frontal con controles e
indicadores, donde estos elementos serán las entradas y salidas que interactuaran
con la terminal del VI. Podemos observar en el diagrama de bloques, todos los
valores de los controles e indicadores, como van fluyendo entre ellos cuando se
está ejecutando un programa VI.
29
La Figura 1 muestra un Diagrama de Bloques de un programa en el que se genera
un array de 100 elementos aleatorios, a continuación se hace la FFT de este array
y se muestra en una gráfica:
30
Este programa incluye lo que se le conoce como visión artificial lo cual es el
reconocimiento grafico de ciertos objetos, formas, colores, gestos, señas, entre
otras aplicaciones que se le pueden implicar a este tipo de programación.
La visión artificial o visión por ordenador es una disciplina científica que incluye
métodos para adquirir, procesar, analizar y comprender las imágenes del mundo
real con el fin de producir información numérica o simbólica para que puedan ser
tratados por un ordenador. Tal y como los humanos usamos nuestros ojos y
cerebros para comprender el mundo que nos rodea, la visión artificial trata de
producir el mismo efecto para que los ordenadores puedan percibir y comprender
una imagen o secuencia de imágenes y actuar según convenga en una
determinada situación. Esta comprensión se consigue gracias a distintos campos
como la geometría, la estadística, la física y otras disciplinas. La adquisición de los
datos se consigue por varios medios como secuencias de imágenes, vistas desde
varias cámaras de video o datos multidimensionales desde un escáner médico.
Hay muchas tecnologías que utilizan la visión por ordenador, entre las cuales se
encuentran el reconocimiento de objetos, la detección de sucesos, la
reconstrucción de una escena (mapping) y la restauración de imágenes.
La detección de objetos es la parte de la visión artificial que estudia cómo detectar
la presencia de objetos en una imagen sobre la base de su apariencia visual, bien
sea atendiendo al tipo de objeto (una persona, un coche) o a la instancia del
objeto (mi coche, el coche del vecino). Generalmente se pueden distinguir dos
31
partes en el proceso de detección: la extracción de características del contenido
de una imagen y la búsqueda de objetos basada en dichas características.
La extracción de características consiste en la obtención de modelos matemáticos
compactos que "resuman" el contenido de la imagen con el fin de simplificar el
proceso de aprendizaje de los objetos a reconocer. Dichas características son
comúnmente llamadas descriptores.
Existen diversos tipos de descriptores, que tendrán mejor o peor rendimiento en
función al tipo de objeto a reconocer y a las condiciones del proceso de
reconocimiento (la luz controlada o no, distancia al objeto a reconocer conocida o
no). Se pueden usar desde básicos histogramas de color o intensidad de luz,
descriptores LBP (Local Binary Pattern, usado sobre todo para texturas) o más
avanzados como el HOG (Histogram of Oriented Gradientes) o SIFT.
Para el proceso de clasificación se pueden usar diferentes técnicas de aprendizaje
máquina. Existen diferentes métodos, como la regresión logística, o más
avanzados basados en técnicas de aprendizaje automático como el SVM o
AdaBoost (Adaptative Boost).
Los mayores retos tanto de la extracción de características como la clasificación
es encontrar descriptores y clasificadores que sean invariantes a los cambios que
pueda tener un objeto, como su posición o iluminación.
La visión 3D artificial se encarga de proporcionar la capacidad de emular la visión
humana a un ordenador. Con dicha capacidad el ordenador podrá generar un
modelo tridimensional de un objeto o escena, generalmente a partir de una imagen
en 2D. Existen técnicas o sistemas que permiten captar la profundidad de los
objetos o en una escena, como por ejemplo: sistemas estereoscópicos, mediante
múltiples cámaras, sistemas basados en el tiempo de vuelo o los sistemas
basados en el escáner de luz estructurada.
Las aplicaciones son numerosas, en el campo de la automoción, por
ejemplo, Google self-Driving car utiliza la detección de objetos, junto con radares y
sensores para conducir por la vía pública de una forma autónoma.
La reconstrucción en 3D a partir de imagen 2D
A partir de una imagen 2D obtener una reconstrucción en 3D plantea una serie de
problemas ya que existen muchos objetos con formas similares o estos mismos
objetos pueden aparecer en la imagen de forma diferente. Hay que limitar el
proceso de reconstrucción asumiendo la similitud de las formas entre los objetos.
Para comparar la imagen de consulta se deben crear una serie de modelos 3D
para cada clase. Se usan estos modelos para generar una base de datos de
objetos de la clase con sus respectivos mapas de profundidad, a esto lo
llamaremos un aprendizaje supervisado porque se conocerán todos los objetos a
32
tratar. Esto nos dará ejemplos de mapas 3D factibles asociados a formas que se
utilizarán para estimar la imagen.
Un ejemplo de los bloques que debe contener un sistema de reconocimiento 3D a
partir de una imagen 2D:
Adquisición de la imagen: En esta etapa se captura una proyección en dos
dimensiones de la luz reflejada por los objetos de la escena.
Segmentación: detección de bordes y regiones: Permite separar los diferentes
objetos de la escena.
Extracción de características: Se obtiene una representación numérica en forma
de vector por cada imagen.
Reconocimiento y localización: Mediante técnicas, como pueda ser la
triangulación, se localiza al objeto en el espacio 3D.
Artículo principal: Reconocimiento de patrones
Interpretación o estimación: A partir de la información obtenida se estima la
escena.
La reconstrucción en 3D a partir de múltiples imágenes 2D
El objetivo de la reconstrucción 3D con múltiples imágenes es averiguar la
geométrica de una escena capturada por una colección de imágenes. Por lo
general, la posición de la cámara y los parámetros internos se supone que se
conocen o se pueden estimar a partir del conjunto de imágenes. La automática
correspondencia de los objetos de la imagen suele ser ambigua e incompleta, se
recomienda tener un conocimiento previo sobre los objetos.
Técnicas de obtención de imágenes 3D
Multicámara: El objetivo de esta técnica es captar el objeto o la escena con varias
cámaras calibradas para obtener diferentes puntos de vista y así generar datos de
profundidad.
Cámaras estereoscópicas: Permiten emular la visión humana creando dos
imágenes como si fueran los ojos. Véase Cámaras estereoscópicas.
Escáner de luz estructurada: Mediante una proyección de un patrón de luz, el
dispositivo es capaz de capturar la forma y las características del objeto.
Véase Escáner de luz estructurada.
Time of Flight (TOF) : Mediante un sensor que emite una señal de infrarrojo, esta
señal incide sobre la escena o objeto y vuelve rebotada sobre la cámara. La
cámara genera una imagen en escala de grises que nos da la información de
profundidad. Véase Televisión 3D: TOF.
33
Conclusión
La visión artificial es sin duda alguna una herramienta enorme para la
automatización y la mejora de muchos procesos industriales, por lo que creemos
que es importante comenzar a aplicarla cada vez más y en diferentes contextos
para hacer más fácil nuestra vida, también es importante saber que como ingenieros
tenemos este tipo de herramientas que nos ayudan a destacar y a hacer mejor
nuestro trabajo.
También aprendimos a utilizar un software muy versátil e intuitivo como es
LabVIEW, sin el cual no hubiéramos podido realizar este proyecto. Este programa
te da la oportunidad de interactuar con una gran cantidad de herramientas para
hacer todo tipo de programas con un sinfín de aplicaciones distintas.
En conclusión, la visión artificial, al igual que otros tipos de I.A. como son las redes
neuronales, lógica difusa, etc., forman parte de un desarrollo tecnológico futurista
que hoy está al alcance de nuestras manos y depende de nosotros como ingenieros
desarrollar estas tecnologías para mejorar los distintos procesos de nuestro
entorno, así como optimizar y hacer más fácil la vida.
Bibliografía
“Visión artificial”, Sossa Azuela Juan Humberto. Editorial RA-MA, 2013.
“Android Things y visión artificial”, Antonio Albiol Jesús Tomás, Editorial
Marcombo 2018
“Robótica industrial Prototipo y sistemas de visión artificial”, Arévalo Pedro –
Herrera Santiago. Editorial Académica Española, 2012.
“LabVIEW 7.1 Programación gráfica para el control de instrumentación”,
Lázaro Antonio Manuel. Editorial Ediciones Paraninfo, 2015.
34