Está en la página 1de 3

Escuela Superior Politécnica del Chimborazo

Facultad de informática y electrónica


Escuela de Ingeniería en Electrónica Control y Redes Industriales

Visión Artificial
Integrantes: Alex Núñez, Daniel Cárdenas, Robinson Calero

Nivel: 10mo

Tool box de Matlab para procesamiento de imágenes y visión artificial

Introducción

Matlab es uno de los softwares para ingeniería más completos y usados a nivel mundial,
debido a su flexibilidad y aplicabilidad a todos los campos de la rama. La visión artificial y el
procesamiento de imágenes constituyen en estos días uno de los campos mas explorados y
prometedores para la solución de problemas con facilidad y confiabilidad, es por esto que
Matlab no ha dejado ajeno este campo, conteniendo dentro de extensos usos diferentes
toolbox dedicados para trabajar específicamente con el tratamiento de imágenes para
facilidad del uso de los usuarios. Además, Matlab ha extendido su capacidad desarrollando
software compatible con tarjetas de video de avanzada para mejor y mas rápido
procesamiento y no conforme con esto Matlab ha desarrollado toolbox más potentes capaces
de entrenar algoritmos de detección con inteligencia artificial y aprendizaje profundo.

Figura 1. Dtección de objetos con matlab

Desarrollo

Procesamiento Clásico

 COMPUTER VISION TOOL BOX


Computer Vision System Toolbox™ proporciona algoritmos, funciones y apps para el
diseño y la realización de pruebas de sistemas de procesamiento de vídeo, visión
artificial y visión 3D. Es posible llevar a cabo la detección y el seguimiento de objetos,
así como la detección, extracción y coincidencia de características. En el caso de la
visión 3D, la toolbox soporta la calibración de cámaras simples, estéreo y ojo de pez, la
visión en estéreo, la reconstrucción 3D y el procesamiento de nubes de puntos lidar y
3D. Las apps de visión artificial automatizan los flujos de trabajo de etiquetado de
validación (ground-truth) y de calibración de cámaras.
Existe la posibilidad de entrenar detectores de objetos personalizados mediante
algoritmos de deep learning y machine learning como YOLO v2, Faster R-CNN y ACF.
Para la segmentación semántica, se pueden usar algoritmos de deep learning como
SegNet, U-Net y DeepLab. Los modelos previamente entrenados permiten detectar
caras, peatones y otros objetos comunes.

Puede acelerar los algoritmos mediante su ejecución en procesadores multinúcleo y


GPUs. La mayoría de los algoritmos de esta toolbox soportan la generación de código
C/C++ para su integración con el código existente, el prototipado de escritorio y el
desarrollo de sistemas de visión embebidos.[1]

 IMAGE PROCESSING TOOL BOX

Proporciona un conjunto completo de algoritmos estándar de referencia y aplicaciones


de flujo de trabajo para el procesamiento de imágenes, el análisis, la visualización y el
desarrollo de algoritmos.Image Processing Toolbox™ Puede realizar la segmentación
de imágenes, la mejora de la imagen, la reducción de ruido, las transformaciones
geométricas y el registro de imágenes mediante el aprendizaje profundo y las técnicas
tradicionales de procesamiento de imágenes. La caja de herramientas admite el
procesamiento de imágenes 2D, 3D y arbitrariamente grandes.

las aplicaciones le permiten automatizar flujos de trabajo comunes de procesamiento


de imágenes.Image Processing Toolbox Puede segmentar datos de imagen de forma
interactiva, comparar técnicas de registro de imágenes y procesar por lotes conjuntos
de datos grandes. Las funciones y aplicaciones de visualización le permiten explorar
imágenes, volúmenes 3D y vídeos; ajustar el contraste; crear histogramas; y manipular
regiones de interés (ROI).

Puede acelerar sus algoritmos ejecutándolos en procesadores multinúcleo y GPU.


Muchas funciones de la caja de herramientas admiten la generación de código C/C++
para la creación de prototipos de escritorio y la implementación del sistema de visión
integrado.[2]

Procesamiento con Inteligencia Artificial

 DEEP LEARNING TOOLBOX


Deep Learning Toolbox™ proporciona un marco para diseñar e implementar redes
neuronales profundas con algoritmos, modelos previamente entrenados y apps. Puede
utilizar redes neuronales convolucionales (ConvNet y CNN) y redes de memoria de
corto-largo plazo (LSTM) para realizar la clasificación y la regresión en imágenes, series
temporales y datos de texto. Es posible crear arquitecturas de red como redes
generativas antagónicas (GAN) y redes siamesas mediante diferenciación automática,
bucles de entrenamiento personalizados y pesos compartidos. Con la app Deep
Network Designer, puede diseñar, analizar y entrenar redes gráficamente. La app
Experiment Manager ayuda a gestionar varios experimentos de deep learning, realizar
un seguimiento de los parámetros de entrenamiento, analizar resultados y comparar
código de diferentes experimentos. Puede visualizar las activaciones de capas y
supervisar gráficamente el progreso del entrenamiento.

Puede intercambiar modelos con TensorFlow™ y PyTorch a través del formato ONNX e
importar modelos de TensorFlow-Keras y Caffe. La toolbox soporta la transferencia de
aprendizaje con DarkNet-53, ResNet-50, NASNet, SqueezeNet y muchos otros modelos
previamente entrenados.

Puede acelerar el entrenamiento en una estación de trabajo con una o varias GPU (con
Parallel Computing Toolbox™) o ampliar el alcance a clusters y nubes, incluidas las
instancias de GPU de NVIDIA® GPU Cloud y Amazon EC2® (con MATLAB Parallel
Server™). [3]

Figura 2. Dtección de objetos con ResNET en matlab


REFERENCIAS

[1] “Computer Vision Toolbox - MATLAB & Simulink.” [Online]. Available:


https://es.mathworks.com/products/computer-vision.html. [Accessed: 12-May-2020].
[2] “Image Processing Toolbox Documentation - MathWorks España.” [Online]. Available:
https://es.mathworks.com/help/images/index.html. [Accessed: 12-May-2020].
[3] “Deep Learning Toolbox - MATLAB.” [Online]. Available:
https://es.mathworks.com/products/deep-learning.html. [Accessed: 12-May-2020].

También podría gustarte