Está en la página 1de 2

Hace algunos años, se creía que inventar un sistema computacional que distinguiera un objeto

de otro, sería casi imposible. Sin embargo, en la actualidad los sistemas de inteligencia
artificial lo realizan con una precisión mayor al 99%.

Se puede pensar en un detector de objetos como una combinación entre, un localizador de


objetos y un clasificador de objetos.

YOLOv3 (you only like once) es un algoritmo de visión artificial, enfocado a la detección de
objetos tiempo real. Este funciona gracias a la técnica de aprendizaje automático “Deep
Learning” en la que una inteligencia artificial se inspira en el cerebro humano. Es así, como
puede identificar objetos presentes en una imagen o video.

En anteriores algoritmos de detección de objetos, se utilizaba una ventana deslizante, para


buscar objetos en diferentes ubicaciones y escalas. Esto era una operación costosa, por lo que
se asumía que la relación de aspecto del objeto, era fija.

Los algoritmos de detección de objetos basados en R-CNN y Fast-RCNN, por ejemplo,


utilizaron un método llamado búsqueda selectiva, para reducir el número de cuadros
delimitadores que el algoritmo debía probar. También, existió otro enfoque llamado overfeat,
que consistía en escanear la imagen en diferentes escalas utilizando mecanismos deslizantes
tipo ventanas que se realizaron por convolución.

A esto se sumó un R-CNN más rápido, que utilizaba una red de propuesta de región (RPN)
que ayudaba a identificar los cuadros de delimitación que necesitaban ser probados.

Por otra parte, YOLOv3 aborda el problema de detección de objetos, de una manera
completamente diferente. Este, escanea la imagen una sola vez, a través de una red neuronal.
Existe otro algoritmo llamado SSD, que funciona de forma similar, pero YOLOv3 es más
rápido.

YOLOv3, divide la imagen actual en una cuadricula de celdas de 13 x 13. El tamaño de estas
169 celdas varía según el tamaño de la imagen de entrada. Para cuadro delimitador la red
predice la factibilidad de que el cuadro delimitador, encierre realmente un objeto y la
probabilidad de que el objeto encontrado sea de una clase particular previamente definida.
La mayoría de estos cuadros delimitadores se van eliminando unos a otros, esto, debido a que
encierran el mismo objeto que un cuadro delimitador diferente o que la confianza de uno de
ellos, es considerablemente mayor a la de otro. Esta técnica se llama supresión no máxima.

Para este proyecto, YOLOv3 proporcionará los resultados necesarios, concernientes a la


cantidad de interacciones y tiempo de estas mismas, desde un punto de vista individual y
grupal. El proceso a realizar consiste en que cada video referente a un grupo, se dividirá en
cuatro partes, cada parte corresponderá a la actuación completa de un individuo durante el
período total de cada actividad (sprint). El conteo de la cantidad y tiempo de interacción se
realizará de la siguiente forma:
1. Cuando entre la mano del individuo en el espacio de trabajo, comenzará un contador
de tiempo que se acumulará durante toda la actividad, a su vez, cada vez que la mano
salga del espacio de trabajo, el contador dejará de sumar tiempo. Esto, entregara el
tiempo total de interacción del individuo.

2. Por otra parte, cada vez que la mano del individuo entre en la zona de trabajo se
sumará una interacción, luego la mano debe salir del espacio, y recién cuando esta
vuelva a entrar, se considerará otra interacción.

También podría gustarte