Está en la página 1de 6

See

discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/26544157

Sistema de visin artificial para el registro de


densidad peatonal en tiempo real

Article January 2007


Source: DOAJ

CITATION READS

1 57

4 authors, including:

Bonie Restrepo Mauricio Abril


Instituto Tecnolgico Metropolitano Universidad Tecnolgica de Pereira
6 PUBLICATIONS 2 CITATIONS 1 PUBLICATION 1 CITATION

SEE PROFILE SEE PROFILE

All content following this page was uploaded by Bonie Restrepo on 15 October 2015.

The user has requested enhancement of the downloaded file. All in-text references underlined in blue are added to the original document
and are linked to publications on ResearchGate, letting you access and read them immediately.
Scientia et Technica Ao XIII, No 35, Agosto de 2007. Universidad Tecnolgica de Pereira. ISSN 0122-1701 79

SISTEMA DE VISIN ARTIFICIAL PARA EL REGISTRO DE DENSIDAD PEATONAL EN


TIEMPO REAL

Computer Vision System for Real-time Registry of Pedestrian Density

RESUMEN MAURICIO ABRIL CAAS


Ingeniero Electricista
En este trabajo se presenta el desarrollo, implementacin y comprobacin de un Universidad Tecnolgica de
sistema de visin artificial para la deteccin de transentes bajo un ambiente Pereira
controlado durante una ventana de tiempo determinada. El sistema presentado es abrilmauricio@hotmail.com
libre de parmetros y calibracin y utiliza una sola cmara para localizar y
seguir en tiempo real a los transentes en la zona de inters, determinar su MAURICIO VALENCIA L
direccin y mantener un registro discriminado. En el artculo se resumen las Ingeniero Electricista
tcnicas de procesamiento de imgenes utilizadas en el desarrollo, los Universidad Tecnolgica de
mecanismos de implementacin, las pruebas experimentales, las limitaciones del Pereira
sistema y se discuten los resultados obtenidos. zagat@utp.edu.co

PALABRAS CLAVES: Mquina de visin, procesamiento de imgenes, BONIE JOHANA RESTREPO


densidad peatonal, conteo de personas, seguimiento visual. Ingeniero Electricista
Profesor Catedrtico
ABSTRACT Universidad Tecnolgica de
Pereira
In this work, we describe development, implementation, and testing of a bonie@ohm.utp.edu.co
computer vision system for passer-by detection in a controlled environment
during a specified time window. Proposed system is parameter-free, calibration- GERMN ANDRS HOLGUN
free, and single-camera. System localizes and tracks in real-time a passer-by Ingeniero Electricista, M.Sc.
within the interest zone, determines his or her direction, and keeps a detailed Profesor Asistente
record. This paper also summarize image processing techniques used in this Universidad Tecnolgica de
process, implementation tools, experimental tests, systems constraints, and Pereira
discuss the obtained results. gahol@ohm.utp.edu.co

KEYWORDS: Computer vision, digital image processing, pedestrian density,


counting people, visual tracking.

1. INTRODUCCIN el tratamiento de oclusiones parciales, pero con un costo


computacional muy elevado como para ser viable en
El registro de objetos en movimiento es una herramienta tiempo real. Posteriormente, se presentaron algunos
importante para el diseo de aplicaciones de seguridad, trabajos, como el de Rossi y Bezzoli [3] donde se
control de acceso restringido, control de multitudes en restringe el problema a una sola direccin en la escena y
espacios abiertos o cerrados, control de inventarios, para una posicin especfica de cmara, o como el trabajo
mercadeo en centros comerciales y urbanos, entre otros. de Segen y Pingali [4], donde se utiliza anlisis de
Teniendo en cuenta que la presencia de cmaras de contornos y siluetas, lo que mejora la deteccin y el
seguridad en cualquier entorno urbano es un hecho [1], es seguimiento, pero a costa de la sensibilidad a las
natural pensar que en el mediano plazo, tengan que oclusiones. Algunas tcnicas multicmara han resultado
convertirse en parte de sistemas automticos que mejores, como en Cai y Aggarwal [5] o en Alboil,
permitan el procesamiento de video en tiempo real, con la Naranjo y Mora [6], pero an requieren una costosa
finalidad de mantener un conteo discriminado de las infraestructura y altos niveles de parametrizacin. Ms
personas que circulan en una zona de inters. tarde, Choi [7], simplifica la segmentacin y el
seguimiento en la secuencia de video mediante
La deteccin especfica de transentes es un problema de prediccin de movimiento, lo que permite una
visin artificial complejo, con muchas dependencias y implementacin de tiempo real.
restricciones. El solo hecho de segmentar personas en
movimiento es un reto para el que Shio y Sklansky [2] En este artculo se propone una metodologa que permita
presentaron una metodologa, empleando la correlacin realizar en tiempo real el registro discriminado de
entre frames en la secuencia de video, con cierto xito en transentes en un ambiente controlado, sin considerar el
Fecha de Recepcin: 31 Mayo de 2007
Fecha de Aceptacin: 19 Julio de 2007
80 Scientia et Technica Ao XIII, No 35, Agosto de 2007. Universidad Tecnolgica de Pereira.

problema de oclusiones, que apunte a minimizar el costo predeterminada y constante, por lo que requiere de alta
computacional y a maximizar la precisin del sistema. Se prioridad de ejecucin. Todo el procesamiento posterior
requiere adems que la aplicacin sea econmicamente de cada frame, deber ser realizado en la ventana de
viable, por lo que se restringir el estudio a la utilizacin tiempo entre muestras, dejada por este mdulo, lo que
de una sola cmara y a la arquitectura PC. Se desea que garantizar la operacin del sistema en tiempo real. La
la aplicacin tenga un funcionamiento autnomo, libre de salida de este mdulo es una imagen en formato RGB.
parmetros de ajuste, es decir el usuario no tenga que
manipular variables durante su ejecucin. La estructura Para fines experimentales, se desarrollaron dos mdulos
de este trabajo se describe a continuacin: inicialmente de adquisicin, uno para operar directamente de la
se muestra la metodologa planteada para el registro de cmara y otro para recibir imagen de videos pregrabados
densidad peatonal, luego se describe su implementacin en algn formato estndar.
para finalizar con conclusiones y recomendaciones para
trabajos futuros a partir de los resultados obtenidos. 2) Pre-procesamiento
Esta etapa realiza dos tareas. En primer lugar convierte la
imagen de entrada a escala de grises utilizando la norma
2. METODOLOGA euclidiana [8] con un factor de escala de . (1/3) que
asegura que el rango de valores de cada pxel en la
La metodologa propuesta est representada en el imagen de salida est limitado por el rango de los valores
diagrama de bloques de la figura 1. La funcin de cada de entrada. La ecuacin (1) ilustra este procedimiento
una de las etapas es detallada a continuacin.
1 2
INICIO
f ( x, y ) =
3
( R + G2 + B2 ) (1)

Donde R, G y B son los valores de los pxeles para cada


Adquirir uno de los planos de color rojo, verde y azul
frame (i)
respectivamente.
i=i+1

Conversin
RGB Gray
En segundo lugar, es necesario que esta etapa detecte el
movimiento de transentes en la zona inters. Para ello,
If
una sustraccin de fondo es suficiente, ya que permite
Actualizar
Sustraccin
fondo If(t) completar la tarea con muy bajo costo computacional y
de fondo
cierta robustez a los cambios de iluminacin. La
Ir
SI sustraccin consiste en obtener la diferencia, pxel a
NO Actualizar
pxel, entre el frame actual I (t ) y el fondo If (t )
Movimiento ?
fondo? NO escogido como referencia [8], y que debe haber sido
SI capturado previamente al menos una vez. La captura del
Segmentacin
fondo en este experimento se realiza solo a solicitud del
usuario. El resultado de la sustraccin, ver ecuacin (2),
es una nueva imagen donde los transentes estn
Filtrado representados por pxeles conectados con valores mucho
mayores que cero.
Almacenar
frame (i)
Reconocimiento
y Etiquetado
Ir (m, n) = i(m, n) If (m, n) (2)

frame (i)
3) Segmentacin.
Seguimiento
frame (i-1)
En esta etapa se busca separar a los transentes del
correspondencias fondo. Aqu, se emple una binarizacin de la imagen
y coordenadas por umbral que aprovecha bastante bien la caracterstica
Registrar
Objeto en
Peatn bimodal de la imagen [9]. Como el objetivo es obtener un
lmite ? SI
sistema libre de parmetros, dicho umbral k, tendr que
NO ser obtenido automticamente. Para ello k, se obtiene
mediante el agrupamiento (clustering) de los pxeles en
Figura 1. Diagrama de bloques. dos grandes grupos que cumpla con la siguiente
condicin:
1) Adquisicin
Esta es la etapa encargada de controlar el hardware. Debe
garantizar que cada frame sea adquirido a una velocidad
Scientia et Technica Ao XIII, No 35, Agosto de 2007. Universidad Tecnolgica de Pereira. 81

u1 + u2 estimada hacen parte de un conjunto convexo que puede


k= (3) ser representado por:
2
v(t + 1) = (1 a )v (t ) + av(t ) (6)
Donde u1 y u2 son las mximas frecuencias de nivel de
Donde a es un coeficiente de amortiguamiento que
gris comprendidas entre 0 y k ; y entre k + 1 y el valor depende de la altura de ubicacin de la cmara. La
mximo (255 para 8 bits). velocidad v y el desplazamiento d, tanto actual como
estimada, estn relacionadas mediante la tasa de muestreo
Para refinar el resultado de la segmentacin y eliminar dada en frames por segundo. El siguiente diagrama
pxeles aislados en la imagen, se utiliza una etapa de ilustra la prediccin de movimiento.
filtrado espacial no lineal, implementada mediante la
operacin morfolgica conocida como closing. El closing
consiste bsicamente en una dilatacin seguida de una x
operacin de erosin [10]. (t 1)
4) Seguimiento en la secuencia de imgenes
v(t )
En la imagen resultado de la etapa anterior, el fondo est
R
representado por pxeles de valor cero. Por tanto, toda
L(t )
rea de pxeles conectados con valor diferente de cero y
que est comprendida entre 4000 y 7000 pxeles.2 ser
(t )
considerada transente. Este rango fue determinado
nicamente en funcin de la altura de ubicacin de la v(t + 1)
cmara, y es esttico, por lo que no representa un
parmetro configurable. y R
L(t + 1)
A todo objeto reconocido como transente se le asigna
una etiqueta en el frame actual. Para cada transente, se ( t + 1)
calcula el momento de inercia [11], utilizando la
expresin: Figura 2. Diagrama del seguimiento mediante prediccin de
movimiento
m n
GKO = GK (i, j ) (4)
i =1 j =1 Donde representa las coordenadas del centroide y
v(t + 1) es el vector velocidad estimado. R es la distancia
Donde Gk ( i, j ) es el conjunto de valores umbralizados, en pxeles mnima necesaria para identificar a un mismo
transente en dos frames consecutivos, tal que (t ) y
m y n son el nmero de filas y columnas. Con el
momento de inercia es posible determinar las (t + 1) corresponden al mismo transente si y solo si
coordenadas de los centroides [11], utilizando: R> L.

1 m n Se considera que un transente debe ser contabilizado,


x (k ) =
GKO
x G
i =1 j =1
j K (i, j ) cuando ha atravesado el rea de conteo de arriba abajo o
viceversa.
(5)
1 m n
y (k ) =
GKO
y jGK (i, j )
i =1 j =1
3. IMPLEMENTACIN Y RESULTADOS

Para la implementacin del sistema se utiliz un PC con


Este clculo se realiza para cada transente en cada un procesador Intel Pentium IV de 2.8 GHz y 512 MB de
frame. Luego, la tarea de seguimiento consiste en RAM corriendo Windows XP de Microsoft. La
determinar la correspondencia de etiquetas a un mismo aplicacin se desarroll en LabVIEW 8.0 de National
transente en los frames i e i-1. Para esto, es vlido Instruments. La figura 3, muestra el panel frontal de la
suponer que la posicin estimada de transente en el aplicacin.
nuevo frame depende de la velocidad y direccin con que
se mueve, y sin prdida de generalidad se puede suponer La cmara utilizada fue una cmara web convencional,
que dicha posicin estimada es un valor viable dentro de Video BLASTER WEBCAM Plus de Creative, de 24 bits
la imagen [7]. Por lo tanto, las velocidades actual y con salida RGB de 320x240 y una frecuencia de
muestreo mxima de 30 fps. La cmara fue ubicada a 3.5
82 Scientia et Technica Ao XIII, No 35, Agosto de 2007. Universidad Tecnolgica de Pereira.

metros del piso en posicin acimutal, obteniendo un rea Abajo 40 0 2 42


de conteo de 9 m2.
Tabla 1. Matriz de confusin para 15 fps.

Estos resultados, fueron obtenidos para una altura de


cmara de 3.5 metros, por lo que los valores de a y R
fueron 0.3 y 60 respectivamente. El nmero mximo de
peatones en el rea de conteo es 4.

4. CONCLUSIONES

Este artculo presenta la metodologa utilizada en el


diseo, implementacin y prueba de un sistema de visin
artificial concebido para el conteo de transentes en una
regin de inters determinada sin tener en cuenta
Figura 3. Panel Frontal de la aplicacin oclusiones ni traslapes.
La posicin y disposicin de cmaras y las caractersticas El sistema propuesto es libre de parmetros en tiempo de
del rea de conteo varan segn la aplicacin, esto lleva a ejecucin. Es decir, el usuario no requiere estimar ni
que no exista una base de datos estndar diseada para la calcular ningn parmetro de funcionamiento una vez se
comprobacin de sistemas de visin artificial para el ha completado la instalacin del sistema.
conteo de personas; por tanto se cre una propia. Esta
base de datos est conformada por 50 videos etiquetados Se concluye que 15 fps es una velocidad de muestreo
segn el nmero de transentes presentes en la escena, ptima para el sistema, ya que los resultados obtenidos
segn la direccin de cruce del rea de conteo y algunos con velocidades mayores son estadsticamente
casos especiales, tales como: oclusiones leves, oclusiones equivalentes con mayores costos computacionales y con
severas, peatones detenidos, cambios de iluminacin, velocidades de muestreo menores se presentan prdidas
entre otros. de informacin.
En el momento de cuantificar el rendimiento y El seguimiento de los objetivos reconocidos en la
confiabilidad del sistema se opt por utilizar una matriz secuencia de vdeo (Tracking), por medio de la
de confusin donde se definen las siguientes salidas del prediccin de movimiento de sus centroides es til dado
sistema. que, los transentes no presentan un patrn igual entre
frame y frame, que permita reconocerlo y asociarlo en
FP: Falso Positivo. Grupo de pxeles conectados que cada una de las imgenes el mismo objeto a una etiqueta.
son detectados como movimiento, pero que no
corresponden a ningn transente. La metodologa fue probada en recintos cerrados donde
FN: Falso Negativo. Grupo de pxeles conectados el fondo es esttico y su mayor limitacin en su
que son detectados como movimiento, pero no son utilizacin prctica radica en la identificacin de
identificados por el sistema como transentes. transentes ante oclusiones severas. Este es un problema
VP: Verdadero Positivo. Grupo de pxeles de investigacin que sigue abierto como continuacin de
conectados que son detectados como movimiento, este trabajo; para darle solucin se debe pensar en una
que son identificados como transentes por el metodologa de solucin que involucre tcnicas ms
sistema. robustas pero computacionalmente ms costosas, tanto en
VN: Verdadero Negativo. Grupo de pxeles no la sustraccin del fondo, utilizando un modelamiento
conectados, que no son detectados por el sistema dinmico; como en la segmentacin, con tcnicas que
como Transentes. involucren jerarqua en color visin estereo; y en la
etapa de seguimiento, con tcnicas basadas en colores o
Se realizaron las mismas pruebas para diferentes en modelos interframes.
velocidades de muestreo: 7.5, 15 y 30 fps. Para 7.5 fps no
fue posible garantizar la operacin en tiempo real con el
hardware utilizado. Para 15 y 30 fps se obtuvieron 5. BIBLIOGRAFA
resultados estadsticamente equivalentes, por lo que se
presentan los resultados de 15 fps.
[1] C. Sandoval. Seguimiento de objetos en secuencias
de vdeo. Dept. Comunicaciones. Univ. Politcnica
Direccin VP FP FN Real
de Valencia, 2003.
Arriba 39 1 0 39
Scientia et Technica Ao XIII, No 35, Agosto de 2007. Universidad Tecnolgica de Pereira. 83

[2] A. Shio and J. Sklansky, Segmentation of people in


motion, Proc. IEEE Workshop Visual Motion, pp.
325332, Oct. 1991.
[3] M. Rossi and A. Bozzoli, Tracking and counting
moving people, Proc.2nd IEEE Int. Conf. Image
Processing, pp. 212216, Nov. 1994.
[4] J. Segen and S. Pingali, A camera-based system for
tracking people in real time, in Proc. IEEE 13th Int.
Conf. Pattern Recognition, Los Alamitos, CA, pp.
6367 Aug. 1996.
[5] Q. Cai and J. K. Aggarwal, Tracking human motion
using multiple cameras, in Proc. IEEE 13th Int.
Conf. Pattern Recognition, Los Alamitos, CA, pp.
6872, Aug. 1996
[6] A. Albiol, V. Naranjo. I, Mora,. Real-Time Hight
Density People Counter using Morphological
Tools. IEEE Trans. Intelligent Transportation
Systems, vol. 2, pp. 201-218, Dic. 2001.
[7] J. Kim, K. Choi Real-Time vision-based people
counting system for the security door. Department
of Electronics Engineering, Korea University, 2002.
[8] N. Siebel, Design and implementation of people
tracking algorithms for visual suveirllance
aplications, Marzo 2003.
[9] National Instrument. NI vision concepts manual.
November 2005.
[10] G. Pajares, J. D. la Cruz, Visin por computador
Imgenes Digitales y Aplicaciones. Espaa: Rama,
2001.
[11] D. C. P. Albores, Seguimiento de objetos por medio
de visin activa, Ph.D. dissertation, Instituto
Nacional de Astrofsica, ptica y Electrnica, Mayo
2002.
[12] A. Bovik, Handbook of Image and Video
Processing. Austin, Texas: University of Texas,
2000.
[13] M. Petrou and P. Bosdogianni, Image Processing
The Fundamentals. England: John Whiley and Sons,
1999.
[14] G. A. Holgun, S. Prez, A. Orozco, Curso Bsico
LabVIEW 6i, Universidad Tecnolgica de Pereira,
Facultad de Ingeniera Elctrica, 2002.
[15] G. Betancourt, G. Holgun, A. Orozco, Libro
electrnico de Medidas, Universidad Tecnolgica de
Pereira, Facultad de Ingeniera Elctrica, 2005.

View publication stats

También podría gustarte