Está en la página 1de 120

UNIVERSIDAD NACIONAL

FACULTAD DE CIENCIAS EXACTAS Y NATURALES


ESCUELA DE MATEMÁTICA

ALGORITMO PARA LA DETECCIÓN Y SEGUIMIENTO DEL ÁCARO


VARROA DESTRUCTOR EN SECUENCIAS DIGITALES DE VIDEO
Proyecto de Graduación sometido a consideración del Tribunal Examinador de la Escuela
de Matemática como requisito parcial para optar al grado de Licenciatura en Enseñanza de
la Matemática.

Elaborado por

Juan Pablo Prendas Rojas


Melvin Enrique Ramírez Bogantes

2011

Campus “Omar Dengo”


Heredia, Costa Rica
I

Este proyecto de graduación fue APROBADO, con mención de honor Cum Laude por

el Tribunal Examinador de la Escuela de Matemática de la Universidad Nacional, como

requisito parcial para optar por el grado de Licenciatura en la Enseñanza de la Matemática.

Presidente del Tribunal

Representante Dirección Escuela de Matemática

Tutor

Asesor

Asesor

Graduando

Graduando
II
III
IV

DEDICATORIA

Melvin Ramírez Bogantes.

Primero que todo a Dios y la Virgencita de los Ángeles, por darme vida, salud, fortaleza,

capacidad y paz para poder culminar mis estudios de Licenciatura.

A mi Madre y Padre por apoyarme en todo momento, creer en mi y darme la oportuni-

dad de estudiar, a mis hermanos por el sacrificio que significa crecer lejos de mi, los llevo

siempre en mi mente y mi corazón.

A mi amada por entender la importancia de culminar con éxito esta etapa de mi vida,

por aquellos momentos que se tenía que sacrificar tiempo en familia para dedicarme a

la investigación. Gracias por darme un hermoso y saludable hijo, son mi inspiración y

motivación día a día, LOS AMO.

Al profesor Dr. Carlos Travieso, por el apoyo esfuerzo y dedicación incondicional que

ha tenido a lo largo de la investigación, sin sus aportes y sugerencias este trabajo no hubiera

sido posible. A mi tutor y por bendición de Dios puedo llamarlo mi amigo Dr. Oscar Salas,

por el apoyo y sugerencias, además de las horas que dedico durante todo el proceso.

Al profesor MSc. Victor Medina, es un honor haberlo tenido como lector de mi proyec-

to, gracias Don Victor.

Por último y no por ello menos importantes a mi querida Escuela de Matemática espero

poder servir con mis aportes durante mucho tiempo. Al profesor MSc Eddie Vargas gracias

por darme las condiciones necesarias al inicio de esta carrera, sin su ayuda es muy probable

que mi estadía en la UNA hubiera sido muy corto.


V

Juan Pablo Prendas Rojas.

A la persona que más admiro en el mundo, la que me mostró con amable ejemplo que

el trabajo duro y humilde son legados invaluables. Que no importa si la adversidad repliega

tus fuerzas, en el amor y el compromiso se encuentran vivas las que parecían agotadas. Juan

Bautista Prendas Madrigal, gracias padre por la lección de vida. También a mi familia: mis

hermanos y adorada madre Bellanira Rojas Alvarado. Y a los amores que recién puso Dios

en mi vida: Yariel y Yess.


VII

Índice general

Índice de cuadros IX

Índice de figuras X

1. INTRODUCCIÓN 1
1.1. Tema de Investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1. Colaboración entre Escuela de Matemática y el Centro de Investi-
gaciones Apícolas Tropicales (CINAT) . . . . . . . . . . . . . . . 2
1.1.2. Problema de investigación . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Justificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.2. Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4. Estado del Arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2. MARCO TEÓRICO 16
2.1. El Ácaro Varroa Destructor . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1.1. Características biológicas del ácaro. . . . . . . . . . . . . . . . . . 16
2.1.2. Varroosis e impacto en las poblaciones de abejas . . . . . . . . . . 18
2.1.3. Comportamientos particulares del ácaro . . . . . . . . . . . . . . . 21
2.2. Procesamiento Digital de Video . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1. Métodos de detección y seguimientos de objetos mediante técnicas
de procesamiento de video . . . . . . . . . . . . . . . . . . . . . . 27
2.2.2. Sistemas de detección de primer plano . . . . . . . . . . . . . . . . 29
2.2.3. Seguimientos de objetos . . . . . . . . . . . . . . . . . . . . . . . 46
2.2.4. El software MatLab . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.2.5. Tipos de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.2.6. Operaciones con Matrices . . . . . . . . . . . . . . . . . . . . . . 53
2.2.7. Operaciones Morfológicas . . . . . . . . . . . . . . . . . . . . . . 55
2.2.8. Otras funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
VIII

3. MARCO METODOLÓGICO 61
3.1. Tipo de Investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2. Captura de Video . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.3. Procesado de Imágenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3.1. Determinación de técnicas para la detección y seguimiento de objetos 63
3.3.2. Implementación del procesado de video en una muestra . . . . . . . 64
3.3.3. Evaluación del algoritmo . . . . . . . . . . . . . . . . . . . . . . . 64
3.3.4. Implementación de sistema inteligente . . . . . . . . . . . . . . . . 65

4. DISCUSIÓN Y ANÁLISIS 66
4.1. Obtención y Lectura de Video . . . . . . . . . . . . . . . . . . . . . . . . 66
4.2. Zona Activa de Movimiento . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.2.1. Descripción del escenario inicial . . . . . . . . . . . . . . . . . . . 68
4.2.2. Detección de la Z.A.M . . . . . . . . . . . . . . . . . . . . . . . . 70
4.3. Identificación del Ácaro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.4. Seguimiento del Ácaro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.5. Proceso de Validación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.6. Comentarios de Cierre . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

5. CONCLUSIONES Y SUGERENCIAS 94
5.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.2. Sugerencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
IX

Índice de cuadros

2.1. Familias de estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30


2.2. Estructuras de control en la programación de MatLab . . . . . . . . . . . . 54

4.1. Detalle de la muestra de videos seleccionada para la valoración de la efec-


tividad del algoritmo de detección. . . . . . . . . . . . . . . . . . . . . . . 88
4.2. Distribución de porcentajes de detección correcta por corte de control. . . . 91
X

Índice de figuras

2.1. Hembra adulta del Ácaro Varroa Destructor . . . . . . . . . . . . . . . . . 17


2.2. Comparación de la morfología de una abeja adulta sana y otra afectada por
varroosis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3. Representación de una imagen a escala de grises en MatLab. . . . . . . . . 24
2.4. Representación de una imagen a color RGB en MatLab. . . . . . . . . . . . 26
2.5. El parámetro t determina la componente asignada al frame en esa posición
en un vector de hipermatrices . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6. Ejemplo de dilatación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.7. Ejemplo de erosión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.8. Aplicación de la función imfill . . . . . . . . . . . . . . . . . . . . . . . . 58
2.9. Aplicación de la función bwlabel . . . . . . . . . . . . . . . . . . . . . . . 59
2.10. Aplicación de la función graythresh . . . . . . . . . . . . . . . . . . . . . 60

4.1. Descripción del escenario . . . . . . . . . . . . . . . . . . . . . . . . . . . 69


4.2. Primera detección de la Zona Activa de Movimiento . . . . . . . . . . . . 70
4.3. Detección de movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4. Zona de mayor movimiento en el corte 1 . . . . . . . . . . . . . . . . . . . 73
4.5. Relleno de la Z.A.M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.6. Operaciones Morfológicas sobre Z.A.M. (1) . . . . . . . . . . . . . . . . . 75
4.7. Operaciones Morfológicas sobre Z.A.M. (2) . . . . . . . . . . . . . . . . . 76
4.8. Eliminación de zonas no deseadas . . . . . . . . . . . . . . . . . . . . . . 76
4.9. Idea intuitiva de la transformación de puntos del contorno a coordenadas
polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.10. Detección de la Zona Activa de Movimiento . . . . . . . . . . . . . . . . 78
4.11. Identificación de ácaro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.12. Selección de frames para la identificación del ácaro . . . . . . . . . . . . . 79
4.13. Contorno del Ácaro V. Destructor . . . . . . . . . . . . . . . . . . . . . . 80
4.14. Cálculo de Área y Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.15. Efecto de la aplicación de la sustracción de fondo a partir de la matriz
histórica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
XI

4.16. Efecto de la aplicación de la sustracción de fondo por umbral . . . . . . . . 85


4.17. Detección de ácaro por medio de la combinación de eliminación de fondo
por matriz histórica y por umbral. . . . . . . . . . . . . . . . . . . . . . . 87
4.18. Ejemplos de detección incorrectas (DI) . . . . . . . . . . . . . . . . . . . . 90
4.19. Muestras de omisiones en la detección (ND) . . . . . . . . . . . . . . . . . 90
1

Capítulo 1

INTRODUCCIÓN

1.1. Tema de Investigación

A inicios del año 2009, la Universidad Nacional (UNA) estrechó lazos con la Univer-

sidad de Las Palmas de Gran Canaria (ULPGC). Lo anterior se logró con la formulación

de una propuesta cuya objetivo es complementar los conocimientos matemáticos genera-

dos por la Escuela de Matemática de la UNA con los avances en tratamiento de imáge-

nes logrados en ULPGC. Esta iniciativa contribuye a la proyección de importantes aportes

matemáticos para la resolución de problemas en áreas tales como la biología, topografía,

ingeniería, entre otras.

Con esta premisa se ha generado una dinámica de investigación en la unidad académica

de la Escuela de Matemática (UNA). Entre las actividades implementadas destacan la ac-

tualización del personal docente en temas de programación, uso de software especializados


1.1. TEMA DE INVESTIGACIÓN CAPÍTULO 1. INTRODUCCIÓN

y tratamiento de señales; además, la visita de expertos de la ULPGC y de la Universi-

dad de Costa Rica (UCR) para la identificación de problemas generadores de proyectos de

investigación en colaboración con entes nacionales e internacionales.

1.1.1. Colaboración entre Escuela de Matemática y el Centro de In-

vestigaciones Apícolas Tropicales (CINAT)

Como consecuencia del intercambio académico con investigadores de la ULPGC y

UCR y la búsqueda de problemas dentro de los centros de investigación de la UNA, se

detectó uno particularmente interesante. Esto dio origen al proyecto interinstitucional deno-

minado Detección, seguimiento y análisis del comportamiento del ácaro Varroa Destructor

mediante técnicas de procesado inteligente de video.

El CINAT entre sus principales ocupaciones se encarga del estudio de parásitos de las

abejas productoras de miel en el trópico. Algunos parásitos como el ácaro V. Destructor

son capaces de fulminar toda una colmena de abejas y en casos menos severos, disminuir

considerablemente la producción de miel y esto, por ende, implicaría importantes pérdidas

para los productores. Científicos del CINAT estudian aspectos biológicos y del comporta-

miento del ácaro con el fin de colaborar con el tratamiento y contención de las infestaciones

con ácaros de este tipo.

Para estos fines, los científicos del CINAT, introducen un ácaro en una celda artificial

transparente con una larva y filman durante varios días toda la actividad que se lleva a cabo

en dicha celda. El proceso de registro de comportamientos del ácaro se realiza de forma

2
CAPÍTULO 1. INTRODUCCIÓN 1.1. TEMA DE INVESTIGACIÓN

manual a partir de las secuencias de videos. El investigador debe observar y reportar los

estados, desplazamientos y acciones del ácaro; un proceso lento en demasía.

El sistema inteligente que se propone implementar en este proyecto, será capaz de re-

portar los comportamientos particulares del ácaro de forma automatizada. Con esto, los

científicos de CINAT sólo necesitarán hacer correr un algoritmo que lea el video y reporte

posición, tiempo, velocidad y reconozca acciones particulares como alimentación y defe-

cación del ácaro.

La Escuela de Matemáticas no sólo colaborará con el CINAT reduciendo el tiempo

de análisis de las secuencias de video y ofreciendo un sistema confiable de detección y

seguimiento del ácaro, sino que establecerá un precedente en la utilización de matemática

aplicada para la resolución de problemas concretos en áreas de la biología.

El proyecto que se menciona es de clara trascendencia, dada la importancia científica

y económica derivada del estudio de abejas melíferas, innovador y se constituye como un

pilar en el esfuerzo de crecimiento académico y tecnológico de la Escuela de Matemáti-

cas. Es, además, catalizador para la implementación de proyectos de similares alcances e

implicaciones en otras áreas como ingenierías o ciencias sociales.

1.1.2. Problema de investigación

El problema de esta investigación se ubica como etapa previa al proyecto mencionado

en la sección anterior. En colaboración con los investigadores del CINAT se propone crear

un sistema automático que permita la detección y seguimiento del ácaro V. Destructor pre-

3
1.2. JUSTIFICACIÓN CAPÍTULO 1. INTRODUCCIÓN

sente en la celda de una larva de abeja melífera, en un ambiente controlado a través del

análisis de una secuencia de video registrado durante todo el proceso.

Es importante aclarar que en esta propuesta, no se propone hacer registros de movimien-

tos y descripción de particularidades. Más bien se constituye como el punto de partida para

el logro de estos otros fines. La investigación culmina con la implementación y evaluación

de la eficiencia del algoritmo en secuencias de video facilitadas por el CINAT.

1.2. Justificación

El desarrollo científico y el crecimiento exponencial en cuanto al poder del cálculo por

parte de los ordenadores, han contribuido al desarrollo de la matemática aplicada. Esto

propicia la oportunidad de explorar fronteras antes impensables, enriqueciendo y expan-

diendo los usos de aplicaciones matemáticas. De este modo se ha convertido en un área

de la matemática sumamente agradable, pero sobre todo presente en numerosas disciplinas

del saber.

La visión artificial es, quizás, una de las áreas donde la matemática aplicada ha teni-

do logros significativos. Bajo esta perspectiva, su principal objetivo es extraer de forma

automatizada información digitalizada del mundo físico. Esto trae consigo destacadas y

numerosas aplicaciones en un número siempre mayor de contextos, como por ejemplo la

seguridad (González, 2009).

Sin embargo, hay muchos sectores que emplean esta tecnología para otros fines. Por

4
CAPÍTULO 1. INTRODUCCIÓN 1.2. JUSTIFICACIÓN

ejemplo, algunas empresas y comercios cuentan con sistemas que capturan y analizan imá-

genes que les permiten tener un registro de la hora de entrada y salida de sus trabajadores.

Otros sistemas utilizan imágenes capturadas en videos para realizar controles de calidad

automatizados, control de tránsito, entre otras aplicaciones.

En varias investigaciones ( Bayonas, 2009; Mateu, 2009; Realpe, Vintimilla, Romero,

& Remagnino, 2009), entre otros, se evidencia que con el paso del tiempo las aplicaciones

han evolucionado desde sistemas de detección simple hasta complejos sistemas de identi-

ficación, seguimiento y registro. Esto muestra que la visión artificial involucra disciplinas

como la medicina, interacciones con video juegos y el control del tránsito. Por tanto, son

variados los fenómenos estudiados mediante observación de imágenes o bien el análisis de

videos. Uno de estos fenómenos es estudiado en el CINAT. Donde, mediante la observa-

ción de un video se documenta el comportamiento del ácaro ectoparásito Varroa Destructor,

presente en las celdas de abejas obreras africanizadas (Calderón, 2009).

El V. Destructor es considerado como una de las mayores amenazas en la apicultura

debido a que se encuentra distribuido mundialmente. Sus efectos, afectan tanto a las abejas

adultas como a sus crías, y en algunas ocasiones causan la muerte. Schmidt, Carrillo &

Neira, (2005).

Las abejas melíferas africanizadas (Apis mellifera) son las abejas productoras de miel

del trópico americano, particularmente en Costa Rica, son las pioneras en el desarrollo de

la apicutura. Estas abejas son muy importantes para la producción de miel, propóleos y

otros productos de la colmena. Los cuales inciden positivamente en la economía rural, la

5
1.2. JUSTIFICACIÓN CAPÍTULO 1. INTRODUCCIÓN

dieta y la salud de las personas en varios países de la región (Calderón, 2009).

Tanto las abejas utilizadas para el desarrollo de la apiculturas, como la gran población

de abejas africanizadas silvestres propias de ecosistemas tropicales, son vitales para la po-

linización y reproducción de los bosques y otras formaciones vegetales en nuestro entorno.

Sin duda, este es el principal valor e impacto asociado a estos insectos (Calderón, 2009).

Calderón (2009) enfatiza en que en la actualidad, a nivel mundial, hay una gran preocu-

pación por la pérdida masiva de las abejas que obedece a varias hipótesis que aún se están

tratando de demostrar y que tienen que ver con aspectos sanitarios (plagas y enfermeda-

des), contaminación (plaguicidas) y ambientales (cambio climático y uso de la tierra), entre

otras.

Esta alerta se ha dado principalmente en Europa y Norteamérica, donde los impactos

de la pérdida masiva de abejas son muy preocupantes. Sin embargo, para la región tropical

no se han dado reportes determinantes en ese sentido (Calderón, 2009).

Se ha descrito la importancia biológica y económica que tienen las abejas y el impacto

nocivo del ácaro V. Destructor en sus poblaciones, por esta razón el CINAT cuenta con

laboratorios especializados donde se investigan alternativas para dar solución a esta proble-

mática.

Para el estudio de su comportamiento, el ácaro es insertado intencionalmente en la

celda de abejas obreras, donde se graban mediante una cámara de vídeo la interacción que

se da entre la pupa y el ácaro. Posterior a la grabación, un especialista en el estudio del

ácaro dedica una gran cantidad de horas al análisis de los videos, de los cuales se obtiene

6
CAPÍTULO 1. INTRODUCCIÓN 1.2. JUSTIFICACIÓN

información relevante para definir nuevos métodos de control de la infestación.

En el año 2010, en conjunto con otros investigadores, se presentó a la Escuela de Ma-

temáticas (UNA), un proyecto con el objetivo crear un algoritmo, que permita describir y

registrar automáticamente los comportamientos considerados de interés por el especialista

entre el ácaro y la pupa de la abeja.

Para lograr la creación del sistema inteligente se debe cumplir una serie de fases, una

de estas consiste en la creación de un algoritmo que permita detectar y seguir el ácaro V.

Destructor en secuencias de vídeos digitales.

En relación con lo anterior, este proyecto de graduación es considerado una fase pre-

via y de suma importancia en aras de lograr la implementación satisfactoria del sistema

inteligente propuesto en el proyecto de investigación aprobado e inscrito en la Escuela de

Matemáticas (UNA).

Para el CINAT, la creación de un sistema automático, basado en la inteligencia artificial,

sería una herramienta fundamental para optimizar el tiempo y los recursos empleados para

obtener los registros del comportamiento del ácaro en mención. De esta manera, sería más

ágil formular criterios adecuados para interpretar dicha información y desarrollar nuevas

formas para combatir el parásito V. Destructor.

Teniendo en cuenta lo expuesto anteriormente, se considera que el uso del sistema ayu-

dará a determinar aspectos no conocidos de la biología reproductiva de la principal plaga de

las abejas africanizadas y europeas, contribuyendo a recuperar la calidad en la producción

de las abejas melíferas.

7
1.3. OBJETIVOS CAPÍTULO 1. INTRODUCCIÓN

Por otra parte, este tipo de estudios ilustran la utilización de herramientas matemáticas e

incentiva la implementación de algoritmos en la resolución de problemas concretos en otras

disciplinas científicas. Este tipo de experiencias enriquecen la formación académica de los

futuros docentes e influirá las estrategias metodológicas que implementen en su ejercicio

profesional.

1.3. Objetivos

1.3.1. Objetivo General

Generar un algoritmo que permita detectar y dar seguimiento al movimiento del ácaro

Varroa Destructor en celdas de abejas melíferas a partir del método de sustracción dinámica

de fondos en videos digitales.

1.3.2. Objetivos Específicos

1. Generar un algoritmo que permita identificar el ácaro Varroa Destructor en una se-

cuencia de video digital.

2. Generar un algoritmo que permita el seguimiento del movimiento del ácaro Varroa

Destructor en una secuencia de video digital.

3. Generar mecanismos que permitan evaluar la eficiencia del algoritmo de detección y

seguimiento del Ácaro V. Destructor en una secuencia de video digital.

8
CAPÍTULO 1. INTRODUCCIÓN 1.4. ESTADO DEL ARTE

4. Colaborar con el Centro de Investigaciones Apícolas Tropicales (CINAT) en el estu-

dio del comportamiento del ácaro Varroa Destructor.

5. Mostrar la aplicabilidad de algunos conceptos matemáticos en la solución de pro-

blemas concretos como la detección y seguimiento de movimiento del ácaro Varroa

Destructor.

1.4. Estado del Arte

En la actualidad el análisis automático de secuencias de videos se ha convertido en un

área de investigación muy activa en distintas aristas científicas, ver (Bayona,2009 ; Faytong

& Moggia, 2008; Gómez, 2009; Mateu,2009).

Sus campos de acción, desarrollo y proyección abarcan desde situaciones simples y co-

tidianas hasta sistemas de alta complejidad. En los primeros pueden ubicarse el conteo de

formas determinadas presentes en una fotografía o detectar objetos extraviados en termi-

nales, y en los sistemas complejos aquellos que realizan reconocimiento facial o dactilar y

diagnósticos o procedimientos médicos a partir de imágenes.

Con esta referencia es latente la importancia que subyace en el tratamiento de videos,

sin embargo esta tarea sería lenta e infructuosa sin un robusto sistema. Carmona, Martinez

- Cantos & Mira,(2006), argumentan, además, que los sistemas inteligentes proporcionan

herramientas de análisis automáticos que facilitan el estudio de diversos fenómenos. Estos

sistemas tradicionalmente se han fundamentado en la visión artificial, cuya finalidad es la

9
1.4. ESTADO DEL ARTE CAPÍTULO 1. INTRODUCCIÓN

extracción automática de información del mundo físico a partir de imágenes y videos (ver

Bayona, 2009).

De la exitosa combinación de tecnología digital, captura de imágenes y video y el desa-

rrollo de algoritmos computacionales robustos, que aprovechan el constante aumento en la

capacidad de cálculo de las computadoras, se ha iniciado el camino para el tratamiento di-

gital de información a partir de sistemas automáticos. Es decir, por un lado las tecnologías

digitales evolucionan para capturar de manera más fiel información en formatos de imáge-

nes y, de la mano, han surgido investigaciones novedosas sobre algoritmos que agilizan la

toma, tratamiento y registro de datos obtenidos de la imagen o el video.

Actualmente se cuenta con una amplia gama de investigaciones sobre el tratamiento de

señales (fotografías, video, sonido). Existen referencias sobre sistemas que permiten detec-

tar objetos perdidos, identificar personas, diagnosticar algunos padecimientos a partir de

sonidos emitidos por la garganta, conteo de objetos (por ejemplo, vehículos que utilizan

una determinada red vial), sistemas de clasificación mediante fotografías, entre otras muy

variadas aplicaciones. A continuación se presentan las principales conclusiones de investi-

gaciones que se consideran tienen propósito, metodología y alcance similares a la propuesta

en este documento.

En lo referente a video-seguridad (Cabello, Conde & Rodríguez, 2009) realizaron in-

vestigaciones con la finalidad de evaluar nuevas tecnologías aplicadas a la seguridad en

aeropuertos. Por un lado, diseñaron un sistema de reconocimiento facial basado en imá-

genes de videos y como complemento, trabajaron en la detección automática de objetos

10
CAPÍTULO 1. INTRODUCCIÓN 1.4. ESTADO DEL ARTE

abandonados utilizando la red de cámaras de vigilancia presente en un aeropuerto.

Los resultados obtenidos en ambas investigaciones son alentadores comparados con los

sistemas comerciales. Se destaca la estabilidad y respuesta a situaciones diversas y se acla-

ra que las condiciones podrían ser más favorables si se hubiese dispuesto de mayor y mejor

equipo para complementar el sistema de vigilancia del aeropuerto. A pesar de las limita-

ciones de posición y orientación de cámaras, los sistemas propuestos generaron resultados

muy buenos, sobre todo cuando la grabación fue de buena resolución, esto depende entre

otras variables de los niveles de luz presentes en la escena y de la proximidad o lejanía de

los objetos capturados.

En esa misma línea González (2009) propone un sistema de vigilancia para la detección

de intrusos en un ambiente determinado y el cual se desea controlar a partir del análisis de

imágenes. Es importante señalar que el autor es enfático en dictar que los sistemas inte-

ligentes de seguridad han tenido mucho auge en los últimos años pero que suelen estar

supervisados por las empresas de seguridad que los ofrecen y esto provoca un encareci-

miento en el precio del servicio.

González (2009) menciona que los algoritmos desarrollados hasta el momento aún pre-

sentan algunos aspectos que se deben mejorar. Destaca problemas típicos como el ruido

en las imágenes, las variantes espontáneas en el entorno, como sombras o cambios de ilu-

minación y los movimientos naturales por la acción del viento, entre otros. El principal

objetivo de González (2009) se enfocó en ofrecer un sistema de tratamiento de imágenes

al alcance de cualquier usuario, un sistema fiable capaz de detectar potenciales amenazas

11
1.4. ESTADO DEL ARTE CAPÍTULO 1. INTRODUCCIÓN

para aquello que se desea proteger en el que se minimiza el número de errores presentado

por los sistemas tradicionales comerciales.

Las principales características y alcances del proyecto planteado en González (2009) se

resumen en la implementación de algoritmos para la segmentación de la imagen en fondo

y primer plano que permiten detecciones con gran fiabilidad, disminución considerable del

efecto falaz de sombras y cambios de iluminación y seguimiento basado en el solapamiento

de los objetos en dos instantes sucesivos. Como conclusión puede mencionarse que el pro-

yecto no sólo obtuvo los objetivos propuestos, sino que también impulsó otros resultados

complementarios que pueden ser utilizados en otros proyecto.

La localización de objetos en movimiento es una tarea de interés no sólo en el campo

de la seguridad, sino en todas aquellas áreas en las que se requieran y en donde se pueda

aplicar los conocimientos actuales del campo de la visión artificial. Por ejemplo, Vázquez

et al. (2009) con fines didácticos realizaron un estudio sobre la fusión de dos algoritmos

de detección de movimiento. La idea utilizada se basa en la aplicación de uno que utiliza

el método del Análisis de Componentes Principales y otro basado en un test de relación de

probabilidades de orden reducido. El análisis de los algoritmos muestra que la segmenta-

ción y la umbralización es menos afectada por el ruido, cuando estos actúan fusionados.

En otra investigación, Rodríguez (2003) hace uso de los filtros de Kalman para la de-

tección y el seguimiento de objetos en una secuencias de imágenes. Este método se utiliza

en situaciones donde un proceso continuo es muestreado en intervalos de tiempo. Los prin-

cipales resultados conseguidos han sido la aplicación del filtro a secuencias de imágenes

12
CAPÍTULO 1. INTRODUCCIÓN 1.4. ESTADO DEL ARTE

con más de un objeto y el control del seguimiento bajo situaciones de obstrucción. También

se logra implementar una aplicación de estos filtros al seguimiento de objetos presentes en

una secuencia de imágenes en tiempo real.

Algunos autores han hecho clasificaciones de estos métodos según la naturaleza del al-

goritmo que los fundamenta. Uno de los métodos más populares es denominado método

de background (método de fondos), sin embargo, una vez más, la eliminación del ruido

presente en los videos es su principal problema. Una posible corrección a la presencia de

ruido en las imágenes es la aplicación de una secuencia fija de operadores morfológicos

pero que, al tener que decidir a priori los parámetros morfológicos, no siempre está garan-

tizado el éxito de la restauración del foreground (primer plano) (Carmona, Martínez-Canto

& Mira, 2006).

Carmona et al. (2006) proponen una nueva aproximación basada en el método de subs-

tracción de background, la idea consiste en hacer evolucionar una población de secuencias

de operadores morfológicos mediante un algoritmo genético, con el objetivo de encontrar

la menor secuencia que permita eliminar el ruido para restaurar el foreground.

Desde un punto de vista más teórico, Mateu (2009) crea un proyecto cuyo propósito

es presentar algunas de las técnicas que se utilizan para detectar objetos de primer plano

en una secuencia video. En este estudio se realizó un análisis comparativo entre las diver-

sas técnicas de uso popular, tomando como consideración las ventajas y desventajas que

presentan cada una de ellas.

Los métodos de detección de objetos en primer plano, referidos por Mateu (2009), se

13
1.4. ESTADO DEL ARTE CAPÍTULO 1. INTRODUCCIÓN

dividen en dos grupos: modelado de fondo a nivel de píxel y modelado global de fondos.

En el primero se encuentran los métodos de detección de primer plano clásicos tales como

Running Gaussian Avarage, Stauffer y Grimson (también conocido como Múltiples Gaus-

sianas), Histogramas y Kernel Desity Estimation (KDE) y al segundo grupo pertenecen los

métodos de detección de primer plano con regularidad espacial como Inclusión de Infor-

mación Espacial en el modelo KDE y Estimación Bayesiana mediante dos o más modelos.

Se incluyen en el tratamiento teórico los sistemas de post-procesado de videos para co-

rrección de sombras, entre los estudiados por Mateu (2009) están: Método de luminancia

normalizada, método de híbrido y el método de reflectancia.

Mateu (2009) señala que dentro de los métodos clásicos se comprobó que el uso del

estimador de primer plano basado en KDE permite obtener resultados semejantes a los que

se obtienen con Stauffer y Grimson, por lo concluye que es un buen detector de objetos

de primer plano. En lo referente a los métodos con regularidad espacial, se implementaron

dos detectores de primer plano basados en KDE, estos permitieron corregir algunas falsas

detecciones que se obtienen cuando se trabajan con KDE o bien con Stauffer & Grimson.

Con respecto a los métodos de corrección de sombras, Mateu (2009) determinó que el

método que generó mejores resultados es el método híbrido, el cual es capaz de corregir

una gran cantidad de falsas detecciones asociadas a las sombreas (de forma parcial) sin

afectar aquellas detecciones correctas obtenidas mediante el algoritmo.

Como se ha podido constatar un buen número de investigadores hacen esfuerzos por

avanzar en la novedosa y prometedora área de tratamiento de imágenes. Se evidencia que

14
CAPÍTULO 1. INTRODUCCIÓN 1.4. ESTADO DEL ARTE

la detección de objetos en movimiento mediante secuencias de video es un componente

relevante en la extracción de información del mundo real.

Es importante acotar que los avances más significativos y novedosos han surgido en

países europeos. En Costa Rica se tiene referencia de algunas iniciativas en la Universidad

de Costa Rica pero aún en génesis. Las posibilidades en biología y específicamente la

problemática abordada por el proyecto, son de gran trascendencia e innovadoras.

15
16

Capítulo 2

MARCO TEÓRICO

Para la adecuada comprensión de las variantes teóricas que sustentan esta investiga-

ción se presenta una ubicación descriptiva de las características biológicas del ácaro V.

Destructor y las consecuencias que acarrea la infestación con éste. Se introducen las no-

ciones elementales del tratamiento de imágenes, se describen algunos métodos comunes de

detección y seguimiento de objetos y se presentan las características básicas del software

MatLab, haciendo énfasis en los comandos utilizados en el desarrollo de este proyecto.

2.1. El Ácaro Varroa Destructor

2.1.1. Características biológicas del ácaro.

Desde una posición taxonómica el artrópodo responsable de la varoosis ha sufrido al-

gunas modificaciones. Según Llorente (1990), se clasifica dentro del tipo Artropoda, clase
CAPÍTULO 2. MARCO TEÓRICO 2.1. EL ÁCARO VARROA DESTRUCTOR

Arachnida, orden Parasitiformes, suborden Gamasida, superfamilia Dermanyssoidea y fa-

milia Varroidae y es parásito específico de la abeja de la miel.

El ácaro Varroa Destructor es originario de Ásia. Sin embargo, en la actualidad se ha

propagado ampliamente por todo el mundo en colmenas de abejas melíferas. En nuestro

país, se tiene reporte de su aparición en setiembre de 1997, hallazgo realizado en el Centro

de Investigaciones Apícolas Tropicales (CINAT) (Calderón & Zamora, 2004).

Este tipo de ácaro tiene diferencias morfológicas importantes según el sexo del indi-

viduo. Las hembras adultas tienen un color rojizo oscuro, poseen un caparazón plano en

forma ovalada con dimensiones cercanas a 1mm × 2mm, por lo que pueden observarse a

simple vista. El macho es de mucho menor tamaño y se ha estudiado poco sobre él pues se

cree que muere en el momento que la abeja joven abandona su celda y se ha determinado

que sólo nace uno por periodo de reproducción.

Figura 2.1: Hembra adulta del Ácaro Varroa Destructor

Es característico de los ácaros no poseer antenas ni mandíbulas y moverse utilizando

cuatro pares de patas. En las hembras adultas del ácaro, según Llorente (1990), puede

observarse claramente el aparato bucal, el aparato respiratorio, el aparato excretor y el

17
2.1. EL ÁCARO VARROA DESTRUCTOR CAPÍTULO 2. MARCO TEÓRICO

aparato reproductor en la cara ventral de su caparazón. Para una descripción más detallada

de la morfología del ácaro V. Destructor y una amplia referencia sobre la funcionalidad

y complejidad de sus aparatos digestivo, respiratorio, excretor y reproductor se sugiere

consultar (Colin, García & Hamida, 1999; Llorente, 1990) respectivamente.

2.1.2. Varroosis e impacto en las poblaciones de abejas

Calderón & Zamora (2004) definen la varroosis como una parasitosis externa causada

por el ácaro V. Destructor y coinciden con otros autores (Colin et al., 1999, Oraganiza-

ción Mundial de Sanidad Animal (OIE), 2004 y Llorente, 1990) sobre la gravedad de esta

enfermedad en las abejas en todas sus fases de desarrollo.

El ácaro V. Destructor se inserta en las placas abdominales (en ocasiones también in-

fecta el tórax y la cabeza) de la abeja adulta para succionar su hemolinfa, sin embargo se

considera un parásito de la cría primordialmente (Calderón & Zamora, 2004).

Los expertos ubican el ácaro como parásito de la cría, pues la hembra adulta el áca-

ro abandona la abeja para iniciar un ciclo de reproducción justamente con la invasión de

la celda donde se encuentra una cría (prefieren las crías de los zánganos pero en ocasio-

nes invaden también las celdas de las obreras) y es allí donde se produce los efectos más

nocivos.

En los artículos de Calderón & Zamora (2004) y de la OIE (2004), se describe con

detalle el proceso de infestación que ocurre desde la invasión de la hembra adulta de ácaro

fecundada en la celda de una cría de unos 5 días de edad, hasta el surgimiento de una abeja

18
CAPÍTULO 2. MARCO TEÓRICO 2.1. EL ÁCARO VARROA DESTRUCTOR

joven enferma o la muerte de la cría.

La hembra del ácaro deposita alrededor de 7 huevos en la celda, de los cuales, después

de 60 horas, emergen un macho y el resto hembras que posteriormente se aparearán para

continuar el ciclo cuando la celda sea abierta por la abeja joven. Un dato interesante es

que solamente una o dos hembras alcanzan la madurez necesaria para aparearse e iniciar la

invasión a otra celda, sin embargo las lesiones que causan a la cría son un factor importante

y la generación de excrementos es causante de otras problemáticas a la población de abejas.

Calderón & Zamora (2004), OIE (2004) y Colin et al. (1999) concuerdan en que el daño

causado puede verse desde dos aristas: física e infecciosa.

Dado que los ácaros en la celda sellada de la cría se alimentan de su hemolinfa, se pro-

ducen una serie de trastornos como la pérdida de peso y cambios en el comportamiento de

las abejas. Con las palabras de Calderón $ Zamora (2004)

Se cita una marcada disminución del peso de la abeja, cambios en la concentración

y composición de las proteínas de la hemolinfa, alteraciones en el número y tipo

de hemocitos (células que constituyen la hemolinfa) y en los componentes antigé-

nicos.(p. 12)

Las heridas causadas por el ácaro propician la transmisión de agentes infecciosos. Es-

te daño de tipo infeccioso es considerado como uno de los problemas más importantes

asociados a las colmenas de abejas. El ácaro V. Destructor es considerado un participante

relevante en la transmisión de bacterias (Loque Americano), hongos (Cría de Tiza) y prin-

cipalmente virus (DWV, KBV, cría sacciforme, celdas reales negras y APV, por ejemplo.)

19
2.1. EL ÁCARO VARROA DESTRUCTOR CAPÍTULO 2. MARCO TEÓRICO

El impacto en las abejas jóvenes es inmediato. Se presenta un marcado debilitamiento,

retraso en la eclosión y una reducción de su vida productiva. En una colmena con infes-

tación débil las abejas tienen problemas con maniobras de vuelo y se reduce su promedio

de vida; si la infestación es fuerte son frecuentes problemas de morfología en las abejas y

muerte prematura.

Figura 2.2: Comparación de la morfología de una abeja adulta sana y otra afectada por
varroosis.

El impacto del ácaro es tal que las condiciones antes expuestas se traducen en disminu-

ción de la colmena, reducción de la vida productiva y por tanto en merma en el aporte de

polen y deterioro en calidad de la miel.

Llorente (1990), advierte al respecto que

Es preciso tener en cuenta que la presencia de varroosis en una colonia puede tener

consecuencias nefastas, no solamente por esta parasitosis, sino también por su ac-

ción vectorial para ciertos agentes patógenos, que incrementan su virulencia cuando

entran en la hemolinfa: virus de la parálisis aguda. (p. 10).

20
CAPÍTULO 2. MARCO TEÓRICO 2.1. EL ÁCARO VARROA DESTRUCTOR

2.1.3. Comportamientos particulares del ácaro

Hasta este momento se han presentado las principales características de biológicas del

ácaro V. Destructor y las consecuencias de la infestación de varroosis en una colmena. Se

ha mostrado que los expertos coinciden en la importancia de diagnosticar la aparición de

una infestación de este ácaro pues las secuelas pueden llegar a ser devastadoras.

De la evidente urgencia de conocimiento y control de este parásito, se desprende, en-

tonces, la necesidad de estudiar los comportamientos del ácaro en sus acciones más vitales:

alimentación, defecación, reproducción y los momentos en que descansa.

La reproducción del ácaro ha sido estudiada con detalle en Calderón & Zamora (2007)

donde se presenta un análisis comparativo según la infestación, ya sea que ésta se presen-

te en celdas de zánganos u obreras. Entre los señalamientos más importantes se tiene que

“mite fertility was similar between worker and drone brood. Nevertheless, a significant dif-

ference in the number of foundress mites producing viable female offspring and immature

offspring was found, being drone brood more suitable for mite reproduction” (p. 31).

Del conocimiento y descripción del comportamiento reproductivo se concluyen algunas

sugerencias de análisis como el tratamiento en laboratorio de celdas de zánganos infestadas.

Por ejemplo, se evidencia que el número de huevos y hembras fértiles es mayor en éstos

que en las celdas de obreras (Calderón & Zamora, 2007) y se presenta la posibilidad de

propiciar una mayor incubación en abejas obreras para reducir el potencial reproductivo

del ácaro.

Otras acciones del ácaro V. Destructor, como la alimentación y defecación también

21
2.1. EL ÁCARO VARROA DESTRUCTOR CAPÍTULO 2. MARCO TEÓRICO

tienen consecuencias directas en el comportamiento y eventual deterioro de la larva de la

abeja. Ya se ha discutido que la succión de hemolinfa que realiza el ácaro para alimen-

tarse, debilita la abeja, y puede tener consecuencias como la deformación de las alas y el

abdomen de la abeja joven. Erickson (1996) describe como la defecación del ácaro puede

interpretarse como un indicador de la presencia activa de éste y hasta como parámetro para

estimar el nivel de infestación en la colmena.

Erickson(1996) señala que las acumulaciones fecales (FA) de este ácaro aparecen como

masas amorfas de color blanco visibles sin tener que utilizar algún instrumento. A diferen-

cia de otros métodos de diagnóstico de la presencia del ácaro, FA es un indicador visual

simple.

Erickson (1996) señala que “analyses have demonstrated a moderate level of correla-

tion between the number of cells with FA and the number of mite per ether roll sample or

on sticky boards” (p.64). Este resultado es el que permite afirmar que es posible estimar el

nivel de infestación a partir de la observación de FA,

FA can be used to diagnose varroa infestations at virtually all levels of mite popu-

lation development, and also to determine the treatment. With experience one can

discriminate between low, moderate and advanced infestations. (p. 64).

A manera de comparación, el autor concluye,

22
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

Even so, the use of FA as a varroa diagnostic is superior to other methods except un-

capping because it is more likely to pinpoint the severity of infestation during these

periods of intensive brood rearing. (...) Moreover, the beekeeper can quickly diag-

nose varroosis at the same time that s/he is inspecting combs for brood condition

and diseases.(p. 64)

Teniendo como base el acercamiento realizado a las características biológicas y de com-

portamiento del ácaro, se muestran en detalle algunos métodos utilizados para el procesa-

miento digital de video. Desde una perspectiva más descriptiva que analítica se presentan

las nociones elementales que involucran el procesado de imágenes y videos, se caracteri-

zan y tipifican algunos métodos utilizados en la detección y seguimiento de objetos y se

introducen los elementos básicos de un sistema automático inteligente de procesado.

2.2. Procesamiento Digital de Video

El primer paso en la comprensión del procesado digital de video es sin duda lograr in-

terpretar como lee la computadora una imagen. Este hecho es importante pues además de

proporcionar una base conceptual sobre imagen digital, pone de manifiesto una caracterís-

tica esencial del trabajo con computadoras; los procesos discretos.

Según Rodríguez (2003)

23
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

Una imagen digital es una función f (x, y) que puede ser discretizada en sus coor-

denadas espaciales y brillo. Por tanto, es una matriz cuyos índices identifican un

punto en la imagen y la correspondiente matriz de valores identifica el nivel de gris

de ese punto. (p. 12).

En otras palabras puede pensarse una imagen como una matriz, cuyas dimensiones

dependen del tamaño de la imagen, en la cual las entradas son ponderaciones que asignan

la intensidad del color en cada punto. Como se ilustra en la figura 2.3 en MatLab una

imagen a escala de grises se representa por medio de una matriz bidimensional de m × n

(Valdemar & Zaldivar, 2006).

Figura 2.3: Representación de una imagen a escala de grises en MatLab.

Además de la interpretación de las dimensiones de la imagen como dimensiones de una

matriz de puntos es importante identificar el espacio de color de la imagen. Es decir, la

forma en como se asigna el color a cada punto (o píxel) respectivo de la matriz imagen.

24
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

Gil, Torres & Ortiz, F. (2004) señalan el espacio de color RGB (rojo (R), verde (G)

y azul (B))como el más utilizado por las cámaras de video y fotográficas y enfatizan en

la conveniencia de conocer el espacio de color de las imágenes a procesar pues de esto

dependerá el no perder propiedades de color en el tratamiento.

El espacio de color RGB asigna el color a cada punto como una mezcla de intensidad

de tres colores primarios . La intensidad del color en cada píxel varía entre 0 y 255, de

modo que el blanco por ejemplo tiene asignado R = 255, G = 255 y B = 255 mientras

que el negro es R = 0, G = 0 y B = 0.

Con esto la imagen se considera un hipermatriz (una matriz tridimensional m × n × p)

donde los píxeles están ordenados rectangularmente y además cada uno tiene asignada una

tripleta RGB que determina el color asignado a partir de la intensidad de los primarios.

La ponderación utilizada por el espacio de color RGB puede interpretarse como tres

máscaras superpuestas de dimensiones iguales a las de la matriz que corresponde a la ima-

gen. En ellas se determina la intensidad de colores rojo, verde y azul. (véase figura 2.4).

Con base en esta representación de imagen como hipermatriz, debe entenderse proce-

sado de imagen como el tratamiento computacional de la matriz asociada con el fin de

resaltar alguna característica, seleccionar regiones, eliminar ruido, detectar o seguir objetos

o cualquier proceso que involucre la manipulación de sus componentes.

Cuando el procesado se refiere a video el asunto se torna más interesante, aunque con

matices similares. Rodríguez (2003) señala que

25
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

Figura 2.4: Representación de una imagen a color RGB en MatLab.

Para el estudio del movimiento en la imagen es imprescindible introducir la varia-

ble tiempo. Una secuencia de imágenes vendrá representada por la función f (x, y, t)

donde x e y son las coordenadas espaciales en la imagen de la escena en un instan-

te de tiempo concreto t. El valor de la función f (x, y, t) por tanto, representa la

intensidad del píxel (x, y) en la imagen t (p. 12).

Con esta definición se podría decir que un video está compuesto de imágenes (también

llamados en la literatura cuadros o frames) con un orden de presentación determinado por

la posición en un vector. Es decir el primer frame es una hipermatriz con todas las carac-

terísticas antes mencionadas, le sigue otra matriz con iguales dimensiones en las que los

valores de algunos píxeles hayan cambiado (podría suceder que la mayoría o la totalidad

de los píxeles se mantengan invariantes; esto sucedería si en la imagen no hay movimiento

26
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

y/o si la velocidad de reproducción es alta), luego un tercera imagen y así sucesivamente.

Figura 2.5: El parámetro t determina la componente asignada al frame en esa posición en


un vector de hipermatrices

2.2.1. Métodos de detección y seguimientos de objetos mediante técni-

cas de procesamiento de video

El análisis visual del movimiento de objetos es un área muy productiva en la actualidad,

dado que su aplicación, tal y como ya se ha mencionado en varias ocasiones, se extiende

a muchos campos; tales como los videos de seguridad, en interacciones entre el hombre y

las máquinas, estudio de tránsito vehicular y otros.

La detección, seguimiento y reconocimiento del comportamiento de objetos por compu-

tadora puede ser realizada a partir de un video captado por una cámara estática o bien una

cámara móvil de video. La mayoría de los algoritmos creados para estos fines, están ba-

sados en distribuciones estadísticas de color estimadas para cada píxel y son denominados

sistemas de detección de primer plano clásico.

Existen, además, otras técnicas que incorporan información espacial del píxel con el

27
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

fin de desarrollar un algoritmo más eficaz. Sin embargo, en cualquier caso, se evidencia

la presencia de modelos estadísticos de fondo, ya sea considerando cada píxel o toda la

imagen completa como una variable aleatoria independiente.

Mateu (2009) establece una serie de parámetros que garantizan la robustez del sistema

de detección de objetos, estos son:

1. Modelo de fondo actualizable. El modelo de fondo utilizado para detectar los ob-

jetos debe poder evolucionar junto con la secuencia, con el fin de adaptarse a los

cambios observados en ella. Estas variaciones pueden ser consecuencia de cambios

de iluminación o la detención de objetos de primer plano en el fondo, situación en la

cual el objeto de primer plano pasaría a ser un objeto inmóvil de fondo.

2. Reducir falsas detecciones de primer plano / maximizar las detecciones correc-

tas. La estimación de la distribución estadística del fondo tiene como objetivo cal-

cular la probabilidad de que una nueva muestra pertenezca a este modelo, por tanto

es muy importante elegir correctamente un umbral de decisión que permita discernir

entre primer plano y fondo. Este objetivo puede lograrse también con la inclusión de

información espacial en los modelos de fondo.

3. Eliminar sombras o brillos de las detecciones de primer plano. Cualquiera que

sea el método de detección de primer plano utilizado, es común que se detecten

erróneamente sombras de objetos o brillo. Esto sucede porque los métodos se funda-

mentan en identificación de colores.

28
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

2.2.2. Sistemas de detección de primer plano

Según Mateu (2009), los sistemas de detección de objetos de primer plano, esencial-

mente, siguen la misma estructura. Como inicio se crea el modelo de fondo, en el cual

está ausente el objeto a detectar. El objetivo de este primer estadio es propiciar la correcta

estimación de la distribución estadística del fondo a partir de los valores observados.

Es importante destacar que, en esta primera etapa, no se pretende detectar objetos, más

bien se tiene el objetivo único de construir el modelo que posteriormente será usado para

realizar dicha acción. Durante este proceso todo valor será considerado siempre fondo. Esta

fase es conocida como periodo de aprendizaje o entrenamiento.

A partir del modelo generado se procederá a detectar objetos de primer plano en la

secuencia de trabajo según la metodología propia del sistema utilizado. Finalmente, todos

los píxeles que hayan sido asignados al fondo se incluirán en el correspondiente modelo de

fondo (esto es, se actualizará con el nuevo valor).

Existen dos familias de estimadores: los paramétricos y los no paramétricos. Los prime-

ros sólo pueden usarse en el caso de que la función de densidad de probabilidad a estimar

sea similar a una de las distribuciones conocidas (distribución Gaussiana, de Poisson u

otras de uso extendido), es decir, todo estimador paramétrico sólo es válido para una cierta

distribución estadística. Los segundos estimadores son válidos independientemente de la

forma que tome la función de densidad de probabilidad (también conocida como pdf (en

inglés probability density function)).

Mateu (2009) hace un estudio completo de cada uno de estos estimadores con una

29
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

aplicación a la detección de personas en un aeropuerto. A continuación en el cuadro 2.1 se

presenta un resumen de cada estimador, así como los métodos de detección y seguimiento.

Cuadro 2.1: Familias de estimadores

Estimadores paramétricos Estimadores no paramétricos

Running Gaussiana Average Histograma

Múltiples Gaussianas Kernel Densisty Estimation (KDE)

Stauffer y Grimson(S y G)

2.2.2.1. Running Gaussian Average

Según Mateu (2009) Running Gaussian Average es una de las primeras técnicas surgi-

das con el fin de detectar objetos de primer plano en una secuencia de vídeo. Wren (1997)

citado por Mateu (2009), propone modelar el fondo de cada píxel mediante una función

de densidad de probabilidad conocida, la función Gaussiana, la cual queda determinada

mediante sus dos parámetros: media µ y varianza σ 2 .

De este modo, para estimar la función de densidad de probabilidad del modelo a par-

tir de las muestras obtenidas durante el periodo de entrenamiento, basta con calcular los

parámetros característicos de la curva de Gauss a partir de éstas.

Para ello, se trabaja con cada uno de los canales de color (R, G, B), que pueden con-

siderarse estadísticamente independientes. Dicha independencia implica que la pdf del

30
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

píxel en cuestión se puede obtener como producto de las pdf marginales. Éstas se ob-

tiene de la estimación por separado de cada uno de los canales mencionados, esto es,

f (z) = fR (R)fG (G)fB (B), donde z = (R, G, B).

De este modo, a partir de los N valores observados en cada uno de los tres canales de

color durante el periodo de entrenamiento, se puede calcular µ y σ 2 capaces de representar

a todos ellos.

Con la estimación de la pdf del fondo de cada uno de los píxeles se tiene un parámetro

para decidir si un píxel de valor x se corresponde con el modelo obtenido mediante el

siguiente criterio:

| x − µ |> kσ =⇒ f oreground

Resto =⇒ background

donde k es una constante que puede tomar valores entre 3 y 5 para que puedan ser

considerados datos centralizados en la distribución normal .

Finalmente, se debe especificar el método usado para realizar la actualización de los

parámetros de la Gaussiana una vez obtenido el modelo de fondo. Esta actualización se

realiza a lo largo de toda la secuencia, mediante las siguientes ecuaciones:

µt = ρxt + (1 − ρ)µt−1

σt2 = ρ(xt − µt )2 + (1 − ρ)σt−1


2

31
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

donde xt es el valor del píxel en la imagen actual, µt y σt son la media y la desviación

estándar que caracterizan su pdf en ese mismo instante, y ρ es el parámetro de absorción, el

cual determina la velocidad con la que se actualiza el modelo en cada imagen (valor usual

de ρ = 0,01). Se aclara que la actualización sólo debe hacerse si el píxel pertenece al fondo

(Mateu, 2009).

2.2.2.2. Múltiples Gaussianas (Stauffer-Grimson)

El método de S y G es un estimador paramétrico que proviene de la evolución del

método de Running Gaussian Average, puesto que utiliza hasta K Gaussianas por canal de

color para estimar la pdf del modelo de cada píxel. Surge con la finalidad de mejorar la

detección de objetos en secuencias en las que aparecen variaciones periódicas en el fondo,

como por ejemplo el movimiento de objetos originados por el viento (Mateu, 2009).

Stauffer-Grimson (1999) citados por Mateu (2009), proponen este método para detectar

objetos de primer plano, mediante la suma ponderada de funciones Gaussianas por canal y

pixel, mediante:

k
X
f (z) = ωi G(z, µi , σi )
i=1

donde k es el número máximo de Gaussianas utilizadas para realizar la estimación del

modelo, G representa cada una de las Gaussianas utilizadas, ωi son las ponderaciones que

tiene cada una de las curvas, µi y σi son los parámetros estadísticos de cada distribución y

z es el valor del píxel en cuestión.

32
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

Esta estimación se utiliza para obtener un modelo de fondo y decidir si el píxel en

cuestión corresponde con el objeto de primer plano.

Las Gaussianas representan tanto el fondo como el primer plano y deciden a partir

de un modelo dinámico cuales pixeles corresponden al fondo y cuales a objeto de primer

plano. De esta forma será posible introducir los objetos de primer plano en el modelo de

fondo cuando permanezcan estáticos en la escena, asignando la Gaussiana correspondiente

a fondo.

Cada píxel (i, j) de la imagen se modela como una combinación de distribuciones Gaus-

sianas a partir de los factores de ponderación ωi,t que se modifican iterativamente en fun-

ción de las veces que se da el valor que recoge, formando así el modelo probabilístico del

píxel.

Los factores de ponderación se normalizan según:

ωi,t
ωi,t = Pk
j=1 ωj,t

A fin de conseguir la condición:

K
X
ωi,t = 1
i=1

Para la clasificación de un píxel como primer plano o fondo, se considera que el fondo

queda modelado por las B distribuciones Gaussianas de mayor peso y menor varianza

según la resolución de la siguiente inecuación:

33
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

b
!
X
B = argminb ωi,t > T
i=i

donde T es el umbral de decisión asignado (usualmente 0.6), y B es el número mínimo de

distribuciones a incluir en la sumatoria (ordenadas según ω y σ ), para que se cumpla la

inecuación.

De este modo, las B primeras distribuciones Gaussianas serán las que modelarán la

función de densidad de probabilidad del fondo, puesto que normalmente es más estático

y aparece con más frecuencia, correspondiéndose con aquellas Gaussianas que han sido

utilizadas más veces y que son más compactas.

Para comprobar si el valor del píxel de entrada encaja en alguna distribución Gaussiana

del modelo probabilístico del píxel, se evalúa la siguiente inecuación:

|xt − µi,t | > kσi,t

Donde xt es el valor de un canal de color del píxel estudiado en el fotograma t, µi,t es la

media de la Gaussiana i-ésima y σi,t la desviación estándar de la Gaussiana i-ésima, por

tanto:

1. Si la inecuación se cumple para todas las Gaussianas, entonces se decide que el valor

xt pertenece al primer plano, puesto que no encaja con el modelo probabilístico del

píxel aprendido hasta el momento. En este caso, se generará una nueva Gaussiana con

el fin de permitir adaptar el modelo al fondo, eliminando la distribución con menor

peso.

34
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

2. Si la inecuación no se cumple para una Gaussiana, se supone que el valor encaja con

el modelo probabilístico modelado mediante la misma (si la inecuación no se cumple

para más de una Gaussiana, se supondrá que la función que mejor representa al píxel

es la de menor varianza). En este caso, si el valor del píxel encaja con una de las B

primeras distribuciones Gaussianas se asignará a fondo, debido a que la frecuencia

con la que ha aparecido es lo suficientemente elevada como para que sea considerado

fondo.

Finalmente, la actualización del modelo se realizará mediante las siguientes expresio-

nes:

Actualización de la media y la varianza (afecta sólo a la distribución Gaussiana

que ha encajado):

µt = ρxt + (1 − ρ)µt−1

σt2 = ρ(xt − µt )2 + (1 − ρ)σt−1


2

Actualización de los pesos (afecta a todas las distribuciones que conforman el mo-

delo):

ωk,t = (1 − α)ωk,t−1 + α(Mk,t )

donde ω es un coeficiente de absorción (distinto a ρ, normalmente se suele usar un valor

fijo 0,005) y Mk,t es 1 para la función Gaussiana que ha encajado y 0 para las que no.

35
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

2.2.2.3. Histograma

Bajo el supuesto que se debe estimar la función de densidad de probabilidad de una

variable aleatoria cuyo espacio muestral es discreto, los histogramas se basan en contar el

número de veces o la frecuencia con la que aparece cada uno de los valores de dicho espacio

muestral en las muestras que se tienen en cuenta para realizar la estimación (Mateu, 2009).

Con ello, cada vez que se requiera actualizar el histograma se incrementa en 1 el va-

lor que corresponda con la muestra utilizada, como si tratara de una concatenación de N

contadores independientes.

En el supuesto caso de que sea necesario utilizar un histograma para realizar la estima-

ción de una variable aleatoria continua (el espacio muestral está formado por un conjunto

infinito de valores contenidos dentro de un intervalo), simplemente sería necesario decidir

el número de intervalos en los que dividir el espacio muestral y la longitud de los mismos,

cuantificando los infinitos valores en L niveles(Mateu, 2009).

El resultado de un histograma es un gráfico escalonado con distintas alturas para cada

posible valor o rango de valores, dando una idea de la probabilidad que tendrá asociada

cada uno. Los valores que más se hayan repetido entre las muestras tendrán asociada una

probabilidad mayor que aquellos que casi no hayan aparecido.

El histograma es válido para una pdf continua, sin embargo, se requieren muchas mues-

tras para estimar correctamente la pdf (Mateu, 2009).

36
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

2.2.2.4. Kernel Density Estimation (KDE)

Mateu (2009) establece que el (KDE) es un método no paramétrico que permite estimar

la función de densidad de probabilidad de una variable aleatoria a partir de algunas de sus

muestras.

Su principio de funcionamiento está basado en el uso de funciones Kernel, cuya deno-

minación se refiere a toda función integrable real definida no-negativa que cumple:

Z ∞
1. Área unitaria K(u)du = 1.
−∞

2. Simétrica K(u) = K(−u), ∀u.

Sea x(0), . . . , x(N − 1) el conjunto de muestras conocidas de una variable aleatoria X

y K(x) la función Kernel utilizada, se obtiene la estimación de la pdf de x como la suma

promediada de todas las funciones kernel centradas, es decir las K(x)(para cada una de

ellas y en cada una de las muestras conocidas), es decir:

N −1  
1 X N(x − xi )
f (x) =
N i=1 h

donde h es el ancho de la función Kernel utilizada.

Normalmente, se usan las funciones kernel Gaussianas por su simplicidad y suavidad.

Cabe destacar que la calidad de la estimación no reside principalmente en la función Kernel

utilizada, sino en el ancho seleccionado (Mateu,2009).

37
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

2.2.2.5. Sistema de post-procesado

Según Mateu (2009), los sistemas basados en substracción de fondo tienen el riesgo de

detectar las sombras como parte del objeto, debido a la no correspondencia con el modelo

aprendido en el sistema de procesado.

Esta asignación incorrecta suele ser problemática en la mayoría de las aplicaciones

prácticas en las que se utiliza los modelos de procesados, puesto que distorsionan las ca-

racterísticas propias de los objetos.

Debido a que las sombras tienen las características del modelo de fondo, aunque con

ciertos tonos más oscuros, hay distintas técnicas que utilizan sistemas de pos-procesado,

con el fin de eliminar parcial o totalmente las falsas detecciones producidas por este fe-

nómeno. Algunos son algoritmos aplicados a la salida del sistema detector para corregir

la máscara obtenida, otros se basan en realizar una transformación a la entrada del mismo

detector para reducir la aparición de sombras en la detección (Mateu, 2009).

Mateu (2009), señala tres principales algoritmos para la corrección de estas falsas de-

tecciones, los cuales son: Método de luminancia normalizada, Método híbrido y el Método

reflectancia. Sin embargo, para efectos de nuestra investigación, el ácaro ni ningún otro

elemento involucrado en la zona de estudio (celda) genera sombra, por lo que se ha consi-

derado no entrar en detalles en el estudio de estos algoritmos.

38
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

2.2.2.6. Sistemas de detección de primer plano con regularidad espacial

Se describen los principales modelos de detección de primer plano con regularidad

espacial, con carácter didáctico, pues para el desarrollo del algoritmo de detección y segui-

miento del ácaro V. Destructor no se consideró ningún modelo de estos como tal.

Según Mateu (2009), todos los sistemas de detección de primer plano clásicos tienen en

común que están basados únicamente en la información de un píxel. Es decir, se trata cada

uno de los píxeles de la imagen como una variable aleatoria independiente, modelando para

cada uno de ellos su propio fondo en función de los valores acumulados. De modo que, una

vez obtenido el modelo, se procede a decidir si el respectivo valor del píxel en la nueva

imagen corresponde al fondo o a un objeto de primer plano.

Con el fin de aumentar la eficiencia en la detección de objetos, existen técnicas que

intentan aprovechar la información contenida en el entorno de cada píxel, obteniendo un

modelo más complejo. Para ello, pretenden aprovechar la persistencia temporal de los ob-

jetos reales en la secuencia, es decir, que los objetos a detectar tienden a permanecer en la

misma vecindad espacial y a conservar el color coherente.

Mittal & Paragios (sin año); Sheikh& Shah (sin año) citados por Mateu (2009), propo-

nen un único modelo de fondo en vez de L × M modelos independientes (correspondientes

a los píxeles). Para ello, se toma un vector de características de 5 dimensiones, acumulando

información de color y de posición de cada uno de los píxeles (r, g, b, x, y).

Teniendo claro que no existe ninguna relación entre la posición x e y que ocupa un píxel

en la secuencia con los canales de color observados, se podrá asumir también en este caso

39
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

la independencia de cada una de las componentes usadas. Por tanto, la función de densidad

de probabilidad del fondo que se pretende estimar será el resultado de multiplicar cada una

de sus marginales

fR,G,B,X,Y (r, g, b, x, y) = fR (r) · fG (g) · fB (b) · fX (x) · fY (y)

pudiendo estimar cada una de ellas a partir de las muestras acumuladas. Finalmente, se

clasificará cada uno de los píxeles teniendo en cuenta la pdf de fondo obtenida.

Se detallarán dos de los métodos comunes en la detección de primer plano con regula-

ridad espacial.

2.2.2.7. Inclusión de información espacial en el modelo: KDE 5D

Dada la necesidad de implementar una técnica de detección de primer plano que hicie-

ra una clasificación en función del entorno del píxel, surgió la idea de adaptar el algoritmo

KDE para que también incluyera información espacial (adelante, KDE 5D), pudiendo esti-

mar así una función de densidad de probabilidad del fondo de toda la imagen.

Para la estimación de la función de densidad, Mittal & Paragios (sin año); Sheikh,

& Shah (sin año ) citados por Mateu (2009); proponen que basta trabajar con muestras

pertenecientes a R5 de la forma z = (r, g, b, x, y).

El funcionamiento del sistema KDE 5D, como en todo sistema de detección de primer

plano, está basado en tres fases: aprendizaje, decisión y actualización.

Durante el periodo de aprendizaje, es posible obtener un único modelo del fondo de

la secuencia a partir de la acumulación de N imágenes. Mediante esta acumulación se

40
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

consigue ahorrar espacio en memoria, puesto que el valor de las componentes x e y quedará

implícito según la posición donde se guarden los valores de color (Mateu, 2009).

Una vez acumulados los N fotogramas, se procederá a obtener el modelo de fondo me-

diante el estimador KDE, tratándose cada una de las componentes de forma independiente

a través de la expresión:

P −1 d  
1 XY K(zj − ui,j )
f (z) =
N i=0 j=1 hj

donde P representa el número de muestras con las que se modela el fondo (las cuales

pertenecen a R5 , por lo que d = 5) y hj el ancho de banda de la función Kernel.

Una vez modelado el fondo de la secuencia, se procederá a la detección de objetos

de primer plano. Para ello, es necesario calcular la probabilidad que el píxel pertenezca a

fondo teniéndose en cuenta también los valores anteriores de todo el entorno, por lo que:

−(zj (m, l) − ui,j (m, l))2


M L−1 N
−1 X d
−1 Y
1 X X 1 2σj2
p(z) = q e
M ·N ·L m=0 l=0 i=0 j=1 2πσ2j
donde L y M son el número de filas y columnas del fotograma respectivamente, uti-

lizándose un umbral de decisión como criterio clasificador entre fondo y primer plano (el

mismo para todos los píxeles)

si p(z) < th (umbral) =⇒ se decide primer plano.

si p(z) > th (umbral) =⇒ se decide fondo, con z ∈ bg.

41
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

Como consecuencia de que las componentes de dominio son independientes de la ima-

gen seleccionada entre las N acumuladas, en el sumando con índice i se puede sacar factor

común el producto de las Gaussianas asociadas a las componentes de dominio.

Dado que, para cada píxel los valores ui , x(m, l) y ui , y(m, l) corresponden, respectiva-

mente, a m y l (la posición que ocupa el píxel en la imagen), cada una de las Gaussianas de

dominio se puede sustituir por las expresiones ωx (m, l) y ωy (m, l), puesto que no dependen

de la variable temporal i.

Por tanto la ecuación anterior se transforma en :

−(zj (m, l) − ui,j (m, l))2


M L−1
−1 X N d
−1 Y
1 X 1 X 1 2σj2
p(z) = ·ωx (m, l) · ωy (m, l) · q e
M · L m=0 N
l=0 i=0 j=1 2πσ2j
con z ∈ bg.

Por este motivo, se ve el cálculo como un promedio ponderado de la probabilidad de

que distintos píxeles pertenezcan a fondo, donde cada una de ellas se calcula como en KDE

3D (para todos los píxeles) y donde las Gaussianas de dominio hacen el papel de factores

de ponderación. De este modo, es posible dar un mayor peso a la probabilidad asociada al

propio píxel que al resto, disminuyendo el peso proporcionalmente a la distancia que los

separa (debido a que se rigen por el producto de Gaussianas de dominio).

A pesar de que se tenga en cuenta el entorno del píxel, el peso asociado al mismo sea

mayor que el de cualquier otro píxel, teniendo a su vez mayor importancia los píxeles más

cercanos que los lejanos.

De esta forma, si mediante KDE 3D un píxel es asignado a fondo indebidamente y el

42
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

resto de los vecinos han sido asignados a primer plano correctamente, este sistema es capaz

de corregir la no detección del píxel en cuestión, sin necesidad de aplicar ninguna técnica

de post-procesado, principal objetivo de este tipo de algoritmos.

La aparición de gran cantidad de pequeñas falsas detecciones puede deberse a la acción

de algún agente externo sobre el fondo de la secuencia, como puede ser la acción del viento

o incluso la propia cámara. Por tanto, un modelado de fondo genérico (no centrado en el

píxel) puede aportar gran cantidad de mejoras en secuencias donde el fondo es dinámico.

Teniendo presente que cada una de las Gaussianas son función Kernel, el uso de estas

componentes de dominio no modifica el área de la pdf del modelo. Esto se debe a que la

suma de todos los valores del Kernel resulta uno, por lo que el resultado total será una

probabilidad del orden de magnitud de las de KDE 3D.

Por tanto, se suma de forma ponderada las distintas probabilidades obtenidas mediante

KDE 3D con el fin de asegurar una cierta regularidad espacial en el entorno del píxel. Como

consecuencia, el umbral de decisión en este caso coincide con el utilizado en KDE 3D.

2.2.2.8. Estimación Bayesiana mediante dos modelos

Otra metodología es la que proponen Sheikh & Shah (sin año) citados por Mateu

(2009), la cual consiste en generar dos modelos para toda la imagen, uno para modelar

el fondo y otro para el primer plano y clasificar a partir de estos cada uno de los píxeles al

modelo adecuado.

En este algoritmo las muestras son de la forma z = (r, g, b, x, y), en dicha implemen-

43
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

tación se modela el fondo de la secuencia mediante una variante KDE con información

espacial, a partir de las N muestras acumuladas durante el aprendizaje

N
1 X
f (z|ψb ) = Kb (z − mi )
N i=1

A diferencia con el método anterior, se usa una variante para el modelo de los objetos

de primer plano, puesto que consiste en la suma de dos distribuciones estadísticas (Mateu,

2009).
1
Por un lado, una distribución uniforme representada mediante γ = ,
R·G·B·L·M
donde L es el número de columnas del fotograma, M el número de filas y (R,G,B) repre-

sentan los posibles valores de cada uno de los canales de color. Por otro lado, se tiene la

distribución proveniente de la estimación KDE con información espacial (análoga a KDE

5D), ponderadas ambas por α y (1 − α), respectivamente, es decir:

N
1−αX
f (z|ψf ) = αγ + Kp (z − mi )
N i=1

Esta combinación tiene por objetivo detectar y aprender de los objetos de primer plano.

Mientras la distribución uniforme pretende tener en cuenta todo valor de (R,G,B) para todo

píxel, con el fin de poder representar a todo objeto nuevo (detectar objetos nuevos), la

distribución KDE tiene como objetivo aprender de él y adaptar la pdf estimada para poder

ser detectado más fácilmente en posteriores imágenes.

Es decir, suponiendo que en un instante t aparece un objeto en la secuencia, éste será

asignado al modelo de primer plano, debido a la no coincidencia con el fondo observado

44
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

y a que el modelo de primer plano tiene en cuenta todos los posibles valores de color por

píxel (Mateu, 2009).

De este modo, una vez asignado al modelo, éste se actualizará acumulando el valor

observado en el píxel (i, j) de dicho modelo, por lo que la probabilidad del mismo para

una similar distribución de color en sus proximidades aumentará (debido al aprendizaje

aportado por KDE).

Una vez explicados los modelos, el criterio de decisión entre ambos consistirá en com-

probar la siguiente relación:

 
f (z|ψb )
τ = − ln
f (z|ψf )

Asignándose a la etiqueta l = 0 si τ > k y l = 1 en el resto, donde k es un umbral.

En la práctica, no se decide directamente entre primer plano/fondo ya que, tal y co-

mo se ha razonado anteriormente, no hay total independencia entre píxeles vecinos. Para

incluir esta dependencia, se maximiza la probabilidad a posteriori asumiendo un modelo

denominado Ising como probabilidad a priori de las etiquetas:

P   P
P X
X f (z|ψb ) X
ln li + λ(li lj + (1 − li )(1 − lj ))
i=1
f (z|ψf ) i=1 j=1

donde li corresponden a las etiquetas, P es el número de píxeles y λ es una constante

positiva.

De este modo, considerando una región de la imagen, el sistema es capaz de detectar

objetos de primer plano mediante la optimización de una función que depende de más de

45
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

un píxel, rompiéndose con la idea de que los píxeles son independientes. Esta optimización

se hace mediante la técnica de graph-cuts.

Una variante de este algoritmo es cuando se utiliza varios modelos para los objetos de

primer plano, uno para cada uno de los objetos de primer plano y otro uniforme que permita

detectar la aparición de objetos nuevos en la secuencia, a este modelo se le demomina

Estimación Bayesiana mediante varios modelos (Seguimiento), para mayor detalle puede

observarse en Mateu (2009).

2.2.3. Seguimientos de objetos

En la última década se ha considerado el seguimiento visual de objetos como una tarea

de especial interés en muy diversas áreas. Hanxuan, Feng, Liang & Zhan (2011), seña-

lan que “the use of visual tracking is pertinent in the tasks of motion-based recognition,

automated surveillance, video indexing, human-computer interaction and vehicle naviga-

tion, etc.” (p. 3823). Además, se ha evidenciado un avance enorme en las propuestas de

algoritmos de seguimiento más recientes: se ha evolucionado de sistemas con supuestos

como estabilidad en la forma del objeto y movimientos suaves a métodos capaces de resol-

ver problemas como la aparición o salidas bruscas de escena o movimientos en apariencia

aleatorios.

Hanxuan et al. (2011), señalan tres características que debe tener un sistema de segui-

miento de objetos para ser considerado adecuado. El diseño y construcción de un buen

sistema de seguimiento de objetos debe considerar:

46
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

1. la capacidad de poder seguir el objeto de interés aún en condiciones complicadas

como cambios de iluminación, movimiento desordenado o presencia de ruido. Esta

característica se conoce como robustez del sistema.

2. la adaptabilidad del método de detección a los cambios que pueda sufrir el objeto

que interesa seguir para evitar falsas detecciones u omisiones y

3. una condición deseable es que el procesamiento sea en tiempo real y esto signifi-

ca que se debe contar con algoritmos de alto rendimiento así como de equipo que

posibiliten el procesamiento ágil y optimizado de información.

El trabajo propio de seguir un objeto en una secuencia de video es complejo y demanda,

según Hanxuan et al. (2011), una descripción detallada del objeto (forma, textura, posición,

color) y la incorporación de la información del contexto en el que se encuentra el objeto.

Una adecuada descripción del objeto de interés permite establecer los parámetros más ade-

cuados para caracterizarlo y fortalecer la robustez del método de seguimiento incorporado.

Además, es frecuente que el objeto se distinga de cierta forma del contexto en el que se

encuentra, por lo que el complemento de una descripción detallada con la incorporación

de la información del ambiente aumenta, generalmente, la confiabilidad de la detección del

objeto.

Como se ha mencionado, la descripción inicial del objeto es una etapa crucial y está

en relación directa con la calidad de proceso de seguimiento, luego debe incorporarse la

información del contexto y establecer los criterios para la actualización del método. Para

47
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

esto es imprescindible la discriminación y selección de las funciones más adecuadas para

incorporarlas al método que se proponga.

Hanxuan et al. (2011) realizan una comparación exhaustiva entre las principales des-

criptores de características para el seguimiento visual de objetos y los alcances de los mé-

todos de seguimiento. Mencionan como los descriptores de uso más difundido las caracte-

rizaciones por gradiente, color, textura, descriptores espacio-temporales y fusiones de estos

en un mismo método. Además, aclaran que los cambios en la apariencia de un objeto se

tipifican como intrínsecos (deformaciones en el objeto) o extrínsecos (cambios de luz o

enfoque) y esto solo puede ser manejado por algoritmos que se actualicen a estas modifi-

caciones.

Dada esta dualidad en los cambios en la apariencia de un objeto, Hanxuan et al. (2011),

describen dos tendencias que se han adoptado en los sistemas de seguimiento: los métodos

de aprendizaje generativos y los discriminativos. Los primeros se caracterizan por ocuparse

de la variación de la apariencia del objeto y por su frecuente actualización para adaptarse a

las nuevas formas del objeto. Los métodos discriminativos (llamados también tracking by

detection) se utilizan para distinguir el objeto del fondo del video por la actualización de

un clasificador previamente entrenado.

Esta última tendencia es de especial interés por adecuarse a los objetivos de esta pro-

puesta y por seguir un proceso similar al que se implementó en este trabajo. Al respecto,

Hanxuan et al. (2011), señalan que en estos métodos

48
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

a target object identified by the user in the first frame is described by a set of fea-

tures. A separate set of features describes the background, and a binary classifies

separates target from background in successive frames. To handle appearance chan-

ges, the classifies is updated incrementally over time. Motion constraints restrict the

space of boxes to be searched for the target (p. 3827)

Sobre las tendencias futuras en lo referente al seguimiento de objetos en video, estos

autores argumentan que una combinación en un marco coherente de los méritos de los

métodos generativos y discriminativos sería una dirección muy promisoria.

2.2.4. El software MatLab

Según Gómez (2009) MATLAB (abreviatura de MATrix LABoratory, laboratorio de

matrices) es un software matemático que ofrece un entorno de desarrollo integrado (IDE)

con un lenguaje de programación propio (lenguaje M) y que está disponible para las plata-

formas Unix, Windows y Apple Mac OS X.

MatLab fue creado por The MathWorks en 1984, surgiendo la primera versión con la

idea de emplear paquetes de subrutinas escritas en Fortran en los cursos de álgebra lineal

y análisis numérico, sin necesidad de escribir programas en dicho lenguaje. El lenguaje de

programación M fue creado en 1970 para proporcionar un sencillo acceso al software de

matrices LINPACK y EISPACK sin tener que usar Fortran.

Actualmente el software MatLab es muy utilizado, sobre todo a nivel empresarial y

en ambientes académicos y científicos. Al respecto, Gómez (2009) señala que “en el año

49
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

2004 , se estimaba que MatLab era empleado por más de un millón de personas en ámbitos

académicos y empresariales” (p. 23).

Rodríguez (2003) y Gómez (2009) señalan que entre las principales prestaciones de

MatLab destacan:

a La manipulación de matrices.

b La representación de datos y funciones.

c La implementación de algoritmos y la creación de interfaces de usuario (GUI).

d La comunicación con programas en otros lenguajes y con otros dispositivos hardwa-

re.

MatLab dispone de un código básico y de varias librerías especializadas denominadas

Toolboxes. En estos Toolboxes se pueden trabajar las áreas principales en el mundo de

la ingeniería y la simulación. En particular, debe destacarse Image Processing Toolbox

(paquete para procesado de imágenes) que se constituye en la principal herramienta de este

proyecto.

Con las palabras de Rodríguez (2003) MatLab es sin duda “una magnífica herramien-

ta de alto nivel para desarrollar aplicaciones técnicas, fácil de utilizar y que aumenta la

productividad de los programadores respecto a otros entornos de desarrollo” (p. 22).

Con el propósito de familiarizarse con los principales comandos utilizados en el al-

goritmo desarrollado en este proyecto, a continuación se realiza una breve descripción de

estos.

50
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

2.2.4.1. Principales funciones en el desarrollo del algoritmo

Para cargar las imágenes en el ambiente de MatLab se utiliza el comando imread.

La sintaxis para este comando es:

A = imread{’nombre_del_archivo’}

Donde ’nombre_del_archivo’ es una cadena de caracteres que determina el

nombre de la imagen con su respectiva dirección de búsqueda, mientras que la variable

A almacena la matriz obtenida.

Una vez cargada una imagen a escala de grises en una variable A, se podría utilizar la

función size para determinar las dimensiones de misma. La sintaxis en este caso sería

[M,N]= size(A) donde la variable M almacenará el número de filas de la imagen A,

mientras que la variable N el número de columnas.

Para mostrar imágenes en MatLab se utiliza el comando imshow. Con la sintaxis

imshow(A) se muestra la imagen almacenada en A.

2.2.5. Tipos de datos

Para indexar las coordenadas de la imagen se utilizan números enteros. Sin embargo, los

valores de los píxeles no se encuentran restringidos esta condición, pueden tener cualquier

valor en el intervalo [0, 255] e incluso números complejos (en el caso de Transformadas de

Fourier).

Todos los cálculos numéricos desempeñados por MatLab se realizan considerando que

los números son del tipo double (esto es números en formato coma flotante en el inter-

51
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

valo [0, 1] ), por lo que muchas de las operaciones consideradas en el algoritmo tiene este

formato.

El tipo de dato uint8 (entero en el intervalo [0, 255]) se presenta cuando se carga una

imagen al ambiente de MatLab por del comando imread. Otro tipo de dato que puede

utilizarse para la representación de imágenes es el logical, el cual permite representar

en forma compacta imágenes binarias, en caso los valores posibles de 0 y 1.

Una imagen a escala de grises es una matriz cuyos valores han sido escalados para re-

presentar un determinado número de intervalos. MatLab permite hacer conversiones del ti-

po de datos, para lo cual se emplea la siguiente sintaxis: B = tipo_de_dato(A),donde

tipo_de_dato es uno de los mencionados anteriormente (uint8,logical o double).

De esta forma, el tipo de dato atribuido a la matriz de A será convertido al tipo de dato de-

signado por tipo_de_dato y se almacena en la matriz B.

La función im2uint8(A) indaga el tipo de dato de la imagen de entrada y realiza, a

partir de este, las operaciones necesarias para convertirla al intervalo de valores definidos

en uint8.

A continuación se presenta un ejemplo de la aplicación de este comando a una matriz

A de dimensión 2 × 2.

A = [−0,265 0,845 1 0]

MatLab genera:

A =
-0.26 0.84
1.00 0

52
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

Si se desempeñara la conversión se escribiría B=im2uint8(A) se tiene:

B =
0 215
255 0

Note que al menor valor de A se le asigna un 0 y al mayor un 255 estos valores corres-

ponden al mínimo y máximo del formato uint8.

2.2.6. Operaciones con Matrices

Con frecuencia es necesario realizar operaciones que engloben la totalidad de los ele-

mentos de la imagen, por ejemplo encontrar el píxel de valor máximo o mínimo represen-

tado en una imagen.

Para la matriz B definida por


 
 1 12 33
 
 
B=
14 15 6 

 
 
47 18 9

con el comando max(B) se obtendrá el máximo valor de cada columna.

ans =
47 18 33

Luego al utilizar la forma concatenada max(max(B)) se obtiene el máximo valor

global de la matriz B.

ans =
47

53
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

Las estructuras de control se basan en una serie de condiciones lógicas que permiten

cambiar el flujo de las operaciones en un programa, tales estructuras no son únicas de pro-

grama MatLab, más bien son consideran con la raíz de cualquier lenguaje de programación.

El cuadro 2.2 presenta las principales estructuras de control en el ambiente MatLab.

Cuadro 2.2: Estructuras de control en la programación de MatLab

Estructura Descripción

if if, en conjunción con else y else if, ejecutan una serie de

instrucciones basados en si una determinada condición lógica

for Ejecuta un conjunto de instrucciones un determinado número de veces

while Ejecuta un conjunto de instrucciones un determinado número de veces

tanto una condición lógica se cumpla

break Termina la ejecución de un ciclo for o while

continue Pasa del control al siguiente ciclo for saltando las instrucciones

restantes del cuerpo de ciclo

switch ... case Ejecuta diferentes grupos de instrucciones dependiendo del valor de

una variable asignada a switch

54
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

2.2.7. Operaciones Morfológicas

Las operaciones morfológicas se realizan sobre imágenes binarias basadas en formas.

Estas operaciones toman como entrada una imagen binaria regresando como resultado una

imagen también binaria. El valor de cada píxel de la imagen binaria obtenida por una ope-

ración morfológica es basado en el valor del correspondiente píxel de la imagen original y

de sus vecinos. Entonces eligiendo apropiadamente la forma de los vecinos a considerar,

puede construirse operaciones morfológicas sensibles a una forma en particular (Valdemar

& Zaldivar, 2010).

Las principales operaciones morfológicas son la dilatación y la erosión. La dilatación

corresponde con la idea intuitiva de ensanchamiento o de añadir una capa de píxeles a la

estructura de la imagen. La dilatación es controlada por medio de una figura denomina-

da estructura de referencia (o en algunos casos elemento estructural)(Cuevas, Zaldivar &

Pérez. 2010).

Esta operación es definida en la notación de conjuntos de puntos como

I ⊕ H = {(x′ , y ′) = (x + i, y + j)| (x′ , y ′) ∈ PI ; (i, j) ∈ PH }

Como se aprecia en la ecuación anterior, el conjunto de puntos que constituyen la di-

latación de la imagen I y la estructura de referencia H, quedan definidos por todas las

posibles combinaciones de los pares de coordenadas de los conjuntos de puntos PI y PH .

(Cuevas et al., 2010).

La erosión se considera como la operación cuasi-inversa de la dilatación, la cual expre-

55
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

sada en la notación de conjuntos de puntos es definida como

IΘH = {(x′ , y ′) |(x′ + i, y ′ + j) ∈ PI (i, j); ∀(i, j) ∈ PH }

La expresión anterior muestra que para cada punto (x′ , y ′) de la imagen, el resultado

de la aplicación de esta operación morfológica está compuesto por los puntos (x′ , y ′) para

los cuales todos los posibles valores (x′ + i, y ′ + j) que se encuentran en I. (Cuevas et al.,

2010).

En MatLab las funciones utilizadas para realizar estas dos operaciones morfológicas

son erode y dilate y el formato de estos comandos es


X=erode(X,se) y Y=dilate(Y,se)

donde X, Y son las imágenes y se el elemento estructural.

A continuación se presentan unas aplicaciones de las funciones dilatar y erosionar:

Figura 2.6: Ejemplo de dilatación

Cuevas et al. (2010) señalan que las operaciones de dilatación y erosión no pueden

ser consideradas en el sentido estricto inversas, debido a que no es posible reconstruir

56
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

completamente una imagen erosionada, mediante la aplicación sucesiva de dilataciones, lo

mismo aplica en sentido inverso. Sin embargo, presenta una estrecha relación dual, ya que

una dilatación de los píxeles con valor de 1 de una imagen puede llevarse a cabo realizando

una erosión del fondo o de los píxeles en cero. Para efectos del algoritmo que se desarrollar

en esta investigación esta última característica es de suma importancia y aplicación.

Figura 2.7: Ejemplo de erosión

2.2.8. Otras funciones

En esta sección se describen y ejemplifican algunas funciones adicionales que se han

utilizado para el desarrollo del algoritmo.

find Esta función devuelve los índices donde las entradas de una matriz A son distintas

de cero.

Dada tiene una matriz A particular, la ejecución del comando [I,J]=find(A) se

obtiene dos vectores: el vector I da la componente i y el vector J da la componente j

57
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

donde la entrada ai,j de A es distinta de cero.


A = I = J =
0 0 1 2 1
1 0 0 3 1
0 0 1 1 3
3 3

imfill Esta función rellena huecos en una imagen. La figura 2.8 muestra la aplicación

de esta función

Figura 2.8: Aplicación de la función imfill

bwlabel Esta función realiza un etiquetado de los componentes existentes en la imagen

binaria, lo que puede considerarse una forma de averiguar cuántos elementos (considerando

como conglomerados) están presentes en la imagen. En la figura 2.9 se muestra el efecto

de esta función.

Las funciones cart2pol y pol2cart son utilizadas para pasar de coordenadas

cartesianas a rectangulares y de rectangulares a cartesianas, respectivamente. Sus sintaxis

es

58
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO

Figura 2.9: Aplicación de la función bwlabel

[TH,R]=cart2pol(X,Y) y [X,Y] = pol2cart(TH,R)

donde (X, Y ) son las componentes rectangulares y en coordenadas polares T H y R co-

rresponde a la componentes angulares y radiales, respectivamente.

La función sort realiza un ordenamiento ascendente de los elementos de un vector X.

Su sintaxis es

[Y,i]=sort(X)

devuelve el vector ordenado Y , y un vector i con las posiciones iniciales en X de los

elementos en el vector ordenado Y .

mean es una función que devuelve el valor medio de los elementos de un vector X.

Con la función graythresh se determina un umbral de la imagen X de modo que

al aplicar dicho umbral se genera una imagen Y en blanco y negro según los valores de la

imagen original X. En la figura 2.10 se muestra su aplicabilidad.

59
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO

Figura 2.10: Aplicación de la función graythresh

60
61

Capítulo 3

MARCO METODOLÓGICO

3.1. Tipo de Investigación

Puesto que el fin primordial de este proyecto es la creación de un sistema inteligente

que permita la detección y seguimiento del ácaro V. Destructor, en poco tiempo y con

alta eficiencia, esta investigación tuvo como pilar principal los ensayos, evaluaciones y

correcciones de algoritmos alternativos utilizados para dicho propósito.

En términos generales, la metodología planteada se orientó hacia un diseño de trabajo

experimental. Según Briones (2002):


En las investigaciones experimentales el investigador tiene el control de la variable

independiente o variable estímulo, la cual puede hacer variar en la forma que sea

más apropiada a sus objetivos. De igual manera, puede controlar la conformación

de los grupos que necesita para su estudio(p.37).

Estas consideraciones se ajustan de manera adecuada a la propuesta de este proyecto.


3.2. CAPTURA DE VIDEO CAPÍTULO 3. MARCO METODOLÓGICO

A groso modo, la estrategia seguida incluyó la obtención de información (videos e iden-

tificación de modelos matemáticos sobre métodos de procesado de imágenes), creación del

algoritmo (esto involucra desde la elección de las técnicas más adecuadas según lo obje-

tivos perseguidos hasta la implementación, revisión y corrección del mismo), evaluación

del algoritmo (desde varias aristas: eficiencia, uso de memoria, precisión, valoración de un

biólogo especialista) y una etapa final que consistió en la automatización del proceso para

ser trasferida a otras situaciones similares.

El diseño de trabajo se guió básicamente por las etapas:

3.2. Captura de Video

Para esta etapa inicial se contó con la colaboración del CINAT pues biológicamente es

de mucho interés el comportamiento del ácaro en el periodo de pupa de la abeja melífera.

Los videos corresponden a varios días de filmación y por costumbre de los expertos del

CINAT, además es una forma de compresión, la captura se realizó en un formato acelerado.

Es importante señalar que esta forma de grabación (3 frames por segundo) dificultó el

trabajo de procesado pues los videos no son de la mejor calidad y resolución, sin embrago es

una ventaja enorme para hacerlos registro del comportamiento del ácaro de forma manual

(como se realizan actualmente en el CINAT).

Para que el video pudiese ser trabajado en MatLab es necesario que este tenga un for-

mato específico. Por tanto, la etapa siguiente fue la conversión del video original a formato

62
CAPÍTULO 3. MARCO METODOLÓGICO 3.3. PROCESADO DE IMÁGENES

.avi y la toma de una muestra de pocos segundos en las que se hicieron las pruebas de los

algoritmos que se crearon. Para lograr superar esta etapa se utilizó software libre disponible

en Internet.

3.3. Procesado de Imágenes

Es la etapa de mayor trabajo pues incluye desde la selección de los métodos más ade-

cuados para la resolución del problema que nos ocupa, la implementación, análisis, correc-

ción, hasta la evaluación de los resultados obtenidos por el algoritmo. Como sub etapas se

enumeran:

3.3.1. Determinación de técnicas para la detección y seguimiento de

objetos

Con un análisis detallado de estudios realizados con problemas afines (detección de

objetos abandonados en aeropuertos, conteo y seguimiento de automóviles en carretera,

determinación de características en rostros humanos, entre otros) se valoraron los méto-

dos y técnicas de detección, seguimiento y registro que se adecuaban de forma idónea al

tratamiento digital del video del ácaro.

63
3.3. PROCESADO DE IMÁGENES CAPÍTULO 3. MARCO METODOLÓGICO

3.3.2. Implementación del procesado de video en una muestra

Dada la elección previa de los métodos y técnicas más adecuadas se procedió a la

creación del algoritmo para el problema particular de detectar y seguir el ácaro. Con la

versión previa se hicieron implementaciones en una porción del video de algunos segundos,

con esto se tuvo una primera aproximación sobre la efectividad del algoritmo.

En esta etapa es importante señalar que el algoritmo propuesto no es una transmisión

de alguno utilizado en un problema afín, lo que se hizo fue utilizar algunas ideas, cuyos

efectos ya han sido estudiados, analizarlas, complementarlas, combinarlas y crear de esta

forma un algoritmo con matices innovadores y con completa afinidad al problema que nos

ocupa.

3.3.3. Evaluación del algoritmo

Aunque la evaluación del algoritmo está presente en todo el proceso, se establece como

una etapa, pues marca el avance hacia un estadio superior del proceso o establece el pun-

to donde se hace necesario echar la mirada atrás y revalorar el camino recorrido. Con la

implementación del algoritmo se determinó, en primera instancia, si éste cumplía con los

requerimientos establecidos en los objetivos trazados. Cuando se logra esto, se procede a la

implementación de un sistema automático basado en el algoritmo propuesto, si no se anali-

za la posibilidad de introducir mejoras, sustituir las técnicas utilizadas o bien complementar

el algoritmo.

Para determinar si el algoritmo satisface las expectativas y si es eficiente, se consideró

64
CAPÍTULO 3. MARCO METODOLÓGICO 3.3. PROCESADO DE IMÁGENES

en primera instancia probarlo en una muestra del video y posteriormente someterlo a la

consideración técnica de expertos (colaborador de la Universidad de Las Palmas, Gran

Canaria) y la valoración de los colaboradores del CINAT.

3.3.4. Implementación de sistema inteligente

Cuando el algoritmo fue considerado eficiente, robusto y acorde a las demandas traza-

das en los objetivos de esta investigación, se inició la creación de un sistema automático

para lograr la implementación en situaciones similares. Es decir, el sistema es tal que fun-

cione para cualquier video que el CINAT necesite detectar y seguir los movimientos del

ácaro. Además, se incluyeron algunas frases en la interfase de MatLab, que permite al

usuario un uso efectivo, sin demandar conocimientos en programación.

65
66

Capítulo 4

DISCUSIÓN Y ANÁLISIS

Para discutir los resultados obtenidos en el proceso de investigación se muestra la evolu-

ción natural del algoritmo y el análisis surgido por la superación de cada etapa. Se presenta

el proceso de obtención y lectura del video sobre el que se realizó el trabajo, las etapas de

programación (determinación de la zona activa de movimiento, características del ácaro,

detección y seguimiento) y por último se expone el proceso de validación utilizado para

determinar la robustez del algoritmo.

4.1. Obtención y Lectura de Video

El proceso completo de trabajo que implicó la construcción, ejecución, análisis y valo-

ración del algoritmo para la detección y seguimiento del ácaro V. Destructor inició con la

tarea de obtener el video y poderlo implementar en MatLab. Esta fue una etapa lenta, en la

cual se debió echar mano de algunos software libres disponibles en la red e investigar sobre
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS4.1. OBTENCIÓN Y LECTURA DE VIDEO

la conversión de videos para trabajo en MatLab.

El CINAT ponía a nuestra disposición dos videos en formato VHS en los que se regis-

traba la presencia del ácaro. Se decidió trabajar con estos videos principalmente por dos

razones: aprovechar el registro manual disponible en el CINAT y el hecho de ser un video

de trabajo real. Ya se ha mencionado que los investigadores del CINAT dedican muchas

horas en observar el video y estudiar el comportamiento del ácaro; la automatización de

procesos de detección y seguimiento en estos videos sería un importante apoyo.

Los investigadores del CINAT se encargaron de la conversión del video a formato DVD

para poder ser leídos en las computadoras, sin embargo el software para tratamiento de

imágenes que se utilizaría no soporta este formato. Se debía entonces, convertir los videos

a formato .AVI y además hacer cortes para las pruebas preliminares del algoritmo y para la

etapa de validación.

La conversión a formato .AVI se realizó con el software libre Hamster Video Converter

disponible en Internet. Este programa, entre otras aplicaciones, permite hacer cortes de

video y conversiones en varios formatos.

A pesar de la versatilidad de este software no fue posible la lectura de los videos en

MatLab pues estos debían estar en un formato .AVI descompresionado. Esto resultó ser un

problema importante pues lo común es que los convertidores generen videos comprimidos

pues la ganancia en tamaño es considerable. Con una exhaustiva investigación se determinó

que el video debía tener formato especial denominado RAW (código abierto denominado

Formato de Imagen sin Modificaciones que contiene la totalidad de los datos de la imagen,

67
4.2. ZONA ACTIVA DE MOVIMIENTO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

tal y como ha sido captada por el sensor digital de la cámara) y se logró la conversión de

los cortes a un formato compatible con MatLab.

Para esto fue necesaria la utilización de otro software libre llamado FFMPEG y la

ejecución de la línea de comando siguiente

c:/>ffmpeg -i corte.avi -vcodec rawvideo Control.avi

En la anterior línea de comando corte.avi corresponde al nombre del archivo con formato

.AVI, obtenido de la conversión con Hamster Video Converter, por otra parte, Control.avi

es un archivo nuevo creado a partir de corte.avi pero con formato RAW. Con esto los videos

están listos para ser utilizados en MatLab.

El comando mov=aviread(’Control1.avi’) permite cargar y leer el vídeo en

MatLab para su manipulación.

La información del video, como tamaños, velocidad de reproducción y otros datos im-

portantes del vídeo, se obtienen con la ejecutando el comando peli=aviinfo(’Control1.avi’).

Con el video cargado y la información del mismo a mano, se procede con la primera

etapa del algoritmo que es la obtención automatizada de la zona de trabajo.

4.2. Zona Activa de Movimiento

4.2.1. Descripción del escenario inicial

El escenario lo constituyen todas las componentes presentes en el video y la interacción

entre ellas. Hay componentes estáticas como el tapón, la celda y el código de video, así

68
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.2. ZONA ACTIVA DE MOVIMIENTO

como componentes dinámicas que la conforman ácaro, la pupa de la abeja, el cronómetro

y la fecha, esto se ilustra en la figura 4.1.

La imagen en la figura 4.1 es cargada en MatLab como una hipermatriz I = (704, 480, 3).

Cada secuencia de video, por tanto, estará conformada por cientos de matrices de igual di-

mensiones.

Figura 4.1: Descripción del escenario

Es importante señalar que uno de los principales problemas que enfrentó la elabora-

ción del algoritmo fue la calidad del vídeo. La resolución de la cámara utilizada no fue la

más adecuada, de hecho hay momentos que ni el investigador experto del CINAT puede

identificar que es ácaro y que no.

El tapón que se utiliza para sellar la celda y el ácaro son de color muy similar, esto

provoca detecciones erróneas en un método basado en discriminación en color, para esta

investigación este hecho se constituyó en un verdadero reto.

69
4.2. ZONA ACTIVA DE MOVIMIENTO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

4.2.2. Detección de la Z.A.M

Para la detección y seguimiento del ácaro hay zonas del video que no son útiles, por lo

tanto, se considerado como zona de trabajo aquella donde se presente movimiento, a esta

se le denomina Zona Activa de Movimiento(Z.A.M).

La obtención de la Z.A.M se puede considerar como la primera etapa del algoritmo y una

de las más interesantes desde el punto de vista del manejo de herramientas computacionales

y matemáticas.

En un primer intento para hacer la detección de la Z.A.M se hizo un recorte a conve-

niencia de la hipermatriz I. Con las dimensiones conocidas de I se hacen recortes por filas

y columnas (a lo largo y ancho) generando al final una nueva hipermatriz Z.A.M de menor

dimensión que I. En la Z.A.M se han excluido los numerales y la fecha, con esto se redu-

ce número de cálculos y no se considera el movimiento acelerado en el marcador de mili

segundos. En la figura 4,2 muestra el recorte

Figura 4.2: Primera detección de la Zona Activa de Movimiento

El tapón que se utiliza para sellar la celda y el ácaro son de color muy similar, esto

70
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.2. ZONA ACTIVA DE MOVIMIENTO

provoca detecciones erróneas en un método basado en discriminación en color, para esta

investigación este hecho se constituyo en un verdadero reto.

Dada esta situación se tomó la decisión de crear un algoritmo que realizara la detección

de forma automatizada e independiente de la posición de la cámara.

Para detectar movimiento se considera una sucesión definida por recurrencia a partir de

frames en escala de grises.

I0 , I1 primer y segundo frame, luego

In = |In−1 − In−2 |; 3 ≤ n ≤ NumF rames

Con la diferencia en valor absoluto, y en el entendido que 0 es la matriz nula, se tienen

las siguientes posibilidades:

1. Si In = 0, no hubo movimiento entre el frame In−1 e In−2

2. Si In 6= 0,hubo algún cambio (movimiento) entre el frame In−1 e In−2

La figura 4.3 se presenta una secuencia con los frames originales y éstos con la aplica-

ción del algoritmo.

Note que de la posición k a la k+1 hubo un pequeño movimiento del ácaro, por tanto, la

zona descrita en blanco (zona de movimiento) se denota diferente en ambos casos, mientras

que de la posición k + 1 a la k + 2 el movimiento fue muy leve por lo que se registra menos

zona en blanco en relación a la anterior.

Donde si hay constante movimiento es en el contador de mili segundos que presenta el

vídeo, esto hace que en ese sector haya mayor estabilidad de blanco.

71
4.2. ZONA ACTIVA DE MOVIMIENTO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

Figura 4.3: Detección de movimiento

El siguiente paso sería identificar donde hubo mayor movimiento en el corte. En la

figura 4.4 se presenta el código y la zona del corte 1 donde hubo mayor movimiento.

Una vez determinada la Z.A.M lo que queda es pulir todas sus partes con el propósito

de encontrar el contorno de dicha zona, para ello se siguen una serie de procedimientos que

describimos en seguida.

Con el comando imfill se rellena la Z.A.M de tal forma que se generar zona compacta,

es decir, que no aparezcan puntos negros sobre la zona de blanco. Se decide señalar algunas

zonas sobre un mismo frame antes y después de aplicar el comando para ilustrar el efecto

que se genera, note como los puntos dispersos en la zona original desaparecen en la nueva

imagen. Ver figura 4.5

Una vez rellenada la Z.A.M se procede a suavizar el contorno, para ello se aplican opera-

ciones morfológicas. El proceso consiste en dilatar la zona, aplicar un elemento estructural,

rellenar los huecos y posteriormente se contrae a su estado normal la imagen dilata.

72
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.2. ZONA ACTIVA DE MOVIMIENTO

Figura 4.4: Zona de mayor movimiento en el corte 1

En este caso el elemento estructural que se ha aplicado tiene forma rectangular. En el

algoritmo se consideró aplicar 9 veces dicha estructura. Esta composición de transforma-

ciones se ilustra con la sucesión:






 es elemento estructural


 Izam0 (es) aplicar elemento estructutar (es) sobre la matriz I de Z.A.M




 Izamn = Izamn−1 (es) si 1 ≤ n ≤ 9

En este proceso es notorio el trabajo que genera la aplicación morfológica del elemento

73
4.2. ZONA ACTIVA DE MOVIMIENTO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

Figura 4.5: Relleno de la Z.A.M

estructural (ver figura 4.6). Es de esperar que si se sigue aplicando esta operación de forma

sucesiva la Z.A.M se transforma en un rectángulo, para fines de la investigación no es lo

que se desea, por lo que una iteración de nueve composiciones es suficiente para generar

zonas suavizadas (sin picos).

Posterior a esto se genera una compresión de la nueva región Z.A.M y de nuevo se

rellenas huecos por si acaso se generan puntos no deseados dentro de la región de interés.

La compresión de la región se realiza aplicando el comando imerode y los resultados

que se presentan en la figura 4.7.

En la figura 4.7 se ha marcado con plechas las regiones que no tiene interés para la de-

tección del ácaro y con una estrella la región donde está el ácaro. Esta última es considerada

la región de interés para los fines de este proyecto.

La idea es crear un mecanismo que descarte las regiones con flecha y considere sólo

la región con estrella, para esto hemos utilizado un etiquetador de regiones, el comando

74
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.2. ZONA ACTIVA DE MOVIMIENTO

Figura 4.6: Operaciones Morfológicas sobre Z.A.M. (1)

bwlabel es muy útil para estos fines.

Una vez aplicado el etiquetador se tienen todas las regiones de la Z.A.M identificadas,

con esto podemos eliminar las regiones que no interesan y quedarse únicamente con la zona

de movimiento del ácaro. La estrategia consistió en contar el número de etiquetas para cada

zona y elegir donde éste es mayor (esto equivale a la zona de mayor área.)

La figura 4.8 muestra la aplicacion del algoritmo de eliminación de regiones no desea-

75
4.2. ZONA ACTIVA DE MOVIMIENTO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

Figura 4.7: Operaciones Morfológicas sobre Z.A.M. (2)

das.

Figura 4.8: Eliminación de zonas no deseadas

Con el propósito de ilustrar la Z.A.M sobre un frame del video original se decidió de-

terminar su contorno o frontera. Para esto se necesita conocer las coordenadas x, y de los

76
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.2. ZONA ACTIVA DE MOVIMIENTO

puntos que lo definen. El comando tt find generaría una serie de coordenadas rectangulares

desordenadas, esto dificultaría el trazo y la determinación de la zona rectangular de trabajo.

Se sugiere detectar los puntos del contorno mediante coordenadas polares ubicando el polo

en el centro de masa de la región en blanco mostrada en la figura 4.8, de esta forma nos

garantizamos que cada punto del contorno esté ordenado mediante su componente angular.

La figura 4.9 da una idea gráfica de este proceso.

Figura 4.9: Idea intuitiva de la transformación de puntos del contorno a coordenadas polares

Los puntos en coordenadas polares se vuelven a transformar a rectangulares ya ordena-

dos, y con esto se genera el trazo del contorno de la Zona Activa de Movimiento.

En la figura 4.10 se presenta el código de los procesos descritos en la parte anterior, así

como una ilustración de su aplicación.

La adecuada determinación de la Z.A.M tiene implicaciones como la eliminación de

cálculos innecesarios al reducir la zona de trabajo del algoritmo a la región de interés, el

filtrado de ruido que podría interferir negativamente en el proceso de detección y por tanto

77
4.3. IDENTIFICACIÓN DEL ÁCARO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

Figura 4.10: Detección de la Zona Activa de Movimiento

el aumento en la eficiencia del algoritmo.

Tomando como base el trabajo realizado anteriormente, se puede ahora realizar un aná-

lisis semejante para detectar el contorno el Ácaro V. Destructor.

4.3. Identificación del Ácaro

Para la identificación del ácaro, se estudiaron algunas de sus características, como lo

son: la forma , el área, y la variabilidad en relación a la forma.

La estrategia implementada se desarrolla en las siguientes etapas:

1. Es necesario introducir una pequeña cantidad de frames donde se cuente con la pre-

sencia del ácaro en su forma más representativa, el software de forma automatizada

le presenta al usuario una serie de frames con su respectivo número. El usuario los

78
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.3. IDENTIFICACIÓN DEL ÁCARO

escoge . En la figura 4.11 se presenta una muestra de lo descrito.

Figura 4.11: Identificación de ácaro

2. Matlab le solicita al usuario que introduzca los frames seleccionados. Ver figura 4.12.

Figura 4.12: Selección de frames para la identificación del ácaro

3. El procesado que se utiliza para definir el ácaro es similar al utilizado para identificar

la Z.A.M. El código y resultados se presentan en la figura 4.13.

4. Como parte de la caracterización del objeto ácaro, se incluye un estimador de su área

(parámetro de forma) y su variabilidad mediante la varianza. La figura 4.13 presenta

79
4.3. IDENTIFICACIÓN DEL ÁCARO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

Figura 4.13: Contorno del Ácaro V. Destructor

el código y una aplicación de ésta etapa.

Figura 4.14: Cálculo de Área y Varianza

Con la implementación de los descriptores del ácaro se enrique la robustez del algoritmo

pues serían un complemento determinante en situaciones de comportamiento atípico. Es

decir, si la detección se ve afectada por el movimiento desordenado, presencia de ruido o

ausencia de movimiento, se dispone de la información del área y la variabilidad del objeto

de interés para utilizarlo como elemento discriminador del ácaro respecto a otros objetos o

80
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.4. SEGUIMIENTO DEL ÁCARO

sombras presentes en el video.

4.4. Seguimiento del Ácaro

La primera tarea propuesta para esta etapa fue el resaltar el ácaro de todas las demás

formas que aparecen en la escena. El reto consistía en implementar una rutina que recono-

ciera qué partes de cada imagen corresponde al fondo de la escena, cuáles son cambios de

luz, la pupa, el tapón de la celda y las descartara, de ese modo lo que quedaría en la imagen

correspondería al ácaro. Se consideró que la técnica de supresión de fondo por diferencias

sería una buena alternativa, sin embargo la simple diferencia de un frame con el siguiente

rápidamente llevaría a matrices nulas que entorpecerían la detección del objeto de interés.

Para lograr el realce que se necesita y evitar en buena medida la generación de imá-

genes vacías se implementó la construcción de una hipermatriz fija determinada por una

asignación de pesos en los tres primeros frames, luego se definió un sucesión recurrente

que actualiza lo que sería el fondo de cada imagen y así por diferencia se ubicaría el ácaro.

La idea que acaba de mostrarse puede resumirse de la siguiente forma. Se construye


1
la matriz H = (λ3 F3 + λ2 F2 + λ1 F1 ) donde F1 , F2 , F3 son los primeros tres frames de
3
la secuencia de videos y λ1 , λ2 , λ3 son proporciones fijas asignadas a cada frame de modo

que λ1 + λ2 + λ3 = 1, luego se definen las hipermatrices Fn−1 = [|fijk − 255|]n donde los

subíndices i, j, k determinan las entradas f en cada uno de los n frames de la secuencia de

video. Es importante notar que las hipermatrices F −1 son opuestas a las hipermatrices F

81
4.4. SEGUIMIENTO DEL ÁCARO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

en el sentido que los colores cercanos a negro en F (entradas cercanas a 0) son cercanos a

blanco en F −1 (entradas cercanas a 255) y viceversa.

Con esto se define la sucesión que determina la actualización del fondo del video



 H1 = H

{Bn } =

 Hn = µ1 Hn−1 + µ2 Fn−1 , n > 1

con µ1 , µ2 son pesos fijos asignados. Con la sucesión {An = |Fn−1 − Bn |} se destaca la

forma que corresponde al ácaro. En este momento sólo falta transformar las hipermatrices

An a hipermetrices en blanco y negro que llamaremos BNn (para esto se utiliza el comando

im2bw). La figura 4.15 muestra el efecto que tiene este proceso en algunos frames de uno

de los videos de prueba.

Un aspecto que no puede obviarse es el uso de umbrales en comandos como im2bw, esta

condición tiene pro y contras. Como contras podría citarse el hecho que requiere manipu-

lación y alguna experiencia para poder implementarlos de forma adecuada. Sin embargo,

los pro son más valiosos. Con la determinación del umbral adecuado para los objetivos

trazados en una imagen determinada los resultados son excelentes, además el umbral que

funcione para la totalidad de las imágenes que deben ser procesadas será uno cercano al

implementado en el frame de control.

En esta rutina en particular se fijó un umbral de forma semiautomática: se combinó el

comando graythresh con un parámetro fijado por los investigadores. Los resultados se

puede apreciarse en la figura 4.15.

El problema de la generación de imágenes vacías por la ausencia de movimiento aún

82
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.4. SEGUIMIENTO DEL ÁCARO

Figura 4.15: Efecto de la aplicación de la sustracción de fondo a partir de la matriz histórica

no se ha solventado totalmente. Este problema se aprecia en las últimas dos iteraciones

mostradas en la figura 4.15.

Para solventar la problemática de imágenes vacías debidas a la ausencia de movimiento

se ideó implementar un proceso que combina la supresión de fondo por umbral con la

83
4.4. SEGUIMIENTO DEL ÁCARO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

estrategia anterior. Es decir, si la estrategia anterior no encuentra al ácaro porque este no se

mueve, el sistema cambia de estrategia y entra en juego la identificación por umbral.

Es importante recalcar que la identificación por umbral se planteó como segunda posi-

bilidad de detección pues es común que se identifiquen sombras con colores similares al

ácaro o, contrariamente, se pierda información de la forma del ácaro si se emplea un umbral

alto. Por supuesto si la detección de Z.A.M logra aislar los objetos con luminosidad similar

al ácaro la detección sería perfecta.

Más en detalle, la idea consistió en identificar en negro las zonas que satisfacen las

condiciones de un umbral determinado (estas imágenes serán denominadas N).

También, se definió la hipermatriz Nn−1 = [|nijk − 1|]n con lo que se tiene la misma

identificación pero en blanco. La figura 4.16 muestra el efecto de este proceso en los mis-

mos frames de la figura 4.15.

Con la combinación de la rutina de la matriz histórica y la detección por umbral se

redactó una rutina que crea dos conjuntos de datos: ND: las coordenadas de los puntos

negros detectados en Nn y BD: las coordenadas de los puntos blancos identificados en

BN ∩ B, calcula los baricentros de estos conjuntos y los pinta (si corresponde) de color

rojo.

En este momento es importante aclarar un par de detalles. Primero, en el conjunto BD

se considera la intersección de BN con B pues aunque en la figura 4.16 da la impresión de

no ser necesario, se debe evitar que B introduzca elementos que no son ácaro que se hayan

infiltrado por la aplicación de la detección por umbral. Segundo, si resulta que BD = ∅.

84
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.4. SEGUIMIENTO DEL ÁCARO

Figura 4.16: Efecto de la aplicación de la sustracción de fondo por umbral

hay dos posibilidades: el ácaro no se esta moviendo o bien salió de escena (esto sería

ND = ∅ ).

El seudocódigo para esta proceso es:

La figura 4.17 ilustra los resultados BN y N de algunos de los frames trabajados en los

85
4.5. PROCESO DE VALIDACIÓN CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

figuras 4. 15 y 4. 16 y los correspondientes frames del video original con el punto rojo que

determina la detección (F D). Nótese que los frames donde la primera estrategia se perdía

ahora están perfectamente detectados.

4.5. Proceso de Validación

Para la valoración de la eficiencia y confiabilidad del algoritmo se utilizaron dos crite-

rios: el juicio de expertos y la implementación del algoritmo en siete cortes de secuencias

de vìdeo independientes del corte utilizado para las pruebas preliminares del algoritmo.

La evaluación del algoritmo por juicio de expertos fue abordada desde dos perspectivas.

Por un lado, el trabajo de programación fue apoyado y avalado por el Dr. Carlos Travieso

González miembro del Instituto para el Desarrollo y la Innovación en Comunicaciones

86
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.5. PROCESO DE VALIDACIÓN

Figura 4.17: Detección de ácaro por medio de la combinación de eliminación de fondo por
matriz histórica y por umbral.

(IDeTIC) del Departamento de Señales y Comunicaciones en la Universidad de Las Palmas

de Gran Canaria, España. Además, las etapas previas y el producto final se sometieron a la

aprobación del Dr. Rafael Ángel Calderón Fallas coordinador del Programa de Patología

Apícola del CINAT en la Universidad Nacional, Costa Rica.

El algoritmo tuvo la aprobación en ambas instancias. Es decir, se satisfacen los reque-

87
4.5. PROCESO DE VALIDACIÓN CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

rimientos técnicos desde el punto de vista del procesamiento de video y programación y

también se cumplieron las expectativas sobre lo que se considera relevante para estudios de

índole biológico.

Además de la valoración de los expertos el algoritmo se corrió en siete cortes de videos

para determinar frame a frame si la detección se considera adecuada o bien evidenciar erro-

res. El cuadro 4.1 muestra el detalle de la muestra de videos seleccionada. Es importante

notar que aunque en primera instancia siete videos parece ser una cantidad muy pequeña

para validar la funcionalidad de un algoritmo en realidad se están trabajando 3354 frames.

Además, los cortes se realizaron con tiempos pequeños porque las computadoras que se

disponen tienen capacidad de procesamiento limitada.

Cuadro 4.1: Detalle de la muestra de videos seleccionada para la valoración de la efectivi-


dad del algoritmo de detección.

Nombre Duración en segundos (S) Números de frames (CF)

Corte1.avi 8 442

Corte2.avi 9 514

Corte3.avi 9 518

Corte4.avi 8 476

Corte5.avi 12 704

Corte6.avi 8 248

Corte7.avi 8 452

Total 58 3354

88
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.5. PROCESO DE VALIDACIÓN

La muestra se tomó de los videos originales proporcionados por el CINAT y sin seguir

ninguna consideración en particular (excepto la extensión por las razones ya comentadas)

por lo que puede considerarse como aleatoria.

Para el análisis estadístico se definieron las variables: AA: Área de ácaro, V A: Varia-

ción de ácaro, D : Detección correcta, DI: Detección incorrecta, ND: No detección, P D:

Porcentaje de detección correcta.

Las variables AA y V A son las salidas del algoritmo tratadas en la sección sobre los

descriptores de las características del ácaro. Para efectos de la validación de la confianza

del algoritmo se consideraron para contrastar las diferencias encontradas en la cantidad de

detecciones correctas, no se incluyen en el tratamiento estadístico.

Las variables D, DI, ND y P D son las principales en el análisis de la efectividad del

algoritmo de detección, por tanto es menester que queden perfectamente determinadas.

Debe entenderse como parte de DI cualquier detección que haga el algoritmo de ob-

jetos que no son el ácaro e incluso las detecciones que se hagan en el contorno del objeto

de interés. De este modo la cantidad de detecciones incorrectas determinan la variable DI.

Ver figura 4.18.

Es importante notar la exigencia que se está solicitando al algoritmo, eso se traduce en

que la proporción de éxito que se obtenga es la menor posible. Es decir, si se considerara

una detección de contorno como correcta, los éxitos serían necesariamente mayores.

Se define la variable ND como la totalidad de frames donde el ácaro es visible (a la

vista humana) pero el sistema no es capaz de detectarlo. La figura 4.19 muestra casos donde

89
4.5. PROCESO DE VALIDACIÓN CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

Figura 4.18: Ejemplos de detección incorrectas (DI)

el ácaro apenas es perceptible por el ojo humano y el algoritmo no fue capaz de detectarlo.

Figura 4.19: Muestras de omisiones en la detección (ND)

Debe destacarse el hecho que las no detecciones se deben principalmente a la poca

resolución del video, esta hace que el color del ácaro no pueda apreciarse con claridad si

éste está en posición lateral o en ocasiones sin ningún motivo el color cambia en el video.

Con estas consideraciones para las variables DI y ND se define la variable detección

correcta como D = CF − (DI + ND), que corresponde a la cantidad de frames donde la

detección se ha considerado adecuada. Para el cálculo de los promedios de éxito en cada


D
corte se definió la variable porcentaje de detección correcta como P D = ∗ 100.
CF
En el cuadro 4.2 se presentan los porcentajes de éxito por cada corte analizado.

Para tener un estimador de la proporción de éxito general del algoritmo (PEGA) se

90
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.6. COMENTARIOS DE CIERRE

Cuadro 4.2: Distribución de porcentajes de detección correcta por corte de control.

Nombre CF PD

Corte1.avi 442 98.19

Corte2.avi 514 90.02

Corte3.avi 518 90.90

Corte4.avi 476 92.86

Corte5.avi 704 95.60

Corte6.avi 248 95.96

Corte7.avi 452 91.50

calculó un promedio ponderado de los P D según CF en cada corte, es decir:

Σ7i=1 (CF )i (P D)i


P EGA =
Σ7i=1 (CF )i

Con los datos que se han presentado se tiene que el PEGA es de 93, 75 y haciendo

una estimación por intervalo se tiene que con una confianza del 95 % el porcentaje real de

detección exitosa del algoritmo oscila entre 92, 93 % y 94, 57 %.

4.6. Comentarios de Cierre

Las estrategias utilizadas para la conversión de video a formato .AVI, determinar la

Z.A.M, caracterizar el ácaro en las secuencias de imágenes, detectarlo y seguirlo han cum-

91
4.6. COMENTARIOS DE CIERRE CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS

plido las expectativas de muy buena forma. Según los datos mostrados la eficacia de la

detección y el seguimiento no es del 100 % y esto merece algunas líneas para aclarar cual-

quier duda razonable.

Cuando un programador es contratado por una empresa para desarrollar algún software,

es la misma empresa la que especifica las demandas que debe satisfacer el producto final.

Claro, si el programa debe calcular inversiones de capital, llevar registros de ventas o invo-

lucra aplicaciones comunes la demanda es del 100 % de eficiencia, aún así estos programas

comunes son falibles.

Nuestro caso particular es mucho más complejo. Para empezar no tiene nada de común,

involucra una cantidad impresionante de cálculos y la exigencia que le impusimos es alta.

Un usuario podría argumentar que sería más eficiente la detección por el ojo humano, se

muestran algunas cuestiones por considerar.

Una secuencia de video como la utilizada corre 24 frames en un segundo, es decir el ojo

humano debería poder registrar y valorar la detección en 24 imágenes cada segundo. Ade-

más, para que el ojo humano detecte las fallas que se están considerando en este proyecto

deberían suceder en frames consecutivos, de no ser así no se apreciarían.

Por otra parte, dada la revisión exhaustiva de cada frame que se realizó y el análisis de

las estrategias utilizadas se tiene claro cuáles son las causas de las detecciones incorrectas u

omisiones. Principalmente se debe a la calidad deficiente de la resolución de los videos y a

comportamientos atípicos del ácaro como mantenerse quieto por mucho tiempo y cercano

a la tapa. Además, se determinó que con calibraciones de los umbrales se pueden corregir

92
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.6. COMENTARIOS DE CIERRE

esos errores, sin embargo, para los alcances de este proyecto se presentan los datos del

algoritmo sin modificaciones implementado en los 3354 frames muestreados.

En síntesis, hay errores de detección en algunos frames pero se tienen identificados las

causas de estos y las estrategias de solución para esos frames particulares. En términos

generales se considera que el algoritmo tiene una robustez muy buena.

93
94

Capítulo 5

CONCLUSIONES Y SUGERENCIAS

5.1. Conclusiones

Los insumos de este proceso de investigación se presentan organizados según la to-

ma del video, las estrategias utilizadas, las herramientas matemáticas implementadas y la

eficiencia del algoritmo propuesto.

Sobre el proceso de toma y lectura de vídeo se concluye que el procedimiento seguido

por el CINAT no fue el más adecuado. Como consecuencia se tiene que la resolución del

video con el que se trabajó no fue la más conveniente y esto afectó la precisión en la

detección del ácaro. Además, capturar el video en formato VHS significó que la tarea de

conversión a un formato que soportara MatLab fue lenta, abonado al hecho que, en dicha

conversión, se pierde información del mismo.

Según la revisión de literatura realizada, se determinó que las estrategias utilizadas


CAPÍTULO 5. CONCLUSIONES Y SUGERENCIAS 5.1. CONCLUSIONES

en la creación del algoritmo y las soluciones a las problemáticas que emergieron en el

proceso son totalmente consecuentes con las propuestas recientes hechas por expertos en el

área de procesamiento de señales. La utilización de umbrales, determinación movimiento

a partir de sucesiones de frames, la incorporación de funciones descriptores de objetos y

los modelos tracking by detection, la detección y seguimiento independiente de la posición

de la cámara, todos estos son ejemplos de estrategias novedosas que están presentes en el

algoritmo que se propone.

Además, se han presentado variantes a las estrategias implementadas como muestras

de la versatilidad de las herramientas matemáticas involucradas. Por ejemplo, la detección

de la Z.A.M en un video de mejor resolución sería más eficiente siguiendo un proceso

invertido.

Aunado a estos resultados se tiene el hecho que la combinación de las técnicas de

detección y seguimiento se establece como un norte prometedor para una amplia variedad

de posibilidades de investigaciones. Como implicaciones inmediatas de la utilización del

centro de masa para identificar y dar seguimiento al ácaro V. Destructor se tienen el registro

de la posición y cálculo de la velocidad de movimiento. Además, las estrategias utilizadas

funcionan como insumos importantes en algoritmos que registren la trayectoria seguida

por el ácaro, identifiquen y predigan comportamientos o bien para el seguimiento de otras

formas en video (personas, vehículos, entre otras).

El logro con relación más directa con el área de formación de los investigadores es

la utilización de herramientas matemáticas en el desarrollo del algoritmo. Es importante

95
5.1. CONCLUSIONES CAPÍTULO 5. CONCLUSIONES Y SUGERENCIAS

destacar que se hace referencia a conceptos matemáticos de alto nivel, es decir, las he-

rramientas utilizadas se ubican en áreas como álgebra lineal, cálculo, métodos numéricos,

estadística y probabilidades con clara transcendencia de los cálculos aritméticos de uso

común, todas estas áreas matemáticas esenciales en el desarrollo de inteligencia artificial.

Con la culminación de esta investigación se evidencia la aplicación de herramientas

matemáticas en la solución de problemas concretos y de importancia científica, social y

económica. Además, se establece un precedente en la necesidad de colaboración entre uni-

dades académicas en la UNA en aras del fortalecimiento de la investigación con impacto

científico y social, lo anterior es una justificante para el incentivo de invertir en investiga-

ciones de esta línea.

Los estudios que involucran procesamiento de señales están en la palestra de las in-

vestigaciones científicas actuales, por lo que se insiste en presupuestar recursos, tanto eco-

nómicos como académicos, para la inclusión de estas líneas de investigación con carácter

continuo y permanente en el quehacer de la Escuela de Matemática. Además, este hecho

haría que la escuela se proyecte como un centro de investigación en un área de actualidad,

para la cual se han evidenciado una amplia gama de problemáticas que pueden abordarse

desde el tratamiento de señales.

Por último, sobre la eficiencia del algoritmo se concluye que la detección y seguimiento

del ácaro es realizada de manera muy satisfactoria. Las pruebas realizadas en 3354 frames

mostraron una efectividad de 93,75 %. Se recalca el hecho que se estableció una exigencia

alta al desempeño del algoritmo, por lo que si las demandas se relajan un poco la efectividad

96
CAPÍTULO 5. CONCLUSIONES Y SUGERENCIAS 5.2. SUGERENCIAS

sería mayor.

Específicamente, se determinó de manera muy eficiente la zona donde el ácaro se des-

plaza a partir de la implementación de una matriz histórica que actualiza frame por frame

el fondo (background) del video. Además, se logró caracterizar el objeto ácaro con dos

medidas (una de forma y otra de variabilidad) y se implementaron herramientas de cálculo

y análisis para la detección y seguimiento del ácaro.

Además, la supervisión del experto en procesamiento de señales y el acompañamiento

del biólogo especialista en investigaciones apícolas se constituyeron en los pilares para la

validación del algoritmo. Con este apoyo se logró satisfacer los requerimientos desde el

punto de técnico y dese la óptica del interés biológico.

5.2. Sugerencias

Como consecuencias de los resultados presentados se hacen algunas sugerencias a los

investigadores del CINAT, los encargados del proyecto institucional Detección, seguimiento

y análisis del comportamiento del ácaro varroa destructor mediante técnicas de procesado

inteligente de video, la Escuela de Matemáticas de la UNA, los docentes de matemáticas

en general y a la comunidad científica.

Al CINAT se sugiere que en futuras grabaciones se mejore la resolución de video para

de esta forma aumentar la eficiencia en las técnicas de detección y seguimiento implemen-

tadas. Además, de ser posible pintar el ácaro o tapar la celda con algún material de color

97
5.2. SUGERENCIAS CAPÍTULO 5. CONCLUSIONES Y SUGERENCIAS

sobresaliente o blanco e iniciar la implementación de lectura de video en directo.

Se recomienda a los responsables del proyecto institucional Detección, seguimiento

y análisis del comportamiento del ácaro V. Destructor mediante técnicas de procesado

inteligente de video considerar la producción de esta investigación como insumo para la

creación del sistema inteligente que describe y reporta los comportamientos particulares

del ácaro. Con este proyecto como referencia, se sugiere analizar las dificultades que hacen

que el algoritmo no tenga el 100 % de efectividad y solventarlas para lograr incrementar la

robustez del algoritmo.

Además, se considera que una estrategia con buenos alcances es la inclusión de los

descriptores del ácaro (forma y variabilidad) para implementar estrategias de predicción de

comportamiento y mejorar los índices de detección efectiva.

A la Escuela de Matemática de la Universidad Nacional, se recomienda fomentar la

realización de proyectos en matemática aplicada de actualidad e interés científico, además

se sugiere seguir con la iniciativa de generar espacios de discusión y actualización en el

campo de la matemática aplicada, con expertos tanto nacionales como internacionales, con

el propósito de crear líneas de investigación con docentes de la Escuela.

Como aporte de este proyecto a la actualización de la malla curricular de la carrera

Enseñanza de la Matemática, de manera muy prudente, se sugiere considerar la inclusión

de un curso optativo sobre procesamiento de señales. Esta iniciativa podría transferirse a

carreras con objetivos afines o bien como especialidades en etapas de posgrado.

Además, la consideración del tratamiento de señales como una línea de investigación

98
CAPÍTULO 5. CONCLUSIONES Y SUGERENCIAS 5.2. SUGERENCIAS

activa de la Escuela de Matemáticas se traduce en una atractiva y novedosa opción para

futuros tesiarios. Con esto, además del enriquecimiento académico de los tesiarios y la

proyección de la Escuela como ente constructor de conocimiento, se colabora con las ini-

ciativas para ofrecer posibilidades de graduación a muchos egresados que aún no satisfacen

el requisito de presentar su tesis.

Por otro lado, se insiste en la necesidad de incentivar la cooperación con otras unidades

académicas en lo referente a estrategias de resolución de problemas de ingeniería o ciencias

que involucren herramientas matemáticas. Se recomienda considerar el presente proyecto

como elemento pilar y catalizador para el establecimiento de propuestas de investigación

interdisciplinarias.

A los docentes de matemática a nivel nacional se recomienda incorporar en sus planea-

mientos las aplicaciones posibles de los contenidos que enseñan en el procesamiento de

señales. Es decir, si se está en un curso de Álgebra Lineal o Cálculo, incluir en las leccio-

nes o al menos comentar, la actual utilidad de ciertas herramientas para detectar, seguir y

reportar objetos como vehículos o personas.

Respetuosamente, se sugiere a los docentes de matemática la lectura de artículos refe-

ridos a procesamiento de imágenes, sonido y video para el enriquecimiento académico del

personal docente. Con esta actividad se tendría un referente para la creación o trasferencias

de ejemplos que puedan formar parte del trabajo en sus aulas.

A la comunidad científica a nivel nacional e internacional se sugiere valorar los apor-

tes de las herramientas matemáticas a solución de problemas cotidianos. De esta forma se

99
5.2. SUGERENCIAS CAPÍTULO 5. CONCLUSIONES Y SUGERENCIAS

estrecharían los lazos de cooperación entre disciplinas diversas para ganancia en la com-

pletitud de los procesos de investigación. Además, se insiste en la necesidad de potenciar

el uso de la tecnología en aras de la investigación con objetivos de mejora de la calidad de

vida humana y recuperación de ambiente.

100
BIBLIOGRAFÍA

Bibliografía
Arredondo, M. (2005). Propuesta de un sistema de vigilancia utilizando la detección de

movimiento en una secuencia de imágenes captadas por cámaras digitales

(Trabajo de graduación, Universidad de San Carlos, Guatemala). Recuperado

de http://biblioteca.usac.edu.gt/tesis/08/08_7037.pdf

Bayona, A. (2009). Detección de objetos abandonados/robados en secuencias de video-

seguridad (Proyecto de fin de carrera, Universidad Autónoma de Madrid,

España). Recuperado de

http://arantxa.ii.uam.es/~jms/pfcsteleco/lecturas/20090921AlvaroBayona.pdf

101
BIBLIOGRAFÍA

Briones, G. (2002). Metodología de la investigación cualitativa en las ciencias sociales.

Programa de Especialización en teoría, métodos y técnicas de investigación

social. Instituto Colombiano para el Fomento de la Educación Superior

(ICFES), Colombia. Recuperado de

http://www.icfes.gov.co/cont/s_fom/pub/libros/ser_inv_soc/ modulo3.pdf

Cabello, E., Conde, C. & Rodríguez, L. (2009). Detección automática de conductas

sospechosas en aeropuertos. Grupo de Investigación FRAV, Universidad Rey

Juan Carlos. Recuperado de

http://www.frav.es/pdf/2009/duquedeahumada2009.pdf

Calderón, R. & Zamora, L. (2004). Manual de capacitación. Tomo 2. Control integrado

del ácaro Varroa destructor. Centro de Investigaciones Apícolas Tropicales

(CINAT). Costa Rica.

Calderón, R., Zamora, L, Van Veen, J. & Quesada, M. (2007). A comparison of the

reproductive ability of Varroa destructor (Mesostimata:Varoiae) in worker and

drone brood of Africanizad bees (Apis mellifera) Exp Appl Acarol, 43, 25-32.

102
BIBLIOGRAFÍA

Carmona, E., Martínez-Cantos, J. & Mira, J. (2000). Posprocesamiento morfológico

adaptativo basado en algoritmos genéticos y orientado a la detección robusta

de humanos.

Colin, M., García, P. & Hamida, T. (1999). Varroosis. CIHEAM. Options

Mediterraneennes. 121-142.

Cuevas , E., Zaldivar, D. & Pérez, M. (2010). Procesamiento Digital de Imágenes con

MatLab y Simulink. Alfaomega Editorial. Mexico.

Donzé, G., Fluir, P. & Imdorf, A. (2007). A look under the cap: The reproductive

behavior of Varroa in the capped brood of the honey bee. American Bee

Journal. 138 (4), 528-533

Erickson, E. (1996). Fecal accumulations deposited by Varooa can be used as a simple

field diagnostic for infestations of honey bee parasite. American Bee Journal.

136 (1), 63-64

Faytong, J. & Moggia, G. (2008). Monitoreo automático de carreteras mediante el uso

de un sistema de detección, seguimiento y extracción de características de

vehículos con técnicas de visión por computador (Tesis de grado, Escuela

103
BIBLIOGRAFÍA

Superior Politécnica del Litoral, Ecuador). Recuperado de

http://www.cib.espol.edu.ec/Digipath/D_Tesis_PDF/D-38737.pdf

Gil, P., Torres, F. & Ortíz, F. (2004). Detección de objetos por segmentación

multinivel combinada de espacios de color. Recuperado de http://www.cea-

ifac.es/actividades/jornadas/XXV/documentos/19-abtsufilva.pdf

Gómez, E. (2009). Aplicación del filtro de partículas al movimiento de un objeto en 2D

y extracción de características (Proyecto de fin de carrera, Universidad Rey

Juan Carlos, España). Recuperado de

http://www.escet.urjc.es/~jjpantrigo/PFCs/pfc_efren.pdf

González, L. (2009). Análisis de imágenes: sistema de detección de intrusos. Proyecto

final de carrera, Universidad Pontificia Comillas. España. Consultado en

http://www.iit.upcomillas.es/pfc/resumenes/4a47be9c47d75.pdf

Hanxuan, Y., Ling, S., Feng, Z., Liang, W., & Zhan S. (2011). Recent advances and

trends in visual tracking: A review. Neurocomputing 74 (2011) 3823–3831

Llorente, J (1990). Varroosis. Consultado en

http://www.mundoapicola.com/PDF/patologia/varroosis.pdf

104
BIBLIOGRAFÍA

Mateu, 0. (2009). Análisis y detección de objetos de primer plano en secuencias de

video (Proyecto Final de Carrera, Universitat Politècnica de Catalunya).

Recuperado de

http://upcommons.upc.edu/pfc/bitstream/2099.1/7308/1/Projecte_finalv3.2.pdf

Organización Mundial de Sanidad Animal. (2004) Manual de la OIE sobre animales

terrestres. 5(2). pp 1060-1064. Recuperado de

http://www.oie.int/ESP/normes/mmanual/pdf_es/2.9.05_Varroosis.pdf

Pardàs, M., Casas, J., Gasull, A., Marqués, F., Oliveras, A., Salembier, P., Sayrol, E.,

Chang, C., Co-mas, D., Ferran, C., Giró, X., Landabaso, J., León, M., Morros,

J., Ruiz, J., Solé, J. & Vilaplana V. (2001). Representación, acceso y

descripción de video para futuros servicios multimedia. Departament de Teoria

del Senyal i Comunicacions, Universitat Politècnica de Catalunya. Recuperado

de http://www.landabaso.org/publications/avr-04-image-processing-group-

upc.pdf

Realpe, M., Vintimilla, B., Romero, D. & Remagnino, P. (2009). Análisis del

comportamiento humano: metodología para la localización y el seguimiento de

personas en secuencias de video. Recuperado de

105
BIBLIOGRAFÍA

http://www.iiis.org/CDs2008/CD2009CSC/CISCI2009/PapersPdf/C629DZ.pd

Rodríguez, P. (2003). Aplicación del filtro de Kalman al seguimiento de objetos en

secuencias de video (Proyecto de fin de carrera, Universidad Rey Juan Carlos,

España) Recuperado de

http://www.etsii.urjc.es/~asanz/documentos/MemoriaKalmanJun03.pdf

Schmidt, V., Carrillo, M. & Neira, M. (2005). Comparación de dos formas de

aplicación del acaricida orgánico Bienenwohl en el control de Varroa

destructor. Anderson & Trueman. Agro Sur. 33, (2), 43-48.

Sonsoles, M. (2009). Análisis comparativo de técnicas de segmentación de secuencias

de video basadas en el modelado del fondo (Proyecto de fin de carrera,

Universidad Autónoma de Madrid, España).

Vázquez, J., Mazo, M., Lázaro, J., Luna, C., Cabello, J., Ureña, J. & García, J. (2009).

Fusión de algoritmos para detectar objetos en movimiento. Departamento de

Telecomunicaciones, Universidad de Oriente, Cuba. Departamento de

Electrónica, Universidad de Alcalá. España. Recuperado de de http://geintra-

uah.org/system/files/private/FUSION_DE_ALGORITMOS_PARA_DETECT

AR_OBJETOS_SAAEI_VAZQUEZ_04.pdf

106

También podría gustarte