Math E20f4838238411

UNIVERSIDAD NACIONAL
FACULTAD DE CIENCIAS EXACTAS Y NATURALES

ESCUELA DE MATEMÁTICA
ALGORITMO PARA LA DETECCIÓN Y SEGUIMIENTO DEL ÁCARO

VARROA DESTRUCTOR EN SECUENCIAS DIGITALES DE VIDEO
Proyecto de Graduación sometido a consideración del Tribunal Examinador de la Escuela
de Matemática como requisito parcial para optar al grado de Licenciatura en Enseñanza de
la Matemática.
Elaborado por
Juan Pablo Prendas Rojas

Melvin Enrique Ramírez Bogantes
2011
Campus “Omar Dengo”

Heredia, Costa Rica
I
Este proyecto de graduación fue APROBADO, con mención de honor Cum Laude por
el Tribunal Examinador de la Escuela de Matemática de la Universidad Nacional, como
requisito parcial para optar por el grado de Licenciatura en la Enseñanza de la Matemática.
Presidente del Tribunal
Representante Dirección Escuela de Matemática
Tutor
Asesor
Asesor
Graduando
Graduando
II
III
IV
DEDICATORIA
Melvin Ramírez Bogantes.
Primero que todo a Dios y la Virgencita de los Ángeles, por darme vida, salud, fortaleza,
capacidad y paz para poder culminar mis estudios de Licenciatura.
A mi Madre y Padre por apoyarme en todo momento, creer en mi y darme la oportuni-
dad de estudiar, a mis hermanos por el sacrificio que significa crecer lejos de mi, los llevo
siempre en mi mente y mi corazón.
A mi amada por entender la importancia de culminar con éxito esta etapa de mi vida,
por aquellos momentos que se tenía que sacrificar tiempo en familia para dedicarme a
la investigación. Gracias por darme un hermoso y saludable hijo, son mi inspiración y
motivación día a día, LOS AMO.
Al profesor Dr. Carlos Travieso, por el apoyo esfuerzo y dedicación incondicional que
ha tenido a lo largo de la investigación, sin sus aportes y sugerencias este trabajo no hubiera
sido posible. A mi tutor y por bendición de Dios puedo llamarlo mi amigo Dr. Oscar Salas,
por el apoyo y sugerencias, además de las horas que dedico durante todo el proceso.
Al profesor MSc. Victor Medina, es un honor haberlo tenido como lector de mi proyec-
to, gracias Don Victor.
Por último y no por ello menos importantes a mi querida Escuela de Matemática espero
poder servir con mis aportes durante mucho tiempo. Al profesor MSc Eddie Vargas gracias
por darme las condiciones necesarias al inicio de esta carrera, sin su ayuda es muy probable
que mi estadía en la UNA hubiera sido muy corto.

V
Juan Pablo Prendas Rojas.
A la persona que más admiro en el mundo, la que me mostró con amable ejemplo que
el trabajo duro y humilde son legados invaluables. Que no importa si la adversidad repliega
tus fuerzas, en el amor y el compromiso se encuentran vivas las que parecían agotadas. Juan
Bautista Prendas Madrigal, gracias padre por la lección de vida. También a mi familia: mis
hermanos y adorada madre Bellanira Rojas Alvarado. Y a los amores que recién puso Dios
en mi vida: Yariel y Yess.

VII
Índice general
Índice de cuadros IX
Índice de figuras X
1. INTRODUCCIÓN 1
1.1. Tema de Investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1. Colaboración entre Escuela de Matemática y el Centro de Investi-
gaciones Apícolas Tropicales (CINAT) . . . . . . . . . . . . . . . 2
1.1.2. Problema de investigación . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Justificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.2. Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4. Estado del Arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2. MARCO TEÓRICO 16
2.1. El Ácaro Varroa Destructor . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1.1. Características biológicas del ácaro. . . . . . . . . . . . . . . . . . 16
2.1.2. Varroosis e impacto en las poblaciones de abejas . . . . . . . . . . 18
2.1.3. Comportamientos particulares del ácaro . . . . . . . . . . . . . . . 21
2.2. Procesamiento Digital de Video . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1. Métodos de detección y seguimientos de objetos mediante técnicas
de procesamiento de video . . . . . . . . . . . . . . . . . . . . . . 27
2.2.2. Sistemas de detección de primer plano . . . . . . . . . . . . . . . . 29
2.2.3. Seguimientos de objetos . . . . . . . . . . . . . . . . . . . . . . . 46
2.2.4. El software MatLab . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.2.5. Tipos de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.2.6. Operaciones con Matrices . . . . . . . . . . . . . . . . . . . . . . 53
2.2.7. Operaciones Morfológicas . . . . . . . . . . . . . . . . . . . . . . 55
2.2.8. Otras funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
VIII
3. MARCO METODOLÓGICO 61
3.1. Tipo de Investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2. Captura de Video . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.3. Procesado de Imágenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3.1. Determinación de técnicas para la detección y seguimiento de objetos 63
3.3.2. Implementación del procesado de video en una muestra . . . . . . . 64
3.3.3. Evaluación del algoritmo . . . . . . . . . . . . . . . . . . . . . . . 64
3.3.4. Implementación de sistema inteligente . . . . . . . . . . . . . . . . 65
4. DISCUSIÓN Y ANÁLISIS 66
4.1. Obtención y Lectura de Video . . . . . . . . . . . . . . . . . . . . . . . . 66
4.2. Zona Activa de Movimiento . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.2.1. Descripción del escenario inicial . . . . . . . . . . . . . . . . . . . 68
4.2.2. Detección de la Z.A.M . . . . . . . . . . . . . . . . . . . . . . . . 70
4.3. Identificación del Ácaro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.4. Seguimiento del Ácaro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.5. Proceso de Validación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.6. Comentarios de Cierre . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5. CONCLUSIONES Y SUGERENCIAS 94
5.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.2. Sugerencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
IX
Índice de cuadros
2.1. Familias de estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.2. Estructuras de control en la programación de MatLab . . . . . . . . . . . . 54
4.1. Detalle de la muestra de videos seleccionada para la valoración de la efec-

tividad del algoritmo de detección. . . . . . . . . . . . . . . . . . . . . . . 88
4.2. Distribución de porcentajes de detección correcta por corte de control. . . . 91
X
Índice de figuras
2.1. Hembra adulta del Ácaro Varroa Destructor . . . . . . . . . . . . . . . . . 17

2.2. Comparación de la morfología de una abeja adulta sana y otra afectada por
varroosis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3. Representación de una imagen a escala de grises en MatLab. . . . . . . . . 24
2.4. Representación de una imagen a color RGB en MatLab. . . . . . . . . . . . 26
2.5. El parámetro t determina la componente asignada al frame en esa posición
en un vector de hipermatrices . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6. Ejemplo de dilatación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.7. Ejemplo de erosión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.8. Aplicación de la función imfill . . . . . . . . . . . . . . . . . . . . . . . . 58
2.9. Aplicación de la función bwlabel . . . . . . . . . . . . . . . . . . . . . . . 59
2.10. Aplicación de la función graythresh . . . . . . . . . . . . . . . . . . . . . 60
4.1. Descripción del escenario . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

4.2. Primera detección de la Zona Activa de Movimiento . . . . . . . . . . . . 70
4.3. Detección de movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4. Zona de mayor movimiento en el corte 1 . . . . . . . . . . . . . . . . . . . 73
4.5. Relleno de la Z.A.M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.6. Operaciones Morfológicas sobre Z.A.M. (1) . . . . . . . . . . . . . . . . . 75
4.7. Operaciones Morfológicas sobre Z.A.M. (2) . . . . . . . . . . . . . . . . . 76
4.8. Eliminación de zonas no deseadas . . . . . . . . . . . . . . . . . . . . . . 76
4.9. Idea intuitiva de la transformación de puntos del contorno a coordenadas
polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.10. Detección de la Zona Activa de Movimiento . . . . . . . . . . . . . . . . 78
4.11. Identificación de ácaro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.12. Selección de frames para la identificación del ácaro . . . . . . . . . . . . . 79
4.13. Contorno del Ácaro V. Destructor . . . . . . . . . . . . . . . . . . . . . . 80
4.14. Cálculo de Área y Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.15. Efecto de la aplicación de la sustracción de fondo a partir de la matriz
histórica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
XI
4.16. Efecto de la aplicación de la sustracción de fondo por umbral . . . . . . . . 85

4.17. Detección de ácaro por medio de la combinación de eliminación de fondo
por matriz histórica y por umbral. . . . . . . . . . . . . . . . . . . . . . . 87
4.18. Ejemplos de detección incorrectas (DI) . . . . . . . . . . . . . . . . . . . . 90
4.19. Muestras de omisiones en la detección (ND) . . . . . . . . . . . . . . . . . 90
1
Capítulo 1
INTRODUCCIÓN
1.1. Tema de Investigación
A inicios del año 2009, la Universidad Nacional (UNA) estrechó lazos con la Univer-
sidad de Las Palmas de Gran Canaria (ULPGC). Lo anterior se logró con la formulación
de una propuesta cuya objetivo es complementar los conocimientos matemáticos genera-
dos por la Escuela de Matemática de la UNA con los avances en tratamiento de imáge-
nes logrados en ULPGC. Esta iniciativa contribuye a la proyección de importantes aportes
matemáticos para la resolución de problemas en áreas tales como la biología, topografía,
ingeniería, entre otras.
Con esta premisa se ha generado una dinámica de investigación en la unidad académica
de la Escuela de Matemática (UNA). Entre las actividades implementadas destacan la ac-
tualización del personal docente en temas de programación, uso de software especializados

1.1. TEMA DE INVESTIGACIÓN CAPÍTULO 1. INTRODUCCIÓN
y tratamiento de señales; además, la visita de expertos de la ULPGC y de la Universi-
dad de Costa Rica (UCR) para la identificación de problemas generadores de proyectos de
investigación en colaboración con entes nacionales e internacionales.
1.1.1. Colaboración entre Escuela de Matemática y el Centro de In-
vestigaciones Apícolas Tropicales (CINAT)
Como consecuencia del intercambio académico con investigadores de la ULPGC y
UCR y la búsqueda de problemas dentro de los centros de investigación de la UNA, se
detectó uno particularmente interesante. Esto dio origen al proyecto interinstitucional deno-
minado Detección, seguimiento y análisis del comportamiento del ácaro Varroa Destructor
mediante técnicas de procesado inteligente de video.
El CINAT entre sus principales ocupaciones se encarga del estudio de parásitos de las
abejas productoras de miel en el trópico. Algunos parásitos como el ácaro V. Destructor
son capaces de fulminar toda una colmena de abejas y en casos menos severos, disminuir
considerablemente la producción de miel y esto, por ende, implicaría importantes pérdidas
para los productores. Científicos del CINAT estudian aspectos biológicos y del comporta-
miento del ácaro con el fin de colaborar con el tratamiento y contención de las infestaciones
con ácaros de este tipo.
Para estos fines, los científicos del CINAT, introducen un ácaro en una celda artificial
transparente con una larva y filman durante varios días toda la actividad que se lleva a cabo
en dicha celda. El proceso de registro de comportamientos del ácaro se realiza de forma
2
CAPÍTULO 1. INTRODUCCIÓN 1.1. TEMA DE INVESTIGACIÓN
manual a partir de las secuencias de videos. El investigador debe observar y reportar los
estados, desplazamientos y acciones del ácaro; un proceso lento en demasía.
El sistema inteligente que se propone implementar en este proyecto, será capaz de re-
portar los comportamientos particulares del ácaro de forma automatizada. Con esto, los
científicos de CINAT sólo necesitarán hacer correr un algoritmo que lea el video y reporte
posición, tiempo, velocidad y reconozca acciones particulares como alimentación y defe-
cación del ácaro.
La Escuela de Matemáticas no sólo colaborará con el CINAT reduciendo el tiempo
de análisis de las secuencias de video y ofreciendo un sistema confiable de detección y
seguimiento del ácaro, sino que establecerá un precedente en la utilización de matemática
aplicada para la resolución de problemas concretos en áreas de la biología.
El proyecto que se menciona es de clara trascendencia, dada la importancia científica
y económica derivada del estudio de abejas melíferas, innovador y se constituye como un
pilar en el esfuerzo de crecimiento académico y tecnológico de la Escuela de Matemáti-
cas. Es, además, catalizador para la implementación de proyectos de similares alcances e
implicaciones en otras áreas como ingenierías o ciencias sociales.
1.1.2. Problema de investigación
El problema de esta investigación se ubica como etapa previa al proyecto mencionado
en la sección anterior. En colaboración con los investigadores del CINAT se propone crear
un sistema automático que permita la detección y seguimiento del ácaro V. Destructor pre-
3
1.2. JUSTIFICACIÓN CAPÍTULO 1. INTRODUCCIÓN
sente en la celda de una larva de abeja melífera, en un ambiente controlado a través del
análisis de una secuencia de video registrado durante todo el proceso.
Es importante aclarar que en esta propuesta, no se propone hacer registros de movimien-
tos y descripción de particularidades. Más bien se constituye como el punto de partida para
el logro de estos otros fines. La investigación culmina con la implementación y evaluación
de la eficiencia del algoritmo en secuencias de video facilitadas por el CINAT.
1.2. Justificación
El desarrollo científico y el crecimiento exponencial en cuanto al poder del cálculo por
parte de los ordenadores, han contribuido al desarrollo de la matemática aplicada. Esto
propicia la oportunidad de explorar fronteras antes impensables, enriqueciendo y expan-
diendo los usos de aplicaciones matemáticas. De este modo se ha convertido en un área
de la matemática sumamente agradable, pero sobre todo presente en numerosas disciplinas
del saber.
La visión artificial es, quizás, una de las áreas donde la matemática aplicada ha teni-
do logros significativos. Bajo esta perspectiva, su principal objetivo es extraer de forma
automatizada información digitalizada del mundo físico. Esto trae consigo destacadas y
numerosas aplicaciones en un número siempre mayor de contextos, como por ejemplo la
seguridad (González, 2009).
Sin embargo, hay muchos sectores que emplean esta tecnología para otros fines. Por
4
CAPÍTULO 1. INTRODUCCIÓN 1.2. JUSTIFICACIÓN
ejemplo, algunas empresas y comercios cuentan con sistemas que capturan y analizan imá-
genes que les permiten tener un registro de la hora de entrada y salida de sus trabajadores.
Otros sistemas utilizan imágenes capturadas en videos para realizar controles de calidad
automatizados, control de tránsito, entre otras aplicaciones.
En varias investigaciones ( Bayonas, 2009; Mateu, 2009; Realpe, Vintimilla, Romero,
& Remagnino, 2009), entre otros, se evidencia que con el paso del tiempo las aplicaciones
han evolucionado desde sistemas de detección simple hasta complejos sistemas de identi-
ficación, seguimiento y registro. Esto muestra que la visión artificial involucra disciplinas
como la medicina, interacciones con video juegos y el control del tránsito. Por tanto, son
variados los fenómenos estudiados mediante observación de imágenes o bien el análisis de
videos. Uno de estos fenómenos es estudiado en el CINAT. Donde, mediante la observa-
ción de un video se documenta el comportamiento del ácaro ectoparásito Varroa Destructor,
presente en las celdas de abejas obreras africanizadas (Calderón, 2009).
El V. Destructor es considerado como una de las mayores amenazas en la apicultura
debido a que se encuentra distribuido mundialmente. Sus efectos, afectan tanto a las abejas
adultas como a sus crías, y en algunas ocasiones causan la muerte. Schmidt, Carrillo &
Neira, (2005).
Las abejas melíferas africanizadas (Apis mellifera) son las abejas productoras de miel
del trópico americano, particularmente en Costa Rica, son las pioneras en el desarrollo de
la apicutura. Estas abejas son muy importantes para la producción de miel, propóleos y
otros productos de la colmena. Los cuales inciden positivamente en la economía rural, la
5
1.2. JUSTIFICACIÓN CAPÍTULO 1. INTRODUCCIÓN
dieta y la salud de las personas en varios países de la región (Calderón, 2009).
Tanto las abejas utilizadas para el desarrollo de la apiculturas, como la gran población
de abejas africanizadas silvestres propias de ecosistemas tropicales, son vitales para la po-
linización y reproducción de los bosques y otras formaciones vegetales en nuestro entorno.
Sin duda, este es el principal valor e impacto asociado a estos insectos (Calderón, 2009).
Calderón (2009) enfatiza en que en la actualidad, a nivel mundial, hay una gran preocu-
pación por la pérdida masiva de las abejas que obedece a varias hipótesis que aún se están
tratando de demostrar y que tienen que ver con aspectos sanitarios (plagas y enfermeda-
des), contaminación (plaguicidas) y ambientales (cambio climático y uso de la tierra), entre
otras.
Esta alerta se ha dado principalmente en Europa y Norteamérica, donde los impactos
de la pérdida masiva de abejas son muy preocupantes. Sin embargo, para la región tropical
no se han dado reportes determinantes en ese sentido (Calderón, 2009).
Se ha descrito la importancia biológica y económica que tienen las abejas y el impacto
nocivo del ácaro V. Destructor en sus poblaciones, por esta razón el CINAT cuenta con
laboratorios especializados donde se investigan alternativas para dar solución a esta proble-
mática.
Para el estudio de su comportamiento, el ácaro es insertado intencionalmente en la
celda de abejas obreras, donde se graban mediante una cámara de vídeo la interacción que
se da entre la pupa y el ácaro. Posterior a la grabación, un especialista en el estudio del
ácaro dedica una gran cantidad de horas al análisis de los videos, de los cuales se obtiene
6
CAPÍTULO 1. INTRODUCCIÓN 1.2. JUSTIFICACIÓN
información relevante para definir nuevos métodos de control de la infestación.
En el año 2010, en conjunto con otros investigadores, se presentó a la Escuela de Ma-
temáticas (UNA), un proyecto con el objetivo crear un algoritmo, que permita describir y
registrar automáticamente los comportamientos considerados de interés por el especialista
entre el ácaro y la pupa de la abeja.
Para lograr la creación del sistema inteligente se debe cumplir una serie de fases, una
de estas consiste en la creación de un algoritmo que permita detectar y seguir el ácaro V.
Destructor en secuencias de vídeos digitales.
En relación con lo anterior, este proyecto de graduación es considerado una fase pre-
via y de suma importancia en aras de lograr la implementación satisfactoria del sistema
inteligente propuesto en el proyecto de investigación aprobado e inscrito en la Escuela de
Matemáticas (UNA).
Para el CINAT, la creación de un sistema automático, basado en la inteligencia artificial,
sería una herramienta fundamental para optimizar el tiempo y los recursos empleados para
obtener los registros del comportamiento del ácaro en mención. De esta manera, sería más
ágil formular criterios adecuados para interpretar dicha información y desarrollar nuevas
formas para combatir el parásito V. Destructor.
Teniendo en cuenta lo expuesto anteriormente, se considera que el uso del sistema ayu-
dará a determinar aspectos no conocidos de la biología reproductiva de la principal plaga de
las abejas africanizadas y europeas, contribuyendo a recuperar la calidad en la producción
de las abejas melíferas.
7
1.3. OBJETIVOS CAPÍTULO 1. INTRODUCCIÓN
Por otra parte, este tipo de estudios ilustran la utilización de herramientas matemáticas e
incentiva la implementación de algoritmos en la resolución de problemas concretos en otras
disciplinas científicas. Este tipo de experiencias enriquecen la formación académica de los
futuros docentes e influirá las estrategias metodológicas que implementen en su ejercicio
profesional.
1.3. Objetivos
1.3.1. Objetivo General
Generar un algoritmo que permita detectar y dar seguimiento al movimiento del ácaro
Varroa Destructor en celdas de abejas melíferas a partir del método de sustracción dinámica
de fondos en videos digitales.
1.3.2. Objetivos Específicos
1. Generar un algoritmo que permita identificar el ácaro Varroa Destructor en una se-
cuencia de video digital.
2. Generar un algoritmo que permita el seguimiento del movimiento del ácaro Varroa
Destructor en una secuencia de video digital.
3. Generar mecanismos que permitan evaluar la eficiencia del algoritmo de detección y
seguimiento del Ácaro V. Destructor en una secuencia de video digital.
8
CAPÍTULO 1. INTRODUCCIÓN 1.4. ESTADO DEL ARTE
4. Colaborar con el Centro de Investigaciones Apícolas Tropicales (CINAT) en el estu-
dio del comportamiento del ácaro Varroa Destructor.
5. Mostrar la aplicabilidad de algunos conceptos matemáticos en la solución de pro-
blemas concretos como la detección y seguimiento de movimiento del ácaro Varroa
Destructor.
1.4. Estado del Arte
En la actualidad el análisis automático de secuencias de videos se ha convertido en un
área de investigación muy activa en distintas aristas científicas, ver (Bayona,2009 ; Faytong
& Moggia, 2008; Gómez, 2009; Mateu,2009).
Sus campos de acción, desarrollo y proyección abarcan desde situaciones simples y co-
tidianas hasta sistemas de alta complejidad. En los primeros pueden ubicarse el conteo de
formas determinadas presentes en una fotografía o detectar objetos extraviados en termi-
nales, y en los sistemas complejos aquellos que realizan reconocimiento facial o dactilar y
diagnósticos o procedimientos médicos a partir de imágenes.
Con esta referencia es latente la importancia que subyace en el tratamiento de videos,
sin embargo esta tarea sería lenta e infructuosa sin un robusto sistema. Carmona, Martinez
- Cantos & Mira,(2006), argumentan, además, que los sistemas inteligentes proporcionan
herramientas de análisis automáticos que facilitan el estudio de diversos fenómenos. Estos
sistemas tradicionalmente se han fundamentado en la visión artificial, cuya finalidad es la
9
1.4. ESTADO DEL ARTE CAPÍTULO 1. INTRODUCCIÓN
extracción automática de información del mundo físico a partir de imágenes y videos (ver
Bayona, 2009).
De la exitosa combinación de tecnología digital, captura de imágenes y video y el desa-
rrollo de algoritmos computacionales robustos, que aprovechan el constante aumento en la
capacidad de cálculo de las computadoras, se ha iniciado el camino para el tratamiento di-
gital de información a partir de sistemas automáticos. Es decir, por un lado las tecnologías
digitales evolucionan para capturar de manera más fiel información en formatos de imáge-
nes y, de la mano, han surgido investigaciones novedosas sobre algoritmos que agilizan la
toma, tratamiento y registro de datos obtenidos de la imagen o el video.
Actualmente se cuenta con una amplia gama de investigaciones sobre el tratamiento de
señales (fotografías, video, sonido). Existen referencias sobre sistemas que permiten detec-
tar objetos perdidos, identificar personas, diagnosticar algunos padecimientos a partir de
sonidos emitidos por la garganta, conteo de objetos (por ejemplo, vehículos que utilizan
una determinada red vial), sistemas de clasificación mediante fotografías, entre otras muy
variadas aplicaciones. A continuación se presentan las principales conclusiones de investi-
gaciones que se consideran tienen propósito, metodología y alcance similares a la propuesta
en este documento.
En lo referente a video-seguridad (Cabello, Conde & Rodríguez, 2009) realizaron in-
vestigaciones con la finalidad de evaluar nuevas tecnologías aplicadas a la seguridad en
aeropuertos. Por un lado, diseñaron un sistema de reconocimiento facial basado en imá-
genes de videos y como complemento, trabajaron en la detección automática de objetos
10
abandonados utilizando la red de cámaras de vigilancia presente en un aeropuerto.
Los resultados obtenidos en ambas investigaciones son alentadores comparados con los
sistemas comerciales. Se destaca la estabilidad y respuesta a situaciones diversas y se acla-
ra que las condiciones podrían ser más favorables si se hubiese dispuesto de mayor y mejor
equipo para complementar el sistema de vigilancia del aeropuerto. A pesar de las limita-
ciones de posición y orientación de cámaras, los sistemas propuestos generaron resultados
muy buenos, sobre todo cuando la grabación fue de buena resolución, esto depende entre
otras variables de los niveles de luz presentes en la escena y de la proximidad o lejanía de
los objetos capturados.
En esa misma línea González (2009) propone un sistema de vigilancia para la detección
de intrusos en un ambiente determinado y el cual se desea controlar a partir del análisis de
imágenes. Es importante señalar que el autor es enfático en dictar que los sistemas inte-
ligentes de seguridad han tenido mucho auge en los últimos años pero que suelen estar
supervisados por las empresas de seguridad que los ofrecen y esto provoca un encareci-
miento en el precio del servicio.
González (2009) menciona que los algoritmos desarrollados hasta el momento aún pre-
sentan algunos aspectos que se deben mejorar. Destaca problemas típicos como el ruido
en las imágenes, las variantes espontáneas en el entorno, como sombras o cambios de ilu-
minación y los movimientos naturales por la acción del viento, entre otros. El principal
objetivo de González (2009) se enfocó en ofrecer un sistema de tratamiento de imágenes
al alcance de cualquier usuario, un sistema fiable capaz de detectar potenciales amenazas
11
para aquello que se desea proteger en el que se minimiza el número de errores presentado
por los sistemas tradicionales comerciales.
Las principales características y alcances del proyecto planteado en González (2009) se
resumen en la implementación de algoritmos para la segmentación de la imagen en fondo
y primer plano que permiten detecciones con gran fiabilidad, disminución considerable del
efecto falaz de sombras y cambios de iluminación y seguimiento basado en el solapamiento
de los objetos en dos instantes sucesivos. Como conclusión puede mencionarse que el pro-
yecto no sólo obtuvo los objetivos propuestos, sino que también impulsó otros resultados
complementarios que pueden ser utilizados en otros proyecto.
La localización de objetos en movimiento es una tarea de interés no sólo en el campo
de la seguridad, sino en todas aquellas áreas en las que se requieran y en donde se pueda
aplicar los conocimientos actuales del campo de la visión artificial. Por ejemplo, Vázquez
et al. (2009) con fines didácticos realizaron un estudio sobre la fusión de dos algoritmos
de detección de movimiento. La idea utilizada se basa en la aplicación de uno que utiliza
el método del Análisis de Componentes Principales y otro basado en un test de relación de
probabilidades de orden reducido. El análisis de los algoritmos muestra que la segmenta-
ción y la umbralización es menos afectada por el ruido, cuando estos actúan fusionados.
En otra investigación, Rodríguez (2003) hace uso de los filtros de Kalman para la de-
tección y el seguimiento de objetos en una secuencias de imágenes. Este método se utiliza
en situaciones donde un proceso continuo es muestreado en intervalos de tiempo. Los prin-
cipales resultados conseguidos han sido la aplicación del filtro a secuencias de imágenes
12
con más de un objeto y el control del seguimiento bajo situaciones de obstrucción. También
se logra implementar una aplicación de estos filtros al seguimiento de objetos presentes en
una secuencia de imágenes en tiempo real.
Algunos autores han hecho clasificaciones de estos métodos según la naturaleza del al-
goritmo que los fundamenta. Uno de los métodos más populares es denominado método
de background (método de fondos), sin embargo, una vez más, la eliminación del ruido
presente en los videos es su principal problema. Una posible corrección a la presencia de
ruido en las imágenes es la aplicación de una secuencia fija de operadores morfológicos
pero que, al tener que decidir a priori los parámetros morfológicos, no siempre está garan-
tizado el éxito de la restauración del foreground (primer plano) (Carmona, Martínez-Canto
& Mira, 2006).
Carmona et al. (2006) proponen una nueva aproximación basada en el método de subs-
tracción de background, la idea consiste en hacer evolucionar una población de secuencias
de operadores morfológicos mediante un algoritmo genético, con el objetivo de encontrar
la menor secuencia que permita eliminar el ruido para restaurar el foreground.
Desde un punto de vista más teórico, Mateu (2009) crea un proyecto cuyo propósito
es presentar algunas de las técnicas que se utilizan para detectar objetos de primer plano
en una secuencia video. En este estudio se realizó un análisis comparativo entre las diver-
sas técnicas de uso popular, tomando como consideración las ventajas y desventajas que
presentan cada una de ellas.
Los métodos de detección de objetos en primer plano, referidos por Mateu (2009), se
13
dividen en dos grupos: modelado de fondo a nivel de píxel y modelado global de fondos.
En el primero se encuentran los métodos de detección de primer plano clásicos tales como
Running Gaussian Avarage, Stauffer y Grimson (también conocido como Múltiples Gaus-
sianas), Histogramas y Kernel Desity Estimation (KDE) y al segundo grupo pertenecen los
métodos de detección de primer plano con regularidad espacial como Inclusión de Infor-
mación Espacial en el modelo KDE y Estimación Bayesiana mediante dos o más modelos.
Se incluyen en el tratamiento teórico los sistemas de post-procesado de videos para co-
rrección de sombras, entre los estudiados por Mateu (2009) están: Método de luminancia
normalizada, método de híbrido y el método de reflectancia.
Mateu (2009) señala que dentro de los métodos clásicos se comprobó que el uso del
estimador de primer plano basado en KDE permite obtener resultados semejantes a los que
se obtienen con Stauffer y Grimson, por lo concluye que es un buen detector de objetos
de primer plano. En lo referente a los métodos con regularidad espacial, se implementaron
dos detectores de primer plano basados en KDE, estos permitieron corregir algunas falsas
detecciones que se obtienen cuando se trabajan con KDE o bien con Stauffer & Grimson.
Con respecto a los métodos de corrección de sombras, Mateu (2009) determinó que el
método que generó mejores resultados es el método híbrido, el cual es capaz de corregir
una gran cantidad de falsas detecciones asociadas a las sombreas (de forma parcial) sin
afectar aquellas detecciones correctas obtenidas mediante el algoritmo.
Como se ha podido constatar un buen número de investigadores hacen esfuerzos por
avanzar en la novedosa y prometedora área de tratamiento de imágenes. Se evidencia que
14
la detección de objetos en movimiento mediante secuencias de video es un componente
relevante en la extracción de información del mundo real.
Es importante acotar que los avances más significativos y novedosos han surgido en
países europeos. En Costa Rica se tiene referencia de algunas iniciativas en la Universidad
de Costa Rica pero aún en génesis. Las posibilidades en biología y específicamente la
problemática abordada por el proyecto, son de gran trascendencia e innovadoras.
15
16
Capítulo 2
MARCO TEÓRICO
Para la adecuada comprensión de las variantes teóricas que sustentan esta investiga-
ción se presenta una ubicación descriptiva de las características biológicas del ácaro V.
Destructor y las consecuencias que acarrea la infestación con éste. Se introducen las no-
ciones elementales del tratamiento de imágenes, se describen algunos métodos comunes de
detección y seguimiento de objetos y se presentan las características básicas del software
MatLab, haciendo énfasis en los comandos utilizados en el desarrollo de este proyecto.
2.1. El Ácaro Varroa Destructor
2.1.1. Características biológicas del ácaro.
Desde una posición taxonómica el artrópodo responsable de la varoosis ha sufrido al-
gunas modificaciones. Según Llorente (1990), se clasifica dentro del tipo Artropoda, clase
CAPÍTULO 2. MARCO TEÓRICO 2.1. EL ÁCARO VARROA DESTRUCTOR
Arachnida, orden Parasitiformes, suborden Gamasida, superfamilia Dermanyssoidea y fa-
milia Varroidae y es parásito específico de la abeja de la miel.
El ácaro Varroa Destructor es originario de Ásia. Sin embargo, en la actualidad se ha
propagado ampliamente por todo el mundo en colmenas de abejas melíferas. En nuestro
país, se tiene reporte de su aparición en setiembre de 1997, hallazgo realizado en el Centro
de Investigaciones Apícolas Tropicales (CINAT) (Calderón & Zamora, 2004).
Este tipo de ácaro tiene diferencias morfológicas importantes según el sexo del indi-
viduo. Las hembras adultas tienen un color rojizo oscuro, poseen un caparazón plano en
forma ovalada con dimensiones cercanas a 1mm × 2mm, por lo que pueden observarse a
simple vista. El macho es de mucho menor tamaño y se ha estudiado poco sobre él pues se
cree que muere en el momento que la abeja joven abandona su celda y se ha determinado
que sólo nace uno por periodo de reproducción.
Figura 2.1: Hembra adulta del Ácaro Varroa Destructor
Es característico de los ácaros no poseer antenas ni mandíbulas y moverse utilizando
cuatro pares de patas. En las hembras adultas del ácaro, según Llorente (1990), puede
observarse claramente el aparato bucal, el aparato respiratorio, el aparato excretor y el
17
2.1. EL ÁCARO VARROA DESTRUCTOR CAPÍTULO 2. MARCO TEÓRICO
aparato reproductor en la cara ventral de su caparazón. Para una descripción más detallada
de la morfología del ácaro V. Destructor y una amplia referencia sobre la funcionalidad
y complejidad de sus aparatos digestivo, respiratorio, excretor y reproductor se sugiere
consultar (Colin, García & Hamida, 1999; Llorente, 1990) respectivamente.
2.1.2. Varroosis e impacto en las poblaciones de abejas
Calderón & Zamora (2004) definen la varroosis como una parasitosis externa causada
por el ácaro V. Destructor y coinciden con otros autores (Colin et al., 1999, Oraganiza-
ción Mundial de Sanidad Animal (OIE), 2004 y Llorente, 1990) sobre la gravedad de esta
enfermedad en las abejas en todas sus fases de desarrollo.
El ácaro V. Destructor se inserta en las placas abdominales (en ocasiones también in-
fecta el tórax y la cabeza) de la abeja adulta para succionar su hemolinfa, sin embargo se
considera un parásito de la cría primordialmente (Calderón & Zamora, 2004).
Los expertos ubican el ácaro como parásito de la cría, pues la hembra adulta el áca-
ro abandona la abeja para iniciar un ciclo de reproducción justamente con la invasión de
la celda donde se encuentra una cría (prefieren las crías de los zánganos pero en ocasio-
nes invaden también las celdas de las obreras) y es allí donde se produce los efectos más
nocivos.
En los artículos de Calderón & Zamora (2004) y de la OIE (2004), se describe con
detalle el proceso de infestación que ocurre desde la invasión de la hembra adulta de ácaro
fecundada en la celda de una cría de unos 5 días de edad, hasta el surgimiento de una abeja
18
joven enferma o la muerte de la cría.
La hembra del ácaro deposita alrededor de 7 huevos en la celda, de los cuales, después
de 60 horas, emergen un macho y el resto hembras que posteriormente se aparearán para
continuar el ciclo cuando la celda sea abierta por la abeja joven. Un dato interesante es
que solamente una o dos hembras alcanzan la madurez necesaria para aparearse e iniciar la
invasión a otra celda, sin embargo las lesiones que causan a la cría son un factor importante
y la generación de excrementos es causante de otras problemáticas a la población de abejas.
Calderón & Zamora (2004), OIE (2004) y Colin et al. (1999) concuerdan en que el daño
causado puede verse desde dos aristas: física e infecciosa.
Dado que los ácaros en la celda sellada de la cría se alimentan de su hemolinfa, se pro-
ducen una serie de trastornos como la pérdida de peso y cambios en el comportamiento de
las abejas. Con las palabras de Calderón $ Zamora (2004)
Se cita una marcada disminución del peso de la abeja, cambios en la concentración
y composición de las proteínas de la hemolinfa, alteraciones en el número y tipo
de hemocitos (células que constituyen la hemolinfa) y en los componentes antigé-
nicos.(p. 12)
Las heridas causadas por el ácaro propician la transmisión de agentes infecciosos. Es-
te daño de tipo infeccioso es considerado como uno de los problemas más importantes
asociados a las colmenas de abejas. El ácaro V. Destructor es considerado un participante
relevante en la transmisión de bacterias (Loque Americano), hongos (Cría de Tiza) y prin-
cipalmente virus (DWV, KBV, cría sacciforme, celdas reales negras y APV, por ejemplo.)
19
El impacto en las abejas jóvenes es inmediato. Se presenta un marcado debilitamiento,
retraso en la eclosión y una reducción de su vida productiva. En una colmena con infes-
tación débil las abejas tienen problemas con maniobras de vuelo y se reduce su promedio
de vida; si la infestación es fuerte son frecuentes problemas de morfología en las abejas y
muerte prematura.
Figura 2.2: Comparación de la morfología de una abeja adulta sana y otra afectada por
varroosis.
El impacto del ácaro es tal que las condiciones antes expuestas se traducen en disminu-
ción de la colmena, reducción de la vida productiva y por tanto en merma en el aporte de
polen y deterioro en calidad de la miel.
Llorente (1990), advierte al respecto que
Es preciso tener en cuenta que la presencia de varroosis en una colonia puede tener
consecuencias nefastas, no solamente por esta parasitosis, sino también por su ac-
ción vectorial para ciertos agentes patógenos, que incrementan su virulencia cuando
entran en la hemolinfa: virus de la parálisis aguda. (p. 10).
20
2.1.3. Comportamientos particulares del ácaro
Hasta este momento se han presentado las principales características de biológicas del
ácaro V. Destructor y las consecuencias de la infestación de varroosis en una colmena. Se
ha mostrado que los expertos coinciden en la importancia de diagnosticar la aparición de
una infestación de este ácaro pues las secuelas pueden llegar a ser devastadoras.
De la evidente urgencia de conocimiento y control de este parásito, se desprende, en-
tonces, la necesidad de estudiar los comportamientos del ácaro en sus acciones más vitales:
alimentación, defecación, reproducción y los momentos en que descansa.
La reproducción del ácaro ha sido estudiada con detalle en Calderón & Zamora (2007)
donde se presenta un análisis comparativo según la infestación, ya sea que ésta se presen-
te en celdas de zánganos u obreras. Entre los señalamientos más importantes se tiene que
“mite fertility was similar between worker and drone brood. Nevertheless, a significant dif-
ference in the number of foundress mites producing viable female offspring and immature
offspring was found, being drone brood more suitable for mite reproduction” (p. 31).
Del conocimiento y descripción del comportamiento reproductivo se concluyen algunas
sugerencias de análisis como el tratamiento en laboratorio de celdas de zánganos infestadas.
Por ejemplo, se evidencia que el número de huevos y hembras fértiles es mayor en éstos
que en las celdas de obreras (Calderón & Zamora, 2007) y se presenta la posibilidad de
propiciar una mayor incubación en abejas obreras para reducir el potencial reproductivo
del ácaro.
Otras acciones del ácaro V. Destructor, como la alimentación y defecación también
21
tienen consecuencias directas en el comportamiento y eventual deterioro de la larva de la
abeja. Ya se ha discutido que la succión de hemolinfa que realiza el ácaro para alimen-
tarse, debilita la abeja, y puede tener consecuencias como la deformación de las alas y el
abdomen de la abeja joven. Erickson (1996) describe como la defecación del ácaro puede
interpretarse como un indicador de la presencia activa de éste y hasta como parámetro para
estimar el nivel de infestación en la colmena.
Erickson(1996) señala que las acumulaciones fecales (FA) de este ácaro aparecen como
masas amorfas de color blanco visibles sin tener que utilizar algún instrumento. A diferen-
cia de otros métodos de diagnóstico de la presencia del ácaro, FA es un indicador visual
simple.
Erickson (1996) señala que “analyses have demonstrated a moderate level of correla-
tion between the number of cells with FA and the number of mite per ether roll sample or
on sticky boards” (p.64). Este resultado es el que permite afirmar que es posible estimar el
nivel de infestación a partir de la observación de FA,
FA can be used to diagnose varroa infestations at virtually all levels of mite popu-
lation development, and also to determine the treatment. With experience one can
discriminate between low, moderate and advanced infestations. (p. 64).
A manera de comparación, el autor concluye,
22
CAPÍTULO 2. MARCO TEÓRICO 2.2. PROCESAMIENTO DIGITAL DE VIDEO
Even so, the use of FA as a varroa diagnostic is superior to other methods except un-
capping because it is more likely to pinpoint the severity of infestation during these
periods of intensive brood rearing. (...) Moreover, the beekeeper can quickly diag-
nose varroosis at the same time that s/he is inspecting combs for brood condition
and diseases.(p. 64)
Teniendo como base el acercamiento realizado a las características biológicas y de com-
portamiento del ácaro, se muestran en detalle algunos métodos utilizados para el procesa-
miento digital de video. Desde una perspectiva más descriptiva que analítica se presentan
las nociones elementales que involucran el procesado de imágenes y videos, se caracteri-
zan y tipifican algunos métodos utilizados en la detección y seguimiento de objetos y se
introducen los elementos básicos de un sistema automático inteligente de procesado.
2.2. Procesamiento Digital de Video
El primer paso en la comprensión del procesado digital de video es sin duda lograr in-
terpretar como lee la computadora una imagen. Este hecho es importante pues además de
proporcionar una base conceptual sobre imagen digital, pone de manifiesto una caracterís-
tica esencial del trabajo con computadoras; los procesos discretos.
Según Rodríguez (2003)
23
2.2. PROCESAMIENTO DIGITAL DE VIDEO CAPÍTULO 2. MARCO TEÓRICO
Una imagen digital es una función f (x, y) que puede ser discretizada en sus coor-
denadas espaciales y brillo. Por tanto, es una matriz cuyos índices identifican un
punto en la imagen y la correspondiente matriz de valores identifica el nivel de gris
de ese punto. (p. 12).
En otras palabras puede pensarse una imagen como una matriz, cuyas dimensiones
dependen del tamaño de la imagen, en la cual las entradas son ponderaciones que asignan
la intensidad del color en cada punto. Como se ilustra en la figura 2.3 en MatLab una
imagen a escala de grises se representa por medio de una matriz bidimensional de m × n
(Valdemar & Zaldivar, 2006).
Figura 2.3: Representación de una imagen a escala de grises en MatLab.
Además de la interpretación de las dimensiones de la imagen como dimensiones de una
matriz de puntos es importante identificar el espacio de color de la imagen. Es decir, la
forma en como se asigna el color a cada punto (o píxel) respectivo de la matriz imagen.
24
Gil, Torres & Ortiz, F. (2004) señalan el espacio de color RGB (rojo (R), verde (G)
y azul (B))como el más utilizado por las cámaras de video y fotográficas y enfatizan en
la conveniencia de conocer el espacio de color de las imágenes a procesar pues de esto
dependerá el no perder propiedades de color en el tratamiento.
El espacio de color RGB asigna el color a cada punto como una mezcla de intensidad
de tres colores primarios . La intensidad del color en cada píxel varía entre 0 y 255, de
modo que el blanco por ejemplo tiene asignado R = 255, G = 255 y B = 255 mientras
que el negro es R = 0, G = 0 y B = 0.
Con esto la imagen se considera un hipermatriz (una matriz tridimensional m × n × p)
donde los píxeles están ordenados rectangularmente y además cada uno tiene asignada una
tripleta RGB que determina el color asignado a partir de la intensidad de los primarios.
La ponderación utilizada por el espacio de color RGB puede interpretarse como tres
máscaras superpuestas de dimensiones iguales a las de la matriz que corresponde a la ima-
gen. En ellas se determina la intensidad de colores rojo, verde y azul. (véase figura 2.4).
Con base en esta representación de imagen como hipermatriz, debe entenderse proce-
sado de imagen como el tratamiento computacional de la matriz asociada con el fin de
resaltar alguna característica, seleccionar regiones, eliminar ruido, detectar o seguir objetos
o cualquier proceso que involucre la manipulación de sus componentes.
Cuando el procesado se refiere a video el asunto se torna más interesante, aunque con
matices similares. Rodríguez (2003) señala que
25
Figura 2.4: Representación de una imagen a color RGB en MatLab.
Para el estudio del movimiento en la imagen es imprescindible introducir la varia-
ble tiempo. Una secuencia de imágenes vendrá representada por la función f (x, y, t)
donde x e y son las coordenadas espaciales en la imagen de la escena en un instan-
te de tiempo concreto t. El valor de la función f (x, y, t) por tanto, representa la
intensidad del píxel (x, y) en la imagen t (p. 12).
Con esta definición se podría decir que un video está compuesto de imágenes (también
llamados en la literatura cuadros o frames) con un orden de presentación determinado por
la posición en un vector. Es decir el primer frame es una hipermatriz con todas las carac-
terísticas antes mencionadas, le sigue otra matriz con iguales dimensiones en las que los
valores de algunos píxeles hayan cambiado (podría suceder que la mayoría o la totalidad
de los píxeles se mantengan invariantes; esto sucedería si en la imagen no hay movimiento
26
y/o si la velocidad de reproducción es alta), luego un tercera imagen y así sucesivamente.
Figura 2.5: El parámetro t determina la componente asignada al frame en esa posición en

un vector de hipermatrices
2.2.1. Métodos de detección y seguimientos de objetos mediante técni-
cas de procesamiento de video
El análisis visual del movimiento de objetos es un área muy productiva en la actualidad,
dado que su aplicación, tal y como ya se ha mencionado en varias ocasiones, se extiende
a muchos campos; tales como los videos de seguridad, en interacciones entre el hombre y
las máquinas, estudio de tránsito vehicular y otros.
La detección, seguimiento y reconocimiento del comportamiento de objetos por compu-
tadora puede ser realizada a partir de un video captado por una cámara estática o bien una
cámara móvil de video. La mayoría de los algoritmos creados para estos fines, están ba-
sados en distribuciones estadísticas de color estimadas para cada píxel y son denominados
sistemas de detección de primer plano clásico.
Existen, además, otras técnicas que incorporan información espacial del píxel con el
27
fin de desarrollar un algoritmo más eficaz. Sin embargo, en cualquier caso, se evidencia
la presencia de modelos estadísticos de fondo, ya sea considerando cada píxel o toda la
imagen completa como una variable aleatoria independiente.
Mateu (2009) establece una serie de parámetros que garantizan la robustez del sistema
de detección de objetos, estos son:
1. Modelo de fondo actualizable. El modelo de fondo utilizado para detectar los ob-
jetos debe poder evolucionar junto con la secuencia, con el fin de adaptarse a los
cambios observados en ella. Estas variaciones pueden ser consecuencia de cambios
de iluminación o la detención de objetos de primer plano en el fondo, situación en la
cual el objeto de primer plano pasaría a ser un objeto inmóvil de fondo.
2. Reducir falsas detecciones de primer plano / maximizar las detecciones correc-
tas. La estimación de la distribución estadística del fondo tiene como objetivo cal-
cular la probabilidad de que una nueva muestra pertenezca a este modelo, por tanto
es muy importante elegir correctamente un umbral de decisión que permita discernir
entre primer plano y fondo. Este objetivo puede lograrse también con la inclusión de
información espacial en los modelos de fondo.
3. Eliminar sombras o brillos de las detecciones de primer plano. Cualquiera que
sea el método de detección de primer plano utilizado, es común que se detecten
erróneamente sombras de objetos o brillo. Esto sucede porque los métodos se funda-
mentan en identificación de colores.
28
2.2.2. Sistemas de detección de primer plano
Según Mateu (2009), los sistemas de detección de objetos de primer plano, esencial-
mente, siguen la misma estructura. Como inicio se crea el modelo de fondo, en el cual
está ausente el objeto a detectar. El objetivo de este primer estadio es propiciar la correcta
estimación de la distribución estadística del fondo a partir de los valores observados.
Es importante destacar que, en esta primera etapa, no se pretende detectar objetos, más
bien se tiene el objetivo único de construir el modelo que posteriormente será usado para
realizar dicha acción. Durante este proceso todo valor será considerado siempre fondo. Esta
fase es conocida como periodo de aprendizaje o entrenamiento.
A partir del modelo generado se procederá a detectar objetos de primer plano en la
secuencia de trabajo según la metodología propia del sistema utilizado. Finalmente, todos
los píxeles que hayan sido asignados al fondo se incluirán en el correspondiente modelo de
fondo (esto es, se actualizará con el nuevo valor).
Existen dos familias de estimadores: los paramétricos y los no paramétricos. Los prime-
ros sólo pueden usarse en el caso de que la función de densidad de probabilidad a estimar
sea similar a una de las distribuciones conocidas (distribución Gaussiana, de Poisson u
otras de uso extendido), es decir, todo estimador paramétrico sólo es válido para una cierta
distribución estadística. Los segundos estimadores son válidos independientemente de la
forma que tome la función de densidad de probabilidad (también conocida como pdf (en
inglés probability density function)).
Mateu (2009) hace un estudio completo de cada uno de estos estimadores con una
29
aplicación a la detección de personas en un aeropuerto. A continuación en el cuadro 2.1 se
presenta un resumen de cada estimador, así como los métodos de detección y seguimiento.
Cuadro 2.1: Familias de estimadores
Estimadores paramétricos Estimadores no paramétricos
Running Gaussiana Average Histograma
Múltiples Gaussianas Kernel Densisty Estimation (KDE)
Stauffer y Grimson(S y G)
2.2.2.1. Running Gaussian Average
Según Mateu (2009) Running Gaussian Average es una de las primeras técnicas surgi-
das con el fin de detectar objetos de primer plano en una secuencia de vídeo. Wren (1997)
citado por Mateu (2009), propone modelar el fondo de cada píxel mediante una función
de densidad de probabilidad conocida, la función Gaussiana, la cual queda determinada
mediante sus dos parámetros: media µ y varianza σ 2 .
De este modo, para estimar la función de densidad de probabilidad del modelo a par-
tir de las muestras obtenidas durante el periodo de entrenamiento, basta con calcular los
parámetros característicos de la curva de Gauss a partir de éstas.
Para ello, se trabaja con cada uno de los canales de color (R, G, B), que pueden con-
siderarse estadísticamente independientes. Dicha independencia implica que la pdf del
30
píxel en cuestión se puede obtener como producto de las pdf marginales. Éstas se ob-
tiene de la estimación por separado de cada uno de los canales mencionados, esto es,
f (z) = fR (R)fG (G)fB (B), donde z = (R, G, B).
De este modo, a partir de los N valores observados en cada uno de los tres canales de
color durante el periodo de entrenamiento, se puede calcular µ y σ 2 capaces de representar
a todos ellos.
Con la estimación de la pdf del fondo de cada uno de los píxeles se tiene un parámetro
para decidir si un píxel de valor x se corresponde con el modelo obtenido mediante el
siguiente criterio:
| x − µ |> kσ =⇒ f oreground
Resto =⇒ background
donde k es una constante que puede tomar valores entre 3 y 5 para que puedan ser
considerados datos centralizados en la distribución normal .
Finalmente, se debe especificar el método usado para realizar la actualización de los
parámetros de la Gaussiana una vez obtenido el modelo de fondo. Esta actualización se
realiza a lo largo de toda la secuencia, mediante las siguientes ecuaciones:
µt = ρxt + (1 − ρ)µt−1
σt2 = ρ(xt − µt )2 + (1 − ρ)σt−1

2
31
donde xt es el valor del píxel en la imagen actual, µt y σt son la media y la desviación
estándar que caracterizan su pdf en ese mismo instante, y ρ es el parámetro de absorción, el
cual determina la velocidad con la que se actualiza el modelo en cada imagen (valor usual
de ρ = 0,01). Se aclara que la actualización sólo debe hacerse si el píxel pertenece al fondo
(Mateu, 2009).
2.2.2.2. Múltiples Gaussianas (Stauffer-Grimson)
El método de S y G es un estimador paramétrico que proviene de la evolución del
método de Running Gaussian Average, puesto que utiliza hasta K Gaussianas por canal de
color para estimar la pdf del modelo de cada píxel. Surge con la finalidad de mejorar la
detección de objetos en secuencias en las que aparecen variaciones periódicas en el fondo,
como por ejemplo el movimiento de objetos originados por el viento (Mateu, 2009).
Stauffer-Grimson (1999) citados por Mateu (2009), proponen este método para detectar
objetos de primer plano, mediante la suma ponderada de funciones Gaussianas por canal y
pixel, mediante:
k
X
f (z) = ωi G(z, µi , σi )
i=1
donde k es el número máximo de Gaussianas utilizadas para realizar la estimación del
modelo, G representa cada una de las Gaussianas utilizadas, ωi son las ponderaciones que
tiene cada una de las curvas, µi y σi son los parámetros estadísticos de cada distribución y
z es el valor del píxel en cuestión.
32
Esta estimación se utiliza para obtener un modelo de fondo y decidir si el píxel en
cuestión corresponde con el objeto de primer plano.
Las Gaussianas representan tanto el fondo como el primer plano y deciden a partir
de un modelo dinámico cuales pixeles corresponden al fondo y cuales a objeto de primer
plano. De esta forma será posible introducir los objetos de primer plano en el modelo de
fondo cuando permanezcan estáticos en la escena, asignando la Gaussiana correspondiente
a fondo.
Cada píxel (i, j) de la imagen se modela como una combinación de distribuciones Gaus-
sianas a partir de los factores de ponderación ωi,t que se modifican iterativamente en fun-
ción de las veces que se da el valor que recoge, formando así el modelo probabilístico del
píxel.
Los factores de ponderación se normalizan según:
ωi,t
ωi,t = Pk
j=1 ωj,t
A fin de conseguir la condición:
K
X
ωi,t = 1
i=1
Para la clasificación de un píxel como primer plano o fondo, se considera que el fondo
queda modelado por las B distribuciones Gaussianas de mayor peso y menor varianza
según la resolución de la siguiente inecuación:
33
b
!
X
B = argminb ωi,t > T
i=i
donde T es el umbral de decisión asignado (usualmente 0.6), y B es el número mínimo de
distribuciones a incluir en la sumatoria (ordenadas según ω y σ ), para que se cumpla la
inecuación.
De este modo, las B primeras distribuciones Gaussianas serán las que modelarán la
función de densidad de probabilidad del fondo, puesto que normalmente es más estático
y aparece con más frecuencia, correspondiéndose con aquellas Gaussianas que han sido
utilizadas más veces y que son más compactas.
Para comprobar si el valor del píxel de entrada encaja en alguna distribución Gaussiana
del modelo probabilístico del píxel, se evalúa la siguiente inecuación:
|xt − µi,t | > kσi,t
Donde xt es el valor de un canal de color del píxel estudiado en el fotograma t, µi,t es la
media de la Gaussiana i-ésima y σi,t la desviación estándar de la Gaussiana i-ésima, por
tanto:
1. Si la inecuación se cumple para todas las Gaussianas, entonces se decide que el valor
xt pertenece al primer plano, puesto que no encaja con el modelo probabilístico del
píxel aprendido hasta el momento. En este caso, se generará una nueva Gaussiana con
el fin de permitir adaptar el modelo al fondo, eliminando la distribución con menor
peso.
34
2. Si la inecuación no se cumple para una Gaussiana, se supone que el valor encaja con
el modelo probabilístico modelado mediante la misma (si la inecuación no se cumple
para más de una Gaussiana, se supondrá que la función que mejor representa al píxel
es la de menor varianza). En este caso, si el valor del píxel encaja con una de las B
primeras distribuciones Gaussianas se asignará a fondo, debido a que la frecuencia
con la que ha aparecido es lo suficientemente elevada como para que sea considerado
fondo.
Finalmente, la actualización del modelo se realizará mediante las siguientes expresio-
nes:
Actualización de la media y la varianza (afecta sólo a la distribución Gaussiana
que ha encajado):
µt = ρxt + (1 − ρ)µt−1
σt2 = ρ(xt − µt )2 + (1 − ρ)σt−1

2
Actualización de los pesos (afecta a todas las distribuciones que conforman el mo-
delo):
ωk,t = (1 − α)ωk,t−1 + α(Mk,t )
donde ω es un coeficiente de absorción (distinto a ρ, normalmente se suele usar un valor
fijo 0,005) y Mk,t es 1 para la función Gaussiana que ha encajado y 0 para las que no.
35
2.2.2.3. Histograma
Bajo el supuesto que se debe estimar la función de densidad de probabilidad de una
variable aleatoria cuyo espacio muestral es discreto, los histogramas se basan en contar el
número de veces o la frecuencia con la que aparece cada uno de los valores de dicho espacio
muestral en las muestras que se tienen en cuenta para realizar la estimación (Mateu, 2009).
Con ello, cada vez que se requiera actualizar el histograma se incrementa en 1 el va-
lor que corresponda con la muestra utilizada, como si tratara de una concatenación de N
contadores independientes.
En el supuesto caso de que sea necesario utilizar un histograma para realizar la estima-
ción de una variable aleatoria continua (el espacio muestral está formado por un conjunto
infinito de valores contenidos dentro de un intervalo), simplemente sería necesario decidir
el número de intervalos en los que dividir el espacio muestral y la longitud de los mismos,
cuantificando los infinitos valores en L niveles(Mateu, 2009).
El resultado de un histograma es un gráfico escalonado con distintas alturas para cada
posible valor o rango de valores, dando una idea de la probabilidad que tendrá asociada
cada uno. Los valores que más se hayan repetido entre las muestras tendrán asociada una
probabilidad mayor que aquellos que casi no hayan aparecido.
El histograma es válido para una pdf continua, sin embargo, se requieren muchas mues-
tras para estimar correctamente la pdf (Mateu, 2009).
36
2.2.2.4. Kernel Density Estimation (KDE)
Mateu (2009) establece que el (KDE) es un método no paramétrico que permite estimar
la función de densidad de probabilidad de una variable aleatoria a partir de algunas de sus
muestras.
Su principio de funcionamiento está basado en el uso de funciones Kernel, cuya deno-
minación se refiere a toda función integrable real definida no-negativa que cumple:
Z ∞
1. Área unitaria K(u)du = 1.
−∞
2. Simétrica K(u) = K(−u), ∀u.
Sea x(0), . . . , x(N − 1) el conjunto de muestras conocidas de una variable aleatoria X
y K(x) la función Kernel utilizada, se obtiene la estimación de la pdf de x como la suma
promediada de todas las funciones kernel centradas, es decir las K(x)(para cada una de
ellas y en cada una de las muestras conocidas), es decir:
N −1
1 X N(x − xi )
f (x) =
N i=1 h
donde h es el ancho de la función Kernel utilizada.
Normalmente, se usan las funciones kernel Gaussianas por su simplicidad y suavidad.
Cabe destacar que la calidad de la estimación no reside principalmente en la función Kernel
utilizada, sino en el ancho seleccionado (Mateu,2009).
37
2.2.2.5. Sistema de post-procesado
Según Mateu (2009), los sistemas basados en substracción de fondo tienen el riesgo de
detectar las sombras como parte del objeto, debido a la no correspondencia con el modelo
aprendido en el sistema de procesado.
Esta asignación incorrecta suele ser problemática en la mayoría de las aplicaciones
prácticas en las que se utiliza los modelos de procesados, puesto que distorsionan las ca-
racterísticas propias de los objetos.
Debido a que las sombras tienen las características del modelo de fondo, aunque con
ciertos tonos más oscuros, hay distintas técnicas que utilizan sistemas de pos-procesado,
con el fin de eliminar parcial o totalmente las falsas detecciones producidas por este fe-
nómeno. Algunos son algoritmos aplicados a la salida del sistema detector para corregir
la máscara obtenida, otros se basan en realizar una transformación a la entrada del mismo
detector para reducir la aparición de sombras en la detección (Mateu, 2009).
Mateu (2009), señala tres principales algoritmos para la corrección de estas falsas de-
tecciones, los cuales son: Método de luminancia normalizada, Método híbrido y el Método
reflectancia. Sin embargo, para efectos de nuestra investigación, el ácaro ni ningún otro
elemento involucrado en la zona de estudio (celda) genera sombra, por lo que se ha consi-
derado no entrar en detalles en el estudio de estos algoritmos.
38
2.2.2.6. Sistemas de detección de primer plano con regularidad espacial
Se describen los principales modelos de detección de primer plano con regularidad
espacial, con carácter didáctico, pues para el desarrollo del algoritmo de detección y segui-
miento del ácaro V. Destructor no se consideró ningún modelo de estos como tal.
Según Mateu (2009), todos los sistemas de detección de primer plano clásicos tienen en
común que están basados únicamente en la información de un píxel. Es decir, se trata cada
uno de los píxeles de la imagen como una variable aleatoria independiente, modelando para
cada uno de ellos su propio fondo en función de los valores acumulados. De modo que, una
vez obtenido el modelo, se procede a decidir si el respectivo valor del píxel en la nueva
imagen corresponde al fondo o a un objeto de primer plano.
Con el fin de aumentar la eficiencia en la detección de objetos, existen técnicas que
intentan aprovechar la información contenida en el entorno de cada píxel, obteniendo un
modelo más complejo. Para ello, pretenden aprovechar la persistencia temporal de los ob-
jetos reales en la secuencia, es decir, que los objetos a detectar tienden a permanecer en la
misma vecindad espacial y a conservar el color coherente.
Mittal & Paragios (sin año); Sheikh& Shah (sin año) citados por Mateu (2009), propo-
nen un único modelo de fondo en vez de L × M modelos independientes (correspondientes
a los píxeles). Para ello, se toma un vector de características de 5 dimensiones, acumulando
información de color y de posición de cada uno de los píxeles (r, g, b, x, y).
Teniendo claro que no existe ninguna relación entre la posición x e y que ocupa un píxel
en la secuencia con los canales de color observados, se podrá asumir también en este caso
39
la independencia de cada una de las componentes usadas. Por tanto, la función de densidad
de probabilidad del fondo que se pretende estimar será el resultado de multiplicar cada una
de sus marginales
fR,G,B,X,Y (r, g, b, x, y) = fR (r) · fG (g) · fB (b) · fX (x) · fY (y)
pudiendo estimar cada una de ellas a partir de las muestras acumuladas. Finalmente, se
clasificará cada uno de los píxeles teniendo en cuenta la pdf de fondo obtenida.
Se detallarán dos de los métodos comunes en la detección de primer plano con regula-
ridad espacial.
2.2.2.7. Inclusión de información espacial en el modelo: KDE 5D
Dada la necesidad de implementar una técnica de detección de primer plano que hicie-
ra una clasificación en función del entorno del píxel, surgió la idea de adaptar el algoritmo
KDE para que también incluyera información espacial (adelante, KDE 5D), pudiendo esti-
mar así una función de densidad de probabilidad del fondo de toda la imagen.
Para la estimación de la función de densidad, Mittal & Paragios (sin año); Sheikh,
& Shah (sin año ) citados por Mateu (2009); proponen que basta trabajar con muestras
pertenecientes a R5 de la forma z = (r, g, b, x, y).
El funcionamiento del sistema KDE 5D, como en todo sistema de detección de primer
plano, está basado en tres fases: aprendizaje, decisión y actualización.
Durante el periodo de aprendizaje, es posible obtener un único modelo del fondo de
la secuencia a partir de la acumulación de N imágenes. Mediante esta acumulación se
40
consigue ahorrar espacio en memoria, puesto que el valor de las componentes x e y quedará
implícito según la posición donde se guarden los valores de color (Mateu, 2009).
Una vez acumulados los N fotogramas, se procederá a obtener el modelo de fondo me-
diante el estimador KDE, tratándose cada una de las componentes de forma independiente
a través de la expresión:
P −1 d
1 XY K(zj − ui,j )
f (z) =
N i=0 j=1 hj
donde P representa el número de muestras con las que se modela el fondo (las cuales
pertenecen a R5 , por lo que d = 5) y hj el ancho de banda de la función Kernel.
Una vez modelado el fondo de la secuencia, se procederá a la detección de objetos
de primer plano. Para ello, es necesario calcular la probabilidad que el píxel pertenezca a
fondo teniéndose en cuenta también los valores anteriores de todo el entorno, por lo que:
−(zj (m, l) − ui,j (m, l))2

M L−1 N
−1 X d
−1 Y
1 X X 1 2σj2
p(z) = q e
M ·N ·L m=0 l=0 i=0 j=1 2πσ2j
donde L y M son el número de filas y columnas del fotograma respectivamente, uti-
lizándose un umbral de decisión como criterio clasificador entre fondo y primer plano (el
mismo para todos los píxeles)
si p(z) < th (umbral) =⇒ se decide primer plano.
si p(z) > th (umbral) =⇒ se decide fondo, con z ∈ bg.
41
Como consecuencia de que las componentes de dominio son independientes de la ima-
gen seleccionada entre las N acumuladas, en el sumando con índice i se puede sacar factor
común el producto de las Gaussianas asociadas a las componentes de dominio.
Dado que, para cada píxel los valores ui , x(m, l) y ui , y(m, l) corresponden, respectiva-
mente, a m y l (la posición que ocupa el píxel en la imagen), cada una de las Gaussianas de
dominio se puede sustituir por las expresiones ωx (m, l) y ωy (m, l), puesto que no dependen
de la variable temporal i.
Por tanto la ecuación anterior se transforma en :
−(zj (m, l) − ui,j (m, l))2

M L−1
−1 X N d
−1 Y
1 X 1 X 1 2σj2
p(z) = ·ωx (m, l) · ωy (m, l) · q e
M · L m=0 N
l=0 i=0 j=1 2πσ2j
con z ∈ bg.
Por este motivo, se ve el cálculo como un promedio ponderado de la probabilidad de
que distintos píxeles pertenezcan a fondo, donde cada una de ellas se calcula como en KDE
3D (para todos los píxeles) y donde las Gaussianas de dominio hacen el papel de factores
de ponderación. De este modo, es posible dar un mayor peso a la probabilidad asociada al
propio píxel que al resto, disminuyendo el peso proporcionalmente a la distancia que los
separa (debido a que se rigen por el producto de Gaussianas de dominio).
A pesar de que se tenga en cuenta el entorno del píxel, el peso asociado al mismo sea
mayor que el de cualquier otro píxel, teniendo a su vez mayor importancia los píxeles más
cercanos que los lejanos.
De esta forma, si mediante KDE 3D un píxel es asignado a fondo indebidamente y el
42
resto de los vecinos han sido asignados a primer plano correctamente, este sistema es capaz
de corregir la no detección del píxel en cuestión, sin necesidad de aplicar ninguna técnica
de post-procesado, principal objetivo de este tipo de algoritmos.
La aparición de gran cantidad de pequeñas falsas detecciones puede deberse a la acción
de algún agente externo sobre el fondo de la secuencia, como puede ser la acción del viento
o incluso la propia cámara. Por tanto, un modelado de fondo genérico (no centrado en el
píxel) puede aportar gran cantidad de mejoras en secuencias donde el fondo es dinámico.
Teniendo presente que cada una de las Gaussianas son función Kernel, el uso de estas
componentes de dominio no modifica el área de la pdf del modelo. Esto se debe a que la
suma de todos los valores del Kernel resulta uno, por lo que el resultado total será una
probabilidad del orden de magnitud de las de KDE 3D.
Por tanto, se suma de forma ponderada las distintas probabilidades obtenidas mediante
KDE 3D con el fin de asegurar una cierta regularidad espacial en el entorno del píxel. Como
consecuencia, el umbral de decisión en este caso coincide con el utilizado en KDE 3D.
2.2.2.8. Estimación Bayesiana mediante dos modelos
Otra metodología es la que proponen Sheikh & Shah (sin año) citados por Mateu
(2009), la cual consiste en generar dos modelos para toda la imagen, uno para modelar
el fondo y otro para el primer plano y clasificar a partir de estos cada uno de los píxeles al
modelo adecuado.
En este algoritmo las muestras son de la forma z = (r, g, b, x, y), en dicha implemen-
43
tación se modela el fondo de la secuencia mediante una variante KDE con información
espacial, a partir de las N muestras acumuladas durante el aprendizaje
N
1 X
f (z|ψb ) = Kb (z − mi )
N i=1
A diferencia con el método anterior, se usa una variante para el modelo de los objetos
de primer plano, puesto que consiste en la suma de dos distribuciones estadísticas (Mateu,
2009).
1
Por un lado, una distribución uniforme representada mediante γ = ,
R·G·B·L·M
donde L es el número de columnas del fotograma, M el número de filas y (R,G,B) repre-
sentan los posibles valores de cada uno de los canales de color. Por otro lado, se tiene la
distribución proveniente de la estimación KDE con información espacial (análoga a KDE
5D), ponderadas ambas por α y (1 − α), respectivamente, es decir:
N
1−αX
f (z|ψf ) = αγ + Kp (z − mi )
N i=1
Esta combinación tiene por objetivo detectar y aprender de los objetos de primer plano.
Mientras la distribución uniforme pretende tener en cuenta todo valor de (R,G,B) para todo
píxel, con el fin de poder representar a todo objeto nuevo (detectar objetos nuevos), la
distribución KDE tiene como objetivo aprender de él y adaptar la pdf estimada para poder
ser detectado más fácilmente en posteriores imágenes.
Es decir, suponiendo que en un instante t aparece un objeto en la secuencia, éste será
asignado al modelo de primer plano, debido a la no coincidencia con el fondo observado
44
y a que el modelo de primer plano tiene en cuenta todos los posibles valores de color por
píxel (Mateu, 2009).
De este modo, una vez asignado al modelo, éste se actualizará acumulando el valor
observado en el píxel (i, j) de dicho modelo, por lo que la probabilidad del mismo para
una similar distribución de color en sus proximidades aumentará (debido al aprendizaje
aportado por KDE).
Una vez explicados los modelos, el criterio de decisión entre ambos consistirá en com-
probar la siguiente relación:

f (z|ψb )
τ = − ln
f (z|ψf )
Asignándose a la etiqueta l = 0 si τ > k y l = 1 en el resto, donde k es un umbral.
En la práctica, no se decide directamente entre primer plano/fondo ya que, tal y co-
mo se ha razonado anteriormente, no hay total independencia entre píxeles vecinos. Para
incluir esta dependencia, se maximiza la probabilidad a posteriori asumiendo un modelo
denominado Ising como probabilidad a priori de las etiquetas:
P P
P X
X f (z|ψb ) X
ln li + λ(li lj + (1 − li )(1 − lj ))
i=1
f (z|ψf ) i=1 j=1
donde li corresponden a las etiquetas, P es el número de píxeles y λ es una constante
positiva.
De este modo, considerando una región de la imagen, el sistema es capaz de detectar
objetos de primer plano mediante la optimización de una función que depende de más de
45
un píxel, rompiéndose con la idea de que los píxeles son independientes. Esta optimización
se hace mediante la técnica de graph-cuts.
Una variante de este algoritmo es cuando se utiliza varios modelos para los objetos de
primer plano, uno para cada uno de los objetos de primer plano y otro uniforme que permita
detectar la aparición de objetos nuevos en la secuencia, a este modelo se le demomina
Estimación Bayesiana mediante varios modelos (Seguimiento), para mayor detalle puede
observarse en Mateu (2009).
2.2.3. Seguimientos de objetos
En la última década se ha considerado el seguimiento visual de objetos como una tarea
de especial interés en muy diversas áreas. Hanxuan, Feng, Liang & Zhan (2011), seña-
lan que “the use of visual tracking is pertinent in the tasks of motion-based recognition,
automated surveillance, video indexing, human-computer interaction and vehicle naviga-
tion, etc.” (p. 3823). Además, se ha evidenciado un avance enorme en las propuestas de
algoritmos de seguimiento más recientes: se ha evolucionado de sistemas con supuestos
como estabilidad en la forma del objeto y movimientos suaves a métodos capaces de resol-
ver problemas como la aparición o salidas bruscas de escena o movimientos en apariencia
aleatorios.
Hanxuan et al. (2011), señalan tres características que debe tener un sistema de segui-
miento de objetos para ser considerado adecuado. El diseño y construcción de un buen
sistema de seguimiento de objetos debe considerar:
46
1. la capacidad de poder seguir el objeto de interés aún en condiciones complicadas
como cambios de iluminación, movimiento desordenado o presencia de ruido. Esta
característica se conoce como robustez del sistema.
2. la adaptabilidad del método de detección a los cambios que pueda sufrir el objeto
que interesa seguir para evitar falsas detecciones u omisiones y
3. una condición deseable es que el procesamiento sea en tiempo real y esto signifi-
ca que se debe contar con algoritmos de alto rendimiento así como de equipo que
posibiliten el procesamiento ágil y optimizado de información.
El trabajo propio de seguir un objeto en una secuencia de video es complejo y demanda,
según Hanxuan et al. (2011), una descripción detallada del objeto (forma, textura, posición,
color) y la incorporación de la información del contexto en el que se encuentra el objeto.
Una adecuada descripción del objeto de interés permite establecer los parámetros más ade-
cuados para caracterizarlo y fortalecer la robustez del método de seguimiento incorporado.
Además, es frecuente que el objeto se distinga de cierta forma del contexto en el que se
encuentra, por lo que el complemento de una descripción detallada con la incorporación
de la información del ambiente aumenta, generalmente, la confiabilidad de la detección del
objeto.
Como se ha mencionado, la descripción inicial del objeto es una etapa crucial y está
en relación directa con la calidad de proceso de seguimiento, luego debe incorporarse la
información del contexto y establecer los criterios para la actualización del método. Para
47
esto es imprescindible la discriminación y selección de las funciones más adecuadas para
incorporarlas al método que se proponga.
Hanxuan et al. (2011) realizan una comparación exhaustiva entre las principales des-
criptores de características para el seguimiento visual de objetos y los alcances de los mé-
todos de seguimiento. Mencionan como los descriptores de uso más difundido las caracte-
rizaciones por gradiente, color, textura, descriptores espacio-temporales y fusiones de estos
en un mismo método. Además, aclaran que los cambios en la apariencia de un objeto se
tipifican como intrínsecos (deformaciones en el objeto) o extrínsecos (cambios de luz o
enfoque) y esto solo puede ser manejado por algoritmos que se actualicen a estas modifi-
caciones.
Dada esta dualidad en los cambios en la apariencia de un objeto, Hanxuan et al. (2011),
describen dos tendencias que se han adoptado en los sistemas de seguimiento: los métodos
de aprendizaje generativos y los discriminativos. Los primeros se caracterizan por ocuparse
de la variación de la apariencia del objeto y por su frecuente actualización para adaptarse a
las nuevas formas del objeto. Los métodos discriminativos (llamados también tracking by
detection) se utilizan para distinguir el objeto del fondo del video por la actualización de
un clasificador previamente entrenado.
Esta última tendencia es de especial interés por adecuarse a los objetivos de esta pro-
puesta y por seguir un proceso similar al que se implementó en este trabajo. Al respecto,
Hanxuan et al. (2011), señalan que en estos métodos
48
a target object identified by the user in the first frame is described by a set of fea-
tures. A separate set of features describes the background, and a binary classifies
separates target from background in successive frames. To handle appearance chan-
ges, the classifies is updated incrementally over time. Motion constraints restrict the
space of boxes to be searched for the target (p. 3827)
Sobre las tendencias futuras en lo referente al seguimiento de objetos en video, estos
autores argumentan que una combinación en un marco coherente de los méritos de los
métodos generativos y discriminativos sería una dirección muy promisoria.
2.2.4. El software MatLab
Según Gómez (2009) MATLAB (abreviatura de MATrix LABoratory, laboratorio de
matrices) es un software matemático que ofrece un entorno de desarrollo integrado (IDE)
con un lenguaje de programación propio (lenguaje M) y que está disponible para las plata-
formas Unix, Windows y Apple Mac OS X.
MatLab fue creado por The MathWorks en 1984, surgiendo la primera versión con la
idea de emplear paquetes de subrutinas escritas en Fortran en los cursos de álgebra lineal
y análisis numérico, sin necesidad de escribir programas en dicho lenguaje. El lenguaje de
programación M fue creado en 1970 para proporcionar un sencillo acceso al software de
matrices LINPACK y EISPACK sin tener que usar Fortran.
Actualmente el software MatLab es muy utilizado, sobre todo a nivel empresarial y
en ambientes académicos y científicos. Al respecto, Gómez (2009) señala que “en el año
49
2004 , se estimaba que MatLab era empleado por más de un millón de personas en ámbitos
académicos y empresariales” (p. 23).
Rodríguez (2003) y Gómez (2009) señalan que entre las principales prestaciones de
MatLab destacan:
a La manipulación de matrices.
b La representación de datos y funciones.
c La implementación de algoritmos y la creación de interfaces de usuario (GUI).
d La comunicación con programas en otros lenguajes y con otros dispositivos hardwa-
re.
MatLab dispone de un código básico y de varias librerías especializadas denominadas
Toolboxes. En estos Toolboxes se pueden trabajar las áreas principales en el mundo de
la ingeniería y la simulación. En particular, debe destacarse Image Processing Toolbox
(paquete para procesado de imágenes) que se constituye en la principal herramienta de este
proyecto.
Con las palabras de Rodríguez (2003) MatLab es sin duda “una magnífica herramien-
ta de alto nivel para desarrollar aplicaciones técnicas, fácil de utilizar y que aumenta la
productividad de los programadores respecto a otros entornos de desarrollo” (p. 22).
Con el propósito de familiarizarse con los principales comandos utilizados en el al-
goritmo desarrollado en este proyecto, a continuación se realiza una breve descripción de
estos.
50
2.2.4.1. Principales funciones en el desarrollo del algoritmo
Para cargar las imágenes en el ambiente de MatLab se utiliza el comando imread.
La sintaxis para este comando es:
A = imread{’nombre_del_archivo’}
Donde ’nombre_del_archivo’ es una cadena de caracteres que determina el
nombre de la imagen con su respectiva dirección de búsqueda, mientras que la variable
A almacena la matriz obtenida.
Una vez cargada una imagen a escala de grises en una variable A, se podría utilizar la
función size para determinar las dimensiones de misma. La sintaxis en este caso sería
[M,N]= size(A) donde la variable M almacenará el número de filas de la imagen A,
mientras que la variable N el número de columnas.
Para mostrar imágenes en MatLab se utiliza el comando imshow. Con la sintaxis
imshow(A) se muestra la imagen almacenada en A.
2.2.5. Tipos de datos
Para indexar las coordenadas de la imagen se utilizan números enteros. Sin embargo, los
valores de los píxeles no se encuentran restringidos esta condición, pueden tener cualquier
valor en el intervalo [0, 255] e incluso números complejos (en el caso de Transformadas de
Fourier).
Todos los cálculos numéricos desempeñados por MatLab se realizan considerando que
los números son del tipo double (esto es números en formato coma flotante en el inter-
51
valo [0, 1] ), por lo que muchas de las operaciones consideradas en el algoritmo tiene este
formato.
El tipo de dato uint8 (entero en el intervalo [0, 255]) se presenta cuando se carga una
imagen al ambiente de MatLab por del comando imread. Otro tipo de dato que puede
utilizarse para la representación de imágenes es el logical, el cual permite representar
en forma compacta imágenes binarias, en caso los valores posibles de 0 y 1.
Una imagen a escala de grises es una matriz cuyos valores han sido escalados para re-
presentar un determinado número de intervalos. MatLab permite hacer conversiones del ti-
po de datos, para lo cual se emplea la siguiente sintaxis: B = tipo_de_dato(A),donde
tipo_de_dato es uno de los mencionados anteriormente (uint8,logical o double).
De esta forma, el tipo de dato atribuido a la matriz de A será convertido al tipo de dato de-
signado por tipo_de_dato y se almacena en la matriz B.
La función im2uint8(A) indaga el tipo de dato de la imagen de entrada y realiza, a
partir de este, las operaciones necesarias para convertirla al intervalo de valores definidos
en uint8.
A continuación se presenta un ejemplo de la aplicación de este comando a una matriz
A de dimensión 2 × 2.
A = [−0,265 0,845 1 0]
MatLab genera:
A =
-0.26 0.84
1.00 0
52
Si se desempeñara la conversión se escribiría B=im2uint8(A) se tiene:
B =
0 215
255 0
Note que al menor valor de A se le asigna un 0 y al mayor un 255 estos valores corres-
ponden al mínimo y máximo del formato uint8.
2.2.6. Operaciones con Matrices
Con frecuencia es necesario realizar operaciones que engloben la totalidad de los ele-
mentos de la imagen, por ejemplo encontrar el píxel de valor máximo o mínimo represen-
tado en una imagen.
Para la matriz B definida por

 
 1 12 33
 
 
B=
14 15 6 

 
 
47 18 9
con el comando max(B) se obtendrá el máximo valor de cada columna.
ans =
47 18 33
Luego al utilizar la forma concatenada max(max(B)) se obtiene el máximo valor
global de la matriz B.
ans =
47
53
Las estructuras de control se basan en una serie de condiciones lógicas que permiten
cambiar el flujo de las operaciones en un programa, tales estructuras no son únicas de pro-
grama MatLab, más bien son consideran con la raíz de cualquier lenguaje de programación.
El cuadro 2.2 presenta las principales estructuras de control en el ambiente MatLab.
Cuadro 2.2: Estructuras de control en la programación de MatLab
Estructura Descripción
if if, en conjunción con else y else if, ejecutan una serie de
instrucciones basados en si una determinada condición lógica
for Ejecuta un conjunto de instrucciones un determinado número de veces
while Ejecuta un conjunto de instrucciones un determinado número de veces
tanto una condición lógica se cumpla
break Termina la ejecución de un ciclo for o while
continue Pasa del control al siguiente ciclo for saltando las instrucciones
restantes del cuerpo de ciclo
switch ... case Ejecuta diferentes grupos de instrucciones dependiendo del valor de
una variable asignada a switch
54
2.2.7. Operaciones Morfológicas
Las operaciones morfológicas se realizan sobre imágenes binarias basadas en formas.
Estas operaciones toman como entrada una imagen binaria regresando como resultado una
imagen también binaria. El valor de cada píxel de la imagen binaria obtenida por una ope-
ración morfológica es basado en el valor del correspondiente píxel de la imagen original y
de sus vecinos. Entonces eligiendo apropiadamente la forma de los vecinos a considerar,
puede construirse operaciones morfológicas sensibles a una forma en particular (Valdemar
& Zaldivar, 2010).
Las principales operaciones morfológicas son la dilatación y la erosión. La dilatación
corresponde con la idea intuitiva de ensanchamiento o de añadir una capa de píxeles a la
estructura de la imagen. La dilatación es controlada por medio de una figura denomina-
da estructura de referencia (o en algunos casos elemento estructural)(Cuevas, Zaldivar &
Pérez. 2010).
Esta operación es definida en la notación de conjuntos de puntos como
I ⊕ H = {(x′ , y ′) = (x + i, y + j)| (x′ , y ′) ∈ PI ; (i, j) ∈ PH }
Como se aprecia en la ecuación anterior, el conjunto de puntos que constituyen la di-
latación de la imagen I y la estructura de referencia H, quedan definidos por todas las
posibles combinaciones de los pares de coordenadas de los conjuntos de puntos PI y PH .
(Cuevas et al., 2010).
La erosión se considera como la operación cuasi-inversa de la dilatación, la cual expre-
55
sada en la notación de conjuntos de puntos es definida como
IΘH = {(x′ , y ′) |(x′ + i, y ′ + j) ∈ PI (i, j); ∀(i, j) ∈ PH }
La expresión anterior muestra que para cada punto (x′ , y ′) de la imagen, el resultado
de la aplicación de esta operación morfológica está compuesto por los puntos (x′ , y ′) para
los cuales todos los posibles valores (x′ + i, y ′ + j) que se encuentran en I. (Cuevas et al.,
2010).
En MatLab las funciones utilizadas para realizar estas dos operaciones morfológicas
son erode y dilate y el formato de estos comandos es

X=erode(X,se) y Y=dilate(Y,se)
donde X, Y son las imágenes y se el elemento estructural.
A continuación se presentan unas aplicaciones de las funciones dilatar y erosionar:
Figura 2.6: Ejemplo de dilatación
Cuevas et al. (2010) señalan que las operaciones de dilatación y erosión no pueden
ser consideradas en el sentido estricto inversas, debido a que no es posible reconstruir
56
completamente una imagen erosionada, mediante la aplicación sucesiva de dilataciones, lo
mismo aplica en sentido inverso. Sin embargo, presenta una estrecha relación dual, ya que
una dilatación de los píxeles con valor de 1 de una imagen puede llevarse a cabo realizando
una erosión del fondo o de los píxeles en cero. Para efectos del algoritmo que se desarrollar
en esta investigación esta última característica es de suma importancia y aplicación.
Figura 2.7: Ejemplo de erosión
2.2.8. Otras funciones
En esta sección se describen y ejemplifican algunas funciones adicionales que se han
utilizado para el desarrollo del algoritmo.
find Esta función devuelve los índices donde las entradas de una matriz A son distintas
de cero.
Dada tiene una matriz A particular, la ejecución del comando [I,J]=find(A) se
obtiene dos vectores: el vector I da la componente i y el vector J da la componente j
57
donde la entrada ai,j de A es distinta de cero.

A = I = J =
0 0 1 2 1
1 0 0 3 1
0 0 1 1 3
3 3
imfill Esta función rellena huecos en una imagen. La figura 2.8 muestra la aplicación
de esta función
Figura 2.8: Aplicación de la función imfill
bwlabel Esta función realiza un etiquetado de los componentes existentes en la imagen
binaria, lo que puede considerarse una forma de averiguar cuántos elementos (considerando
como conglomerados) están presentes en la imagen. En la figura 2.9 se muestra el efecto
de esta función.
Las funciones cart2pol y pol2cart son utilizadas para pasar de coordenadas
cartesianas a rectangulares y de rectangulares a cartesianas, respectivamente. Sus sintaxis
es
58
Figura 2.9: Aplicación de la función bwlabel
[TH,R]=cart2pol(X,Y) y [X,Y] = pol2cart(TH,R)
donde (X, Y ) son las componentes rectangulares y en coordenadas polares T H y R co-
rresponde a la componentes angulares y radiales, respectivamente.
La función sort realiza un ordenamiento ascendente de los elementos de un vector X.
Su sintaxis es
[Y,i]=sort(X)
devuelve el vector ordenado Y , y un vector i con las posiciones iniciales en X de los
elementos en el vector ordenado Y .
mean es una función que devuelve el valor medio de los elementos de un vector X.
Con la función graythresh se determina un umbral de la imagen X de modo que
al aplicar dicho umbral se genera una imagen Y en blanco y negro según los valores de la
imagen original X. En la figura 2.10 se muestra su aplicabilidad.
59
Figura 2.10: Aplicación de la función graythresh
60
61
Capítulo 3
MARCO METODOLÓGICO
3.1. Tipo de Investigación
Puesto que el fin primordial de este proyecto es la creación de un sistema inteligente
que permita la detección y seguimiento del ácaro V. Destructor, en poco tiempo y con
alta eficiencia, esta investigación tuvo como pilar principal los ensayos, evaluaciones y
correcciones de algoritmos alternativos utilizados para dicho propósito.
En términos generales, la metodología planteada se orientó hacia un diseño de trabajo
experimental. Según Briones (2002):

En las investigaciones experimentales el investigador tiene el control de la variable
independiente o variable estímulo, la cual puede hacer variar en la forma que sea
más apropiada a sus objetivos. De igual manera, puede controlar la conformación
de los grupos que necesita para su estudio(p.37).
Estas consideraciones se ajustan de manera adecuada a la propuesta de este proyecto.

3.2. CAPTURA DE VIDEO CAPÍTULO 3. MARCO METODOLÓGICO
A groso modo, la estrategia seguida incluyó la obtención de información (videos e iden-
tificación de modelos matemáticos sobre métodos de procesado de imágenes), creación del
algoritmo (esto involucra desde la elección de las técnicas más adecuadas según lo obje-
tivos perseguidos hasta la implementación, revisión y corrección del mismo), evaluación
del algoritmo (desde varias aristas: eficiencia, uso de memoria, precisión, valoración de un
biólogo especialista) y una etapa final que consistió en la automatización del proceso para
ser trasferida a otras situaciones similares.
El diseño de trabajo se guió básicamente por las etapas:
3.2. Captura de Video
Para esta etapa inicial se contó con la colaboración del CINAT pues biológicamente es
de mucho interés el comportamiento del ácaro en el periodo de pupa de la abeja melífera.
Los videos corresponden a varios días de filmación y por costumbre de los expertos del
CINAT, además es una forma de compresión, la captura se realizó en un formato acelerado.
Es importante señalar que esta forma de grabación (3 frames por segundo) dificultó el
trabajo de procesado pues los videos no son de la mejor calidad y resolución, sin embrago es
una ventaja enorme para hacerlos registro del comportamiento del ácaro de forma manual
(como se realizan actualmente en el CINAT).
Para que el video pudiese ser trabajado en MatLab es necesario que este tenga un for-
mato específico. Por tanto, la etapa siguiente fue la conversión del video original a formato
62
CAPÍTULO 3. MARCO METODOLÓGICO 3.3. PROCESADO DE IMÁGENES
.avi y la toma de una muestra de pocos segundos en las que se hicieron las pruebas de los
algoritmos que se crearon. Para lograr superar esta etapa se utilizó software libre disponible
en Internet.
3.3. Procesado de Imágenes
Es la etapa de mayor trabajo pues incluye desde la selección de los métodos más ade-
cuados para la resolución del problema que nos ocupa, la implementación, análisis, correc-
ción, hasta la evaluación de los resultados obtenidos por el algoritmo. Como sub etapas se
enumeran:
3.3.1. Determinación de técnicas para la detección y seguimiento de
objetos
Con un análisis detallado de estudios realizados con problemas afines (detección de
objetos abandonados en aeropuertos, conteo y seguimiento de automóviles en carretera,
determinación de características en rostros humanos, entre otros) se valoraron los méto-
dos y técnicas de detección, seguimiento y registro que se adecuaban de forma idónea al
tratamiento digital del video del ácaro.
63
3.3. PROCESADO DE IMÁGENES CAPÍTULO 3. MARCO METODOLÓGICO
3.3.2. Implementación del procesado de video en una muestra
Dada la elección previa de los métodos y técnicas más adecuadas se procedió a la
creación del algoritmo para el problema particular de detectar y seguir el ácaro. Con la
versión previa se hicieron implementaciones en una porción del video de algunos segundos,
con esto se tuvo una primera aproximación sobre la efectividad del algoritmo.
En esta etapa es importante señalar que el algoritmo propuesto no es una transmisión
de alguno utilizado en un problema afín, lo que se hizo fue utilizar algunas ideas, cuyos
efectos ya han sido estudiados, analizarlas, complementarlas, combinarlas y crear de esta
forma un algoritmo con matices innovadores y con completa afinidad al problema que nos
ocupa.
3.3.3. Evaluación del algoritmo
Aunque la evaluación del algoritmo está presente en todo el proceso, se establece como
una etapa, pues marca el avance hacia un estadio superior del proceso o establece el pun-
to donde se hace necesario echar la mirada atrás y revalorar el camino recorrido. Con la
implementación del algoritmo se determinó, en primera instancia, si éste cumplía con los
requerimientos establecidos en los objetivos trazados. Cuando se logra esto, se procede a la
implementación de un sistema automático basado en el algoritmo propuesto, si no se anali-
za la posibilidad de introducir mejoras, sustituir las técnicas utilizadas o bien complementar
el algoritmo.
Para determinar si el algoritmo satisface las expectativas y si es eficiente, se consideró
64
CAPÍTULO 3. MARCO METODOLÓGICO 3.3. PROCESADO DE IMÁGENES
en primera instancia probarlo en una muestra del video y posteriormente someterlo a la
consideración técnica de expertos (colaborador de la Universidad de Las Palmas, Gran
Canaria) y la valoración de los colaboradores del CINAT.
3.3.4. Implementación de sistema inteligente
Cuando el algoritmo fue considerado eficiente, robusto y acorde a las demandas traza-
das en los objetivos de esta investigación, se inició la creación de un sistema automático
para lograr la implementación en situaciones similares. Es decir, el sistema es tal que fun-
cione para cualquier video que el CINAT necesite detectar y seguir los movimientos del
ácaro. Además, se incluyeron algunas frases en la interfase de MatLab, que permite al
usuario un uso efectivo, sin demandar conocimientos en programación.
65
66
Capítulo 4
DISCUSIÓN Y ANÁLISIS
Para discutir los resultados obtenidos en el proceso de investigación se muestra la evolu-
ción natural del algoritmo y el análisis surgido por la superación de cada etapa. Se presenta
el proceso de obtención y lectura del video sobre el que se realizó el trabajo, las etapas de
programación (determinación de la zona activa de movimiento, características del ácaro,
detección y seguimiento) y por último se expone el proceso de validación utilizado para
determinar la robustez del algoritmo.
4.1. Obtención y Lectura de Video
El proceso completo de trabajo que implicó la construcción, ejecución, análisis y valo-
ración del algoritmo para la detección y seguimiento del ácaro V. Destructor inició con la
tarea de obtener el video y poderlo implementar en MatLab. Esta fue una etapa lenta, en la
cual se debió echar mano de algunos software libres disponibles en la red e investigar sobre
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS4.1. OBTENCIÓN Y LECTURA DE VIDEO
la conversión de videos para trabajo en MatLab.
El CINAT ponía a nuestra disposición dos videos en formato VHS en los que se regis-
traba la presencia del ácaro. Se decidió trabajar con estos videos principalmente por dos
razones: aprovechar el registro manual disponible en el CINAT y el hecho de ser un video
de trabajo real. Ya se ha mencionado que los investigadores del CINAT dedican muchas
horas en observar el video y estudiar el comportamiento del ácaro; la automatización de
procesos de detección y seguimiento en estos videos sería un importante apoyo.
Los investigadores del CINAT se encargaron de la conversión del video a formato DVD
para poder ser leídos en las computadoras, sin embargo el software para tratamiento de
imágenes que se utilizaría no soporta este formato. Se debía entonces, convertir los videos
a formato .AVI y además hacer cortes para las pruebas preliminares del algoritmo y para la
etapa de validación.
La conversión a formato .AVI se realizó con el software libre Hamster Video Converter
disponible en Internet. Este programa, entre otras aplicaciones, permite hacer cortes de
video y conversiones en varios formatos.
A pesar de la versatilidad de este software no fue posible la lectura de los videos en
MatLab pues estos debían estar en un formato .AVI descompresionado. Esto resultó ser un
problema importante pues lo común es que los convertidores generen videos comprimidos
pues la ganancia en tamaño es considerable. Con una exhaustiva investigación se determinó
que el video debía tener formato especial denominado RAW (código abierto denominado
Formato de Imagen sin Modificaciones que contiene la totalidad de los datos de la imagen,
67
4.2. ZONA ACTIVA DE MOVIMIENTO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS
tal y como ha sido captada por el sensor digital de la cámara) y se logró la conversión de
los cortes a un formato compatible con MatLab.
Para esto fue necesaria la utilización de otro software libre llamado FFMPEG y la
ejecución de la línea de comando siguiente
c:/>ffmpeg -i corte.avi -vcodec rawvideo Control.avi
En la anterior línea de comando corte.avi corresponde al nombre del archivo con formato
.AVI, obtenido de la conversión con Hamster Video Converter, por otra parte, Control.avi
es un archivo nuevo creado a partir de corte.avi pero con formato RAW. Con esto los videos
están listos para ser utilizados en MatLab.
El comando mov=aviread(’Control1.avi’) permite cargar y leer el vídeo en
MatLab para su manipulación.
La información del video, como tamaños, velocidad de reproducción y otros datos im-
portantes del vídeo, se obtienen con la ejecutando el comando peli=aviinfo(’Control1.avi’).
Con el video cargado y la información del mismo a mano, se procede con la primera
etapa del algoritmo que es la obtención automatizada de la zona de trabajo.
4.2. Zona Activa de Movimiento
4.2.1. Descripción del escenario inicial
El escenario lo constituyen todas las componentes presentes en el video y la interacción
entre ellas. Hay componentes estáticas como el tapón, la celda y el código de video, así
68
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.2. ZONA ACTIVA DE MOVIMIENTO
como componentes dinámicas que la conforman ácaro, la pupa de la abeja, el cronómetro
y la fecha, esto se ilustra en la figura 4.1.
La imagen en la figura 4.1 es cargada en MatLab como una hipermatriz I = (704, 480, 3).
Cada secuencia de video, por tanto, estará conformada por cientos de matrices de igual di-
mensiones.
Figura 4.1: Descripción del escenario
Es importante señalar que uno de los principales problemas que enfrentó la elabora-
ción del algoritmo fue la calidad del vídeo. La resolución de la cámara utilizada no fue la
más adecuada, de hecho hay momentos que ni el investigador experto del CINAT puede
identificar que es ácaro y que no.
El tapón que se utiliza para sellar la celda y el ácaro son de color muy similar, esto
provoca detecciones erróneas en un método basado en discriminación en color, para esta
investigación este hecho se constituyó en un verdadero reto.
69
4.2.2. Detección de la Z.A.M
Para la detección y seguimiento del ácaro hay zonas del video que no son útiles, por lo
tanto, se considerado como zona de trabajo aquella donde se presente movimiento, a esta
se le denomina Zona Activa de Movimiento(Z.A.M).
La obtención de la Z.A.M se puede considerar como la primera etapa del algoritmo y una
de las más interesantes desde el punto de vista del manejo de herramientas computacionales
y matemáticas.
En un primer intento para hacer la detección de la Z.A.M se hizo un recorte a conve-
niencia de la hipermatriz I. Con las dimensiones conocidas de I se hacen recortes por filas
y columnas (a lo largo y ancho) generando al final una nueva hipermatriz Z.A.M de menor
dimensión que I. En la Z.A.M se han excluido los numerales y la fecha, con esto se redu-
ce número de cálculos y no se considera el movimiento acelerado en el marcador de mili
segundos. En la figura 4,2 muestra el recorte
Figura 4.2: Primera detección de la Zona Activa de Movimiento
El tapón que se utiliza para sellar la celda y el ácaro son de color muy similar, esto
70
provoca detecciones erróneas en un método basado en discriminación en color, para esta
investigación este hecho se constituyo en un verdadero reto.
Dada esta situación se tomó la decisión de crear un algoritmo que realizara la detección
de forma automatizada e independiente de la posición de la cámara.
Para detectar movimiento se considera una sucesión definida por recurrencia a partir de
frames en escala de grises.
I0 , I1 primer y segundo frame, luego
In = |In−1 − In−2 |; 3 ≤ n ≤ NumF rames
Con la diferencia en valor absoluto, y en el entendido que 0 es la matriz nula, se tienen
las siguientes posibilidades:
1. Si In = 0, no hubo movimiento entre el frame In−1 e In−2
2. Si In 6= 0,hubo algún cambio (movimiento) entre el frame In−1 e In−2
La figura 4.3 se presenta una secuencia con los frames originales y éstos con la aplica-
ción del algoritmo.
Note que de la posición k a la k+1 hubo un pequeño movimiento del ácaro, por tanto, la
zona descrita en blanco (zona de movimiento) se denota diferente en ambos casos, mientras
que de la posición k + 1 a la k + 2 el movimiento fue muy leve por lo que se registra menos
zona en blanco en relación a la anterior.
Donde si hay constante movimiento es en el contador de mili segundos que presenta el
vídeo, esto hace que en ese sector haya mayor estabilidad de blanco.
71
Figura 4.3: Detección de movimiento
El siguiente paso sería identificar donde hubo mayor movimiento en el corte. En la
figura 4.4 se presenta el código y la zona del corte 1 donde hubo mayor movimiento.
Una vez determinada la Z.A.M lo que queda es pulir todas sus partes con el propósito
de encontrar el contorno de dicha zona, para ello se siguen una serie de procedimientos que
describimos en seguida.
Con el comando imfill se rellena la Z.A.M de tal forma que se generar zona compacta,
es decir, que no aparezcan puntos negros sobre la zona de blanco. Se decide señalar algunas
zonas sobre un mismo frame antes y después de aplicar el comando para ilustrar el efecto
que se genera, note como los puntos dispersos en la zona original desaparecen en la nueva
imagen. Ver figura 4.5
Una vez rellenada la Z.A.M se procede a suavizar el contorno, para ello se aplican opera-
ciones morfológicas. El proceso consiste en dilatar la zona, aplicar un elemento estructural,
rellenar los huecos y posteriormente se contrae a su estado normal la imagen dilata.
72
Figura 4.4: Zona de mayor movimiento en el corte 1
En este caso el elemento estructural que se ha aplicado tiene forma rectangular. En el
algoritmo se consideró aplicar 9 veces dicha estructura. Esta composición de transforma-
ciones se ilustra con la sucesión:





 es elemento estructural


 Izam0 (es) aplicar elemento estructutar (es) sobre la matriz I de Z.A.M




 Izamn = Izamn−1 (es) si 1 ≤ n ≤ 9

En este proceso es notorio el trabajo que genera la aplicación morfológica del elemento
73
Figura 4.5: Relleno de la Z.A.M
estructural (ver figura 4.6). Es de esperar que si se sigue aplicando esta operación de forma
sucesiva la Z.A.M se transforma en un rectángulo, para fines de la investigación no es lo
que se desea, por lo que una iteración de nueve composiciones es suficiente para generar
zonas suavizadas (sin picos).
Posterior a esto se genera una compresión de la nueva región Z.A.M y de nuevo se
rellenas huecos por si acaso se generan puntos no deseados dentro de la región de interés.
La compresión de la región se realiza aplicando el comando imerode y los resultados
que se presentan en la figura 4.7.
En la figura 4.7 se ha marcado con plechas las regiones que no tiene interés para la de-
tección del ácaro y con una estrella la región donde está el ácaro. Esta última es considerada
la región de interés para los fines de este proyecto.
La idea es crear un mecanismo que descarte las regiones con flecha y considere sólo
la región con estrella, para esto hemos utilizado un etiquetador de regiones, el comando
74
Figura 4.6: Operaciones Morfológicas sobre Z.A.M. (1)
bwlabel es muy útil para estos fines.
Una vez aplicado el etiquetador se tienen todas las regiones de la Z.A.M identificadas,
con esto podemos eliminar las regiones que no interesan y quedarse únicamente con la zona
de movimiento del ácaro. La estrategia consistió en contar el número de etiquetas para cada
zona y elegir donde éste es mayor (esto equivale a la zona de mayor área.)
La figura 4.8 muestra la aplicacion del algoritmo de eliminación de regiones no desea-
75
Figura 4.7: Operaciones Morfológicas sobre Z.A.M. (2)
das.
Figura 4.8: Eliminación de zonas no deseadas
Con el propósito de ilustrar la Z.A.M sobre un frame del video original se decidió de-
terminar su contorno o frontera. Para esto se necesita conocer las coordenadas x, y de los
76
puntos que lo definen. El comando tt find generaría una serie de coordenadas rectangulares
desordenadas, esto dificultaría el trazo y la determinación de la zona rectangular de trabajo.
Se sugiere detectar los puntos del contorno mediante coordenadas polares ubicando el polo
en el centro de masa de la región en blanco mostrada en la figura 4.8, de esta forma nos
garantizamos que cada punto del contorno esté ordenado mediante su componente angular.
La figura 4.9 da una idea gráfica de este proceso.
Figura 4.9: Idea intuitiva de la transformación de puntos del contorno a coordenadas polares
Los puntos en coordenadas polares se vuelven a transformar a rectangulares ya ordena-
dos, y con esto se genera el trazo del contorno de la Zona Activa de Movimiento.
En la figura 4.10 se presenta el código de los procesos descritos en la parte anterior, así
como una ilustración de su aplicación.
La adecuada determinación de la Z.A.M tiene implicaciones como la eliminación de
cálculos innecesarios al reducir la zona de trabajo del algoritmo a la región de interés, el
filtrado de ruido que podría interferir negativamente en el proceso de detección y por tanto
77
4.3. IDENTIFICACIÓN DEL ÁCARO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS
Figura 4.10: Detección de la Zona Activa de Movimiento
el aumento en la eficiencia del algoritmo.
Tomando como base el trabajo realizado anteriormente, se puede ahora realizar un aná-
lisis semejante para detectar el contorno el Ácaro V. Destructor.
4.3. Identificación del Ácaro
Para la identificación del ácaro, se estudiaron algunas de sus características, como lo
son: la forma , el área, y la variabilidad en relación a la forma.
La estrategia implementada se desarrolla en las siguientes etapas:
1. Es necesario introducir una pequeña cantidad de frames donde se cuente con la pre-
sencia del ácaro en su forma más representativa, el software de forma automatizada
le presenta al usuario una serie de frames con su respectivo número. El usuario los
78
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.3. IDENTIFICACIÓN DEL ÁCARO
escoge . En la figura 4.11 se presenta una muestra de lo descrito.
Figura 4.11: Identificación de ácaro
2. Matlab le solicita al usuario que introduzca los frames seleccionados. Ver figura 4.12.
Figura 4.12: Selección de frames para la identificación del ácaro
3. El procesado que se utiliza para definir el ácaro es similar al utilizado para identificar
la Z.A.M. El código y resultados se presentan en la figura 4.13.
4. Como parte de la caracterización del objeto ácaro, se incluye un estimador de su área
(parámetro de forma) y su variabilidad mediante la varianza. La figura 4.13 presenta
79
4.3. IDENTIFICACIÓN DEL ÁCARO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS
Figura 4.13: Contorno del Ácaro V. Destructor
el código y una aplicación de ésta etapa.
Figura 4.14: Cálculo de Área y Varianza
Con la implementación de los descriptores del ácaro se enrique la robustez del algoritmo
pues serían un complemento determinante en situaciones de comportamiento atípico. Es
decir, si la detección se ve afectada por el movimiento desordenado, presencia de ruido o
ausencia de movimiento, se dispone de la información del área y la variabilidad del objeto
de interés para utilizarlo como elemento discriminador del ácaro respecto a otros objetos o
80
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.4. SEGUIMIENTO DEL ÁCARO
sombras presentes en el video.
4.4. Seguimiento del Ácaro
La primera tarea propuesta para esta etapa fue el resaltar el ácaro de todas las demás
formas que aparecen en la escena. El reto consistía en implementar una rutina que recono-
ciera qué partes de cada imagen corresponde al fondo de la escena, cuáles son cambios de
luz, la pupa, el tapón de la celda y las descartara, de ese modo lo que quedaría en la imagen
correspondería al ácaro. Se consideró que la técnica de supresión de fondo por diferencias
sería una buena alternativa, sin embargo la simple diferencia de un frame con el siguiente
rápidamente llevaría a matrices nulas que entorpecerían la detección del objeto de interés.
Para lograr el realce que se necesita y evitar en buena medida la generación de imá-
genes vacías se implementó la construcción de una hipermatriz fija determinada por una
asignación de pesos en los tres primeros frames, luego se definió un sucesión recurrente
que actualiza lo que sería el fondo de cada imagen y así por diferencia se ubicaría el ácaro.
La idea que acaba de mostrarse puede resumirse de la siguiente forma. Se construye

1
la matriz H = (λ3 F3 + λ2 F2 + λ1 F1 ) donde F1 , F2 , F3 son los primeros tres frames de
3
la secuencia de videos y λ1 , λ2 , λ3 son proporciones fijas asignadas a cada frame de modo
que λ1 + λ2 + λ3 = 1, luego se definen las hipermatrices Fn−1 = [|fijk − 255|]n donde los
subíndices i, j, k determinan las entradas f en cada uno de los n frames de la secuencia de
video. Es importante notar que las hipermatrices F −1 son opuestas a las hipermatrices F
81
4.4. SEGUIMIENTO DEL ÁCARO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS
en el sentido que los colores cercanos a negro en F (entradas cercanas a 0) son cercanos a
blanco en F −1 (entradas cercanas a 255) y viceversa.
Con esto se define la sucesión que determina la actualización del fondo del video


 H1 = H

{Bn } =

 Hn = µ1 Hn−1 + µ2 Fn−1 , n > 1

con µ1 , µ2 son pesos fijos asignados. Con la sucesión {An = |Fn−1 − Bn |} se destaca la
forma que corresponde al ácaro. En este momento sólo falta transformar las hipermatrices
An a hipermetrices en blanco y negro que llamaremos BNn (para esto se utiliza el comando
im2bw). La figura 4.15 muestra el efecto que tiene este proceso en algunos frames de uno
de los videos de prueba.
Un aspecto que no puede obviarse es el uso de umbrales en comandos como im2bw, esta
condición tiene pro y contras. Como contras podría citarse el hecho que requiere manipu-
lación y alguna experiencia para poder implementarlos de forma adecuada. Sin embargo,
los pro son más valiosos. Con la determinación del umbral adecuado para los objetivos
trazados en una imagen determinada los resultados son excelentes, además el umbral que
funcione para la totalidad de las imágenes que deben ser procesadas será uno cercano al
implementado en el frame de control.
En esta rutina en particular se fijó un umbral de forma semiautomática: se combinó el
comando graythresh con un parámetro fijado por los investigadores. Los resultados se
puede apreciarse en la figura 4.15.
El problema de la generación de imágenes vacías por la ausencia de movimiento aún
82
Figura 4.15: Efecto de la aplicación de la sustracción de fondo a partir de la matriz histórica
no se ha solventado totalmente. Este problema se aprecia en las últimas dos iteraciones
mostradas en la figura 4.15.
Para solventar la problemática de imágenes vacías debidas a la ausencia de movimiento
se ideó implementar un proceso que combina la supresión de fondo por umbral con la
83
4.4. SEGUIMIENTO DEL ÁCARO CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS
estrategia anterior. Es decir, si la estrategia anterior no encuentra al ácaro porque este no se
mueve, el sistema cambia de estrategia y entra en juego la identificación por umbral.
Es importante recalcar que la identificación por umbral se planteó como segunda posi-
bilidad de detección pues es común que se identifiquen sombras con colores similares al
ácaro o, contrariamente, se pierda información de la forma del ácaro si se emplea un umbral
alto. Por supuesto si la detección de Z.A.M logra aislar los objetos con luminosidad similar
al ácaro la detección sería perfecta.
Más en detalle, la idea consistió en identificar en negro las zonas que satisfacen las
condiciones de un umbral determinado (estas imágenes serán denominadas N).
También, se definió la hipermatriz Nn−1 = [|nijk − 1|]n con lo que se tiene la misma
identificación pero en blanco. La figura 4.16 muestra el efecto de este proceso en los mis-
mos frames de la figura 4.15.
Con la combinación de la rutina de la matriz histórica y la detección por umbral se
redactó una rutina que crea dos conjuntos de datos: ND: las coordenadas de los puntos
negros detectados en Nn y BD: las coordenadas de los puntos blancos identificados en
BN ∩ B, calcula los baricentros de estos conjuntos y los pinta (si corresponde) de color
rojo.
En este momento es importante aclarar un par de detalles. Primero, en el conjunto BD
se considera la intersección de BN con B pues aunque en la figura 4.16 da la impresión de
no ser necesario, se debe evitar que B introduzca elementos que no son ácaro que se hayan
infiltrado por la aplicación de la detección por umbral. Segundo, si resulta que BD = ∅.
84
Figura 4.16: Efecto de la aplicación de la sustracción de fondo por umbral
hay dos posibilidades: el ácaro no se esta moviendo o bien salió de escena (esto sería
ND = ∅ ).
El seudocódigo para esta proceso es:
La figura 4.17 ilustra los resultados BN y N de algunos de los frames trabajados en los
85
4.5. PROCESO DE VALIDACIÓN CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS
figuras 4. 15 y 4. 16 y los correspondientes frames del video original con el punto rojo que
determina la detección (F D). Nótese que los frames donde la primera estrategia se perdía
ahora están perfectamente detectados.
4.5. Proceso de Validación
Para la valoración de la eficiencia y confiabilidad del algoritmo se utilizaron dos crite-
rios: el juicio de expertos y la implementación del algoritmo en siete cortes de secuencias
de vìdeo independientes del corte utilizado para las pruebas preliminares del algoritmo.
La evaluación del algoritmo por juicio de expertos fue abordada desde dos perspectivas.
Por un lado, el trabajo de programación fue apoyado y avalado por el Dr. Carlos Travieso
González miembro del Instituto para el Desarrollo y la Innovación en Comunicaciones
86
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.5. PROCESO DE VALIDACIÓN
Figura 4.17: Detección de ácaro por medio de la combinación de eliminación de fondo por
matriz histórica y por umbral.
(IDeTIC) del Departamento de Señales y Comunicaciones en la Universidad de Las Palmas
de Gran Canaria, España. Además, las etapas previas y el producto final se sometieron a la
aprobación del Dr. Rafael Ángel Calderón Fallas coordinador del Programa de Patología
Apícola del CINAT en la Universidad Nacional, Costa Rica.
El algoritmo tuvo la aprobación en ambas instancias. Es decir, se satisfacen los reque-
87
rimientos técnicos desde el punto de vista del procesamiento de video y programación y
también se cumplieron las expectativas sobre lo que se considera relevante para estudios de
índole biológico.
Además de la valoración de los expertos el algoritmo se corrió en siete cortes de videos
para determinar frame a frame si la detección se considera adecuada o bien evidenciar erro-
res. El cuadro 4.1 muestra el detalle de la muestra de videos seleccionada. Es importante
notar que aunque en primera instancia siete videos parece ser una cantidad muy pequeña
para validar la funcionalidad de un algoritmo en realidad se están trabajando 3354 frames.
Además, los cortes se realizaron con tiempos pequeños porque las computadoras que se
disponen tienen capacidad de procesamiento limitada.
Cuadro 4.1: Detalle de la muestra de videos seleccionada para la valoración de la efectivi-

dad del algoritmo de detección.
Nombre Duración en segundos (S) Números de frames (CF)
Corte1.avi 8 442
Corte2.avi 9 514
Corte3.avi 9 518
Corte4.avi 8 476
Corte5.avi 12 704
Corte6.avi 8 248
Corte7.avi 8 452
Total 58 3354
88
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.5. PROCESO DE VALIDACIÓN
La muestra se tomó de los videos originales proporcionados por el CINAT y sin seguir
ninguna consideración en particular (excepto la extensión por las razones ya comentadas)
por lo que puede considerarse como aleatoria.
Para el análisis estadístico se definieron las variables: AA: Área de ácaro, V A: Varia-
ción de ácaro, D : Detección correcta, DI: Detección incorrecta, ND: No detección, P D:
Porcentaje de detección correcta.
Las variables AA y V A son las salidas del algoritmo tratadas en la sección sobre los
descriptores de las características del ácaro. Para efectos de la validación de la confianza
del algoritmo se consideraron para contrastar las diferencias encontradas en la cantidad de
detecciones correctas, no se incluyen en el tratamiento estadístico.
Las variables D, DI, ND y P D son las principales en el análisis de la efectividad del
algoritmo de detección, por tanto es menester que queden perfectamente determinadas.
Debe entenderse como parte de DI cualquier detección que haga el algoritmo de ob-
jetos que no son el ácaro e incluso las detecciones que se hagan en el contorno del objeto
de interés. De este modo la cantidad de detecciones incorrectas determinan la variable DI.
Ver figura 4.18.
Es importante notar la exigencia que se está solicitando al algoritmo, eso se traduce en
que la proporción de éxito que se obtenga es la menor posible. Es decir, si se considerara
una detección de contorno como correcta, los éxitos serían necesariamente mayores.
Se define la variable ND como la totalidad de frames donde el ácaro es visible (a la
vista humana) pero el sistema no es capaz de detectarlo. La figura 4.19 muestra casos donde
89
Figura 4.18: Ejemplos de detección incorrectas (DI)
el ácaro apenas es perceptible por el ojo humano y el algoritmo no fue capaz de detectarlo.
Figura 4.19: Muestras de omisiones en la detección (ND)
Debe destacarse el hecho que las no detecciones se deben principalmente a la poca
resolución del video, esta hace que el color del ácaro no pueda apreciarse con claridad si
éste está en posición lateral o en ocasiones sin ningún motivo el color cambia en el video.
Con estas consideraciones para las variables DI y ND se define la variable detección
correcta como D = CF − (DI + ND), que corresponde a la cantidad de frames donde la
detección se ha considerado adecuada. Para el cálculo de los promedios de éxito en cada

D
corte se definió la variable porcentaje de detección correcta como P D = ∗ 100.
CF
En el cuadro 4.2 se presentan los porcentajes de éxito por cada corte analizado.
Para tener un estimador de la proporción de éxito general del algoritmo (PEGA) se
90
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.6. COMENTARIOS DE CIERRE
Cuadro 4.2: Distribución de porcentajes de detección correcta por corte de control.
Nombre CF PD
Corte1.avi 442 98.19
calculó un promedio ponderado de los P D según CF en cada corte, es decir:
Σ7i=1 (CF )i (P D)i

P EGA =
Σ7i=1 (CF )i
Con los datos que se han presentado se tiene que el PEGA es de 93, 75 y haciendo
una estimación por intervalo se tiene que con una confianza del 95 % el porcentaje real de
detección exitosa del algoritmo oscila entre 92, 93 % y 94, 57 %.
4.6. Comentarios de Cierre
Las estrategias utilizadas para la conversión de video a formato .AVI, determinar la
Z.A.M, caracterizar el ácaro en las secuencias de imágenes, detectarlo y seguirlo han cum-
91
4.6. COMENTARIOS DE CIERRE CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS
plido las expectativas de muy buena forma. Según los datos mostrados la eficacia de la
detección y el seguimiento no es del 100 % y esto merece algunas líneas para aclarar cual-
quier duda razonable.
Cuando un programador es contratado por una empresa para desarrollar algún software,
es la misma empresa la que especifica las demandas que debe satisfacer el producto final.
Claro, si el programa debe calcular inversiones de capital, llevar registros de ventas o invo-
lucra aplicaciones comunes la demanda es del 100 % de eficiencia, aún así estos programas
comunes son falibles.
Nuestro caso particular es mucho más complejo. Para empezar no tiene nada de común,
involucra una cantidad impresionante de cálculos y la exigencia que le impusimos es alta.
Un usuario podría argumentar que sería más eficiente la detección por el ojo humano, se
muestran algunas cuestiones por considerar.
Una secuencia de video como la utilizada corre 24 frames en un segundo, es decir el ojo
humano debería poder registrar y valorar la detección en 24 imágenes cada segundo. Ade-
más, para que el ojo humano detecte las fallas que se están considerando en este proyecto
deberían suceder en frames consecutivos, de no ser así no se apreciarían.
Por otra parte, dada la revisión exhaustiva de cada frame que se realizó y el análisis de
las estrategias utilizadas se tiene claro cuáles son las causas de las detecciones incorrectas u
omisiones. Principalmente se debe a la calidad deficiente de la resolución de los videos y a
comportamientos atípicos del ácaro como mantenerse quieto por mucho tiempo y cercano
a la tapa. Además, se determinó que con calibraciones de los umbrales se pueden corregir
92
CAPÍTULO 4. DISCUSIÓN Y ANÁLISIS 4.6. COMENTARIOS DE CIERRE
esos errores, sin embargo, para los alcances de este proyecto se presentan los datos del
algoritmo sin modificaciones implementado en los 3354 frames muestreados.
En síntesis, hay errores de detección en algunos frames pero se tienen identificados las
causas de estos y las estrategias de solución para esos frames particulares. En términos
generales se considera que el algoritmo tiene una robustez muy buena.
93
94
Capítulo 5
CONCLUSIONES Y SUGERENCIAS
5.1. Conclusiones
Los insumos de este proceso de investigación se presentan organizados según la to-
ma del video, las estrategias utilizadas, las herramientas matemáticas implementadas y la
eficiencia del algoritmo propuesto.
Sobre el proceso de toma y lectura de vídeo se concluye que el procedimiento seguido
por el CINAT no fue el más adecuado. Como consecuencia se tiene que la resolución del
video con el que se trabajó no fue la más conveniente y esto afectó la precisión en la
detección del ácaro. Además, capturar el video en formato VHS significó que la tarea de
conversión a un formato que soportara MatLab fue lenta, abonado al hecho que, en dicha
conversión, se pierde información del mismo.
Según la revisión de literatura realizada, se determinó que las estrategias utilizadas

CAPÍTULO 5. CONCLUSIONES Y SUGERENCIAS 5.1. CONCLUSIONES
en la creación del algoritmo y las soluciones a las problemáticas que emergieron en el
proceso son totalmente consecuentes con las propuestas recientes hechas por expertos en el
área de procesamiento de señales. La utilización de umbrales, determinación movimiento
a partir de sucesiones de frames, la incorporación de funciones descriptores de objetos y
los modelos tracking by detection, la detección y seguimiento independiente de la posición
de la cámara, todos estos son ejemplos de estrategias novedosas que están presentes en el
algoritmo que se propone.
Además, se han presentado variantes a las estrategias implementadas como muestras
de la versatilidad de las herramientas matemáticas involucradas. Por ejemplo, la detección
de la Z.A.M en un video de mejor resolución sería más eficiente siguiendo un proceso
invertido.
Aunado a estos resultados se tiene el hecho que la combinación de las técnicas de
detección y seguimiento se establece como un norte prometedor para una amplia variedad
de posibilidades de investigaciones. Como implicaciones inmediatas de la utilización del
centro de masa para identificar y dar seguimiento al ácaro V. Destructor se tienen el registro
de la posición y cálculo de la velocidad de movimiento. Además, las estrategias utilizadas
funcionan como insumos importantes en algoritmos que registren la trayectoria seguida
por el ácaro, identifiquen y predigan comportamientos o bien para el seguimiento de otras
formas en video (personas, vehículos, entre otras).
El logro con relación más directa con el área de formación de los investigadores es
la utilización de herramientas matemáticas en el desarrollo del algoritmo. Es importante
95
5.1. CONCLUSIONES CAPÍTULO 5. CONCLUSIONES Y SUGERENCIAS
destacar que se hace referencia a conceptos matemáticos de alto nivel, es decir, las he-
rramientas utilizadas se ubican en áreas como álgebra lineal, cálculo, métodos numéricos,
estadística y probabilidades con clara transcendencia de los cálculos aritméticos de uso
común, todas estas áreas matemáticas esenciales en el desarrollo de inteligencia artificial.
Con la culminación de esta investigación se evidencia la aplicación de herramientas
matemáticas en la solución de problemas concretos y de importancia científica, social y
económica. Además, se establece un precedente en la necesidad de colaboración entre uni-
dades académicas en la UNA en aras del fortalecimiento de la investigación con impacto
científico y social, lo anterior es una justificante para el incentivo de invertir en investiga-
ciones de esta línea.
Los estudios que involucran procesamiento de señales están en la palestra de las in-
vestigaciones científicas actuales, por lo que se insiste en presupuestar recursos, tanto eco-
nómicos como académicos, para la inclusión de estas líneas de investigación con carácter
continuo y permanente en el quehacer de la Escuela de Matemática. Además, este hecho
haría que la escuela se proyecte como un centro de investigación en un área de actualidad,
para la cual se han evidenciado una amplia gama de problemáticas que pueden abordarse
desde el tratamiento de señales.
Por último, sobre la eficiencia del algoritmo se concluye que la detección y seguimiento
del ácaro es realizada de manera muy satisfactoria. Las pruebas realizadas en 3354 frames
mostraron una efectividad de 93,75 %. Se recalca el hecho que se estableció una exigencia
alta al desempeño del algoritmo, por lo que si las demandas se relajan un poco la efectividad
96
CAPÍTULO 5. CONCLUSIONES Y SUGERENCIAS 5.2. SUGERENCIAS
sería mayor.
Específicamente, se determinó de manera muy eficiente la zona donde el ácaro se des-
plaza a partir de la implementación de una matriz histórica que actualiza frame por frame
el fondo (background) del video. Además, se logró caracterizar el objeto ácaro con dos
medidas (una de forma y otra de variabilidad) y se implementaron herramientas de cálculo
y análisis para la detección y seguimiento del ácaro.
Además, la supervisión del experto en procesamiento de señales y el acompañamiento
del biólogo especialista en investigaciones apícolas se constituyeron en los pilares para la
validación del algoritmo. Con este apoyo se logró satisfacer los requerimientos desde el
punto de técnico y dese la óptica del interés biológico.
5.2. Sugerencias
Como consecuencias de los resultados presentados se hacen algunas sugerencias a los
investigadores del CINAT, los encargados del proyecto institucional Detección, seguimiento
y análisis del comportamiento del ácaro varroa destructor mediante técnicas de procesado
inteligente de video, la Escuela de Matemáticas de la UNA, los docentes de matemáticas
en general y a la comunidad científica.
Al CINAT se sugiere que en futuras grabaciones se mejore la resolución de video para
de esta forma aumentar la eficiencia en las técnicas de detección y seguimiento implemen-
tadas. Además, de ser posible pintar el ácaro o tapar la celda con algún material de color
97
5.2. SUGERENCIAS CAPÍTULO 5. CONCLUSIONES Y SUGERENCIAS
sobresaliente o blanco e iniciar la implementación de lectura de video en directo.
Se recomienda a los responsables del proyecto institucional Detección, seguimiento
y análisis del comportamiento del ácaro V. Destructor mediante técnicas de procesado
inteligente de video considerar la producción de esta investigación como insumo para la
creación del sistema inteligente que describe y reporta los comportamientos particulares
del ácaro. Con este proyecto como referencia, se sugiere analizar las dificultades que hacen
que el algoritmo no tenga el 100 % de efectividad y solventarlas para lograr incrementar la
robustez del algoritmo.
Además, se considera que una estrategia con buenos alcances es la inclusión de los
descriptores del ácaro (forma y variabilidad) para implementar estrategias de predicción de
comportamiento y mejorar los índices de detección efectiva.
A la Escuela de Matemática de la Universidad Nacional, se recomienda fomentar la
realización de proyectos en matemática aplicada de actualidad e interés científico, además
se sugiere seguir con la iniciativa de generar espacios de discusión y actualización en el
campo de la matemática aplicada, con expertos tanto nacionales como internacionales, con
el propósito de crear líneas de investigación con docentes de la Escuela.
Como aporte de este proyecto a la actualización de la malla curricular de la carrera
Enseñanza de la Matemática, de manera muy prudente, se sugiere considerar la inclusión
de un curso optativo sobre procesamiento de señales. Esta iniciativa podría transferirse a
carreras con objetivos afines o bien como especialidades en etapas de posgrado.
Además, la consideración del tratamiento de señales como una línea de investigación
98
CAPÍTULO 5. CONCLUSIONES Y SUGERENCIAS 5.2. SUGERENCIAS
activa de la Escuela de Matemáticas se traduce en una atractiva y novedosa opción para
futuros tesiarios. Con esto, además del enriquecimiento académico de los tesiarios y la
proyección de la Escuela como ente constructor de conocimiento, se colabora con las ini-
ciativas para ofrecer posibilidades de graduación a muchos egresados que aún no satisfacen
el requisito de presentar su tesis.
Por otro lado, se insiste en la necesidad de incentivar la cooperación con otras unidades
académicas en lo referente a estrategias de resolución de problemas de ingeniería o ciencias
que involucren herramientas matemáticas. Se recomienda considerar el presente proyecto
como elemento pilar y catalizador para el establecimiento de propuestas de investigación
interdisciplinarias.
A los docentes de matemática a nivel nacional se recomienda incorporar en sus planea-
mientos las aplicaciones posibles de los contenidos que enseñan en el procesamiento de
señales. Es decir, si se está en un curso de Álgebra Lineal o Cálculo, incluir en las leccio-
nes o al menos comentar, la actual utilidad de ciertas herramientas para detectar, seguir y
reportar objetos como vehículos o personas.
Respetuosamente, se sugiere a los docentes de matemática la lectura de artículos refe-
ridos a procesamiento de imágenes, sonido y video para el enriquecimiento académico del
personal docente. Con esta actividad se tendría un referente para la creación o trasferencias
de ejemplos que puedan formar parte del trabajo en sus aulas.
A la comunidad científica a nivel nacional e internacional se sugiere valorar los apor-
tes de las herramientas matemáticas a solución de problemas cotidianos. De esta forma se
99
5.2. SUGERENCIAS CAPÍTULO 5. CONCLUSIONES Y SUGERENCIAS
estrecharían los lazos de cooperación entre disciplinas diversas para ganancia en la com-
pletitud de los procesos de investigación. Además, se insiste en la necesidad de potenciar
el uso de la tecnología en aras de la investigación con objetivos de mejora de la calidad de
vida humana y recuperación de ambiente.
100
BIBLIOGRAFÍA
Bibliografía
Arredondo, M. (2005). Propuesta de un sistema de vigilancia utilizando la detección de
movimiento en una secuencia de imágenes captadas por cámaras digitales
(Trabajo de graduación, Universidad de San Carlos, Guatemala). Recuperado
de http://biblioteca.usac.edu.gt/tesis/08/08_7037.pdf
Bayona, A. (2009). Detección de objetos abandonados/robados en secuencias de video-
seguridad (Proyecto de fin de carrera, Universidad Autónoma de Madrid,
España). Recuperado de
http://arantxa.ii.uam.es/~jms/pfcsteleco/lecturas/20090921AlvaroBayona.pdf
101
BIBLIOGRAFÍA
Briones, G. (2002). Metodología de la investigación cualitativa en las ciencias sociales.
Programa de Especialización en teoría, métodos y técnicas de investigación
social. Instituto Colombiano para el Fomento de la Educación Superior
(ICFES), Colombia. Recuperado de
http://www.icfes.gov.co/cont/s_fom/pub/libros/ser_inv_soc/ modulo3.pdf
Cabello, E., Conde, C. & Rodríguez, L. (2009). Detección automática de conductas
sospechosas en aeropuertos. Grupo de Investigación FRAV, Universidad Rey
Juan Carlos. Recuperado de
http://www.frav.es/pdf/2009/duquedeahumada2009.pdf
Calderón, R. & Zamora, L. (2004). Manual de capacitación. Tomo 2. Control integrado
del ácaro Varroa destructor. Centro de Investigaciones Apícolas Tropicales
(CINAT). Costa Rica.
Calderón, R., Zamora, L, Van Veen, J. & Quesada, M. (2007). A comparison of the
reproductive ability of Varroa destructor (Mesostimata:Varoiae) in worker and
drone brood of Africanizad bees (Apis mellifera) Exp Appl Acarol, 43, 25-32.
102
BIBLIOGRAFÍA
Carmona, E., Martínez-Cantos, J. & Mira, J. (2000). Posprocesamiento morfológico
adaptativo basado en algoritmos genéticos y orientado a la detección robusta
de humanos.
Colin, M., García, P. & Hamida, T. (1999). Varroosis. CIHEAM. Options
Mediterraneennes. 121-142.
Cuevas , E., Zaldivar, D. & Pérez, M. (2010). Procesamiento Digital de Imágenes con
MatLab y Simulink. Alfaomega Editorial. Mexico.
Donzé, G., Fluir, P. & Imdorf, A. (2007). A look under the cap: The reproductive
behavior of Varroa in the capped brood of the honey bee. American Bee
Journal. 138 (4), 528-533
Erickson, E. (1996). Fecal accumulations deposited by Varooa can be used as a simple
field diagnostic for infestations of honey bee parasite. American Bee Journal.
136 (1), 63-64
Faytong, J. & Moggia, G. (2008). Monitoreo automático de carreteras mediante el uso
de un sistema de detección, seguimiento y extracción de características de
vehículos con técnicas de visión por computador (Tesis de grado, Escuela
103
BIBLIOGRAFÍA
Superior Politécnica del Litoral, Ecuador). Recuperado de
http://www.cib.espol.edu.ec/Digipath/D_Tesis_PDF/D-38737.pdf
Gil, P., Torres, F. & Ortíz, F. (2004). Detección de objetos por segmentación
multinivel combinada de espacios de color. Recuperado de http://www.cea-
ifac.es/actividades/jornadas/XXV/documentos/19-abtsufilva.pdf
Gómez, E. (2009). Aplicación del filtro de partículas al movimiento de un objeto en 2D
y extracción de características (Proyecto de fin de carrera, Universidad Rey
Juan Carlos, España). Recuperado de
http://www.escet.urjc.es/~jjpantrigo/PFCs/pfc_efren.pdf
González, L. (2009). Análisis de imágenes: sistema de detección de intrusos. Proyecto
final de carrera, Universidad Pontificia Comillas. España. Consultado en
http://www.iit.upcomillas.es/pfc/resumenes/4a47be9c47d75.pdf
Hanxuan, Y., Ling, S., Feng, Z., Liang, W., & Zhan S. (2011). Recent advances and
trends in visual tracking: A review. Neurocomputing 74 (2011) 3823–3831
Llorente, J (1990). Varroosis. Consultado en
http://www.mundoapicola.com/PDF/patologia/varroosis.pdf
104
BIBLIOGRAFÍA
Mateu, 0. (2009). Análisis y detección de objetos de primer plano en secuencias de
video (Proyecto Final de Carrera, Universitat Politècnica de Catalunya).
Recuperado de
http://upcommons.upc.edu/pfc/bitstream/2099.1/7308/1/Projecte_finalv3.2.pdf
Organización Mundial de Sanidad Animal. (2004) Manual de la OIE sobre animales
terrestres. 5(2). pp 1060-1064. Recuperado de
http://www.oie.int/ESP/normes/mmanual/pdf_es/2.9.05_Varroosis.pdf
Pardàs, M., Casas, J., Gasull, A., Marqués, F., Oliveras, A., Salembier, P., Sayrol, E.,
Chang, C., Co-mas, D., Ferran, C., Giró, X., Landabaso, J., León, M., Morros,
J., Ruiz, J., Solé, J. & Vilaplana V. (2001). Representación, acceso y
descripción de video para futuros servicios multimedia. Departament de Teoria
del Senyal i Comunicacions, Universitat Politècnica de Catalunya. Recuperado
de http://www.landabaso.org/publications/avr-04-image-processing-group-
upc.pdf
Realpe, M., Vintimilla, B., Romero, D. & Remagnino, P. (2009). Análisis del
comportamiento humano: metodología para la localización y el seguimiento de
personas en secuencias de video. Recuperado de
105
BIBLIOGRAFÍA
http://www.iiis.org/CDs2008/CD2009CSC/CISCI2009/PapersPdf/C629DZ.pd
Rodríguez, P. (2003). Aplicación del filtro de Kalman al seguimiento de objetos en
secuencias de video (Proyecto de fin de carrera, Universidad Rey Juan Carlos,
España) Recuperado de
http://www.etsii.urjc.es/~asanz/documentos/MemoriaKalmanJun03.pdf
Schmidt, V., Carrillo, M. & Neira, M. (2005). Comparación de dos formas de
aplicación del acaricida orgánico Bienenwohl en el control de Varroa
destructor. Anderson & Trueman. Agro Sur. 33, (2), 43-48.
Sonsoles, M. (2009). Análisis comparativo de técnicas de segmentación de secuencias
de video basadas en el modelado del fondo (Proyecto de fin de carrera,
Universidad Autónoma de Madrid, España).
Vázquez, J., Mazo, M., Lázaro, J., Luna, C., Cabello, J., Ureña, J. & García, J. (2009).
Fusión de algoritmos para detectar objetos en movimiento. Departamento de
Telecomunicaciones, Universidad de Oriente, Cuba. Departamento de
Electrónica, Universidad de Alcalá. España. Recuperado de de http://geintra-
uah.org/system/files/private/FUSION_DE_ALGORITMOS_PARA_DETECT
AR_OBJETOS_SAAEI_VAZQUEZ_04.pdf
106

Math E20f4838238411

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Math E20f4838238411

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD NACIONAL

FACULTAD DE CIENCIAS EXACTAS Y NATURALES

ALGORITMO PARA LA DETECCIÓN Y SEGUIMIENTO DEL ÁCARO

Juan Pablo Prendas Rojas

Campus “Omar Dengo”

el Tribunal Examinador de la Escuela de Matemática de la Universidad Nacional, como

requisito parcial para optar por el grado de Licenciatura en la Enseñanza de la Matemática.

Presidente del Tribunal

Representante Dirección Escuela de Matemática

Melvin Ramírez Bogantes.

capacidad y paz para poder culminar mis estudios de Licenciatura.

A mi Madre y Padre por apoyarme en todo momento, creer en mi y darme la oportuni-

siempre en mi mente y mi corazón.

la investigación. Gracias por darme un hermoso y saludable hijo, son mi inspiración y

motivación día a día, LOS AMO.

to, gracias Don Victor.

que mi estadía en la UNA hubiera sido muy corto.

Juan Pablo Prendas Rojas.

en mi vida: Yariel y Yess.

2.1. Familias de estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4.1. Detalle de la muestra de videos seleccionada para la valoración de la efec-

2.1. Hembra adulta del Ácaro Varroa Destructor . . . . . . . . . . . . . . . . . 17

4.1. Descripción del escenario . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

4.16. Efecto de la aplicación de la sustracción de fondo por umbral . . . . . . . . 85

1.1. Tema de Investigación

de una propuesta cuya objetivo es complementar los conocimientos matemáticos genera-

nes logrados en ULPGC. Esta iniciativa contribuye a la proyección de importantes aportes

matemáticos para la resolución de problemas en áreas tales como la biología, topografía,

ingeniería, entre otras.

Con esta premisa se ha generado una dinámica de investigación en la unidad académica

de la Escuela de Matemática (UNA). Entre las actividades implementadas destacan la ac-

tualización del personal docente en temas de programación, uso de software especializados

y tratamiento de señales; además, la visita de expertos de la ULPGC y de la Universi-

dad de Costa Rica (UCR) para la identificación de problemas generadores de proyectos de

investigación en colaboración con entes nacionales e internacionales.

1.1.1. Colaboración entre Escuela de Matemática y el Centro de In-

vestigaciones Apícolas Tropicales (CINAT)

Como consecuencia del intercambio académico con investigadores de la ULPGC y

UCR y la búsqueda de problemas dentro de los centros de investigación de la UNA, se

mediante técnicas de procesado inteligente de video.

abejas productoras de miel en el trópico. Algunos parásitos como el ácaro V. Destructor

considerablemente la producción de miel y esto, por ende, implicaría importantes pérdidas

con ácaros de este tipo.

en dicha celda. El proceso de registro de comportamientos del ácaro se realiza de forma

estados, desplazamientos y acciones del ácaro; un proceso lento en demasía.

posición, tiempo, velocidad y reconozca acciones particulares como alimentación y defe-

cación del ácaro.

La Escuela de Matemáticas no sólo colaborará con el CINAT reduciendo el tiempo

de análisis de las secuencias de video y ofreciendo un sistema confiable de detección y

seguimiento del ácaro, sino que establecerá un precedente en la utilización de matemática

aplicada para la resolución de problemas concretos en áreas de la biología.

El proyecto que se menciona es de clara trascendencia, dada la importancia científica

y económica derivada del estudio de abejas melíferas, innovador y se constituye como un

pilar en el esfuerzo de crecimiento académico y tecnológico de la Escuela de Matemáti-

cas. Es, además, catalizador para la implementación de proyectos de similares alcances e

implicaciones en otras áreas como ingenierías o ciencias sociales.

1.1.2. Problema de investigación

El problema de esta investigación se ubica como etapa previa al proyecto mencionado

análisis de una secuencia de video registrado durante todo el proceso.

Es importante aclarar que en esta propuesta, no se propone hacer registros de movimien-

el logro de estos otros fines. La investigación culmina con la implementación y evaluación

de la eficiencia del algoritmo en secuencias de video facilitadas por el CINAT.

El desarrollo científico y el crecimiento exponencial en cuanto al poder del cálculo por