Tesis Masgo Ferreyra Divad Jair FINAL

DE LINCE, 2020.
FACULTAD DE INGENIERÍA
Carrera de Ingeniería de Sistemas Computacionales
“IMPLEMENTACIÓN DE UN SISTEMA WEB

BASADO EN VISIÓN ARTIFICIAL Y
GEOLOCALIZACIÓN, Y SU INFLUENCIA EN LA
VIGILANCIA DEL DISTRITO DE LINCE, 2020”
Tesis para optar el título profesional de:
Ingeniero de Sistemas Computacionales
Autor:
Divad Jair Masgo Ferreyra
Asesor:
Mg. Richerd Homero Rodas Cueva
Lima - Perú
2020
IMPLEMENTACIÓN DE UN SISTEMA WEB BASADO EN VISIÓN ARTIFICIAL Y
GEOLOCALIZACIÓN, Y SU INFLUENCIA EN LA VIGILANCIA
DEL DISTRITO DE LINCE, 2020.
ACTA DE AUTORIZACIÓN PARA PRESENTACIÓN DEL TRABAJO DE

INVESTIGACIÓN
El asesor Mg. Richerd Homero Rodas Cueva, Docente de la Universidad Privada del Norte,
Facultad de Ingeniería, Carrera profesional de INGENIERÍA DE SISTEMAS
COMPUTACIONALES, ha realizado el seguimiento del proceso de formulación y
desarrollo de la investigación del estudiante:
• DIVAD JAIR MASGO FERREYRA
Por cuanto, CONSIDERA que el trabajo de investigación titulado: IMPLEMENTACIÓN DE UN

SISTEMA WEB BASADO EN VISIÓN ARTIFICIAL Y GEOLOCALIZACIÓN, Y SU INFLUENCIA
EN LA VIGILANCIA DEL DISTRITO DE LINCE, 2020 para aspirar al título profesional por la
Universidad Privada del Norte, reúne las condiciones adecuadas, por lo cual AUTORIZA al
interesado para su presentación.
_____________________________________
Mg. Richerd Homero Rodas Cueva
Asesor
Masgo Ferreyra Divad Jair ii

ACTA DE EVALUACIÓN DEL TRABAJO DE INVESTIGACIÓN

El comité de trabajos de investigación, conformado por: Haga clic o pulse aquí para escribir texto.;
designados mediante Haga clic o pulse aquí para escribir texto., ha procedido a realizar la
evaluación del trabajo de investigación del estudiante: DIVAD JAIR MASGO FERREYRA; para
aspirar al título profesional con el trabajo de investigación: IMPLEMENTACIÓN DE UN SISTEMA
WEB BASADO EN VISIÓN ARTIFICIAL Y GEOLOCALIZACIÓN, Y SU INFLUENCIA EN LA
VIGILANCIA DEL DISTRITO DE LINCE, 2020.
Luego de la revisión del trabajo en forma y contenido los miembros del jurado acuerdan:
( ) Aprobación por unanimidad ( ) Aprobación por mayoría
Calificativo: Calificativo:
( ) Excelente [18 -20] ( ) Excelente [18 -20]
( ) Sobresaliente [15 - 17] ( ) Sobresaliente [15 - 17]
( ) Buena [13 - 14] ( ) Buena [13 - 14]
( ) Desaprobación
Firman en señal de conformidad
Raúl Eduardo Huarote Zegarra Miguel Alfredo Lévano Stella

Miembro del Comité Miembro del Comité
Edward José Flores Masías

Miembro del Comité
Masgo Ferreyra Divad Jair iii

DEDICATORIA
Está tesis que representa sacrificio y

esfuerzo, inculcado por mis padres, está
dedicado especialmente a ellos, Isabel
Ferreyra Carrizales y David Masgo
Bandán que representan lo mejor en mi
vida.
Masgo Ferreyra Divad Jair iv

AGRADECIMIENTO
A los distintos maestros que

intervinieron en el desarrollo de esta
investigación.
A los funcionarios de la municipalidad de

Lince por su apoyo y colaboración para
la realización de esta investigación.
Masgo Ferreyra Divad Jair v

ÍNDICE DE CONTENIDOS
ACTA DE AUTORIZACIÓN PARA PRESENTACIÓN DEL TRABAJO DE INVESTIGACIÓN ......ii
ACTA DE EVALUACIÓN DEL TRABAJO DE INVESTIGACIÓN ................................................. iii
DEDICATORIA .............................................................................................................................iv
AGRADECIMIENTO ...................................................................................................................... v
ÍNDICE DE CONTENIDOS ...........................................................................................................vi
ÍNDICE DE TABLAS ................................................................................................................... viii
ÍNDICE DE FIGURAS ...................................................................................................................ix
ÍNDICE DE ECUACIONES ...........................................................................................................xi
RESUMEN.................................................................................................................................... xii
CAPÍTULO I. INTRODUCCIÓN .................................................................................................. 13
1.1. Bases Teóricas ............................................................................................................ 13
1.1.1. Bases Teóricas de la variable Sistema Web basado en Visión Artificial y
Geolocalización .................................................................................................................... 13
1.1.2. Bases Teóricas de la variable Vigilancia ............................................................. 42
1.1.3. Bases Teóricas de la dimensión Modelo de Comportamiento ............................ 49
1.1.4. Bases Teóricas de la dimensión Modelo de Implementación ............................. 54
1.1.5. Bases Teóricas de la dimensión Modelo de Actuación ....................................... 56
1.2. Antecedentes ............................................................................................................... 58
1.2.1. Antecedentes internacionales ............................................................................. 58
1.2.2. Antecedentes nacionales .................................................................................... 61
1.2.3. Antecedentes locales .......................................................................................... 65
1.3. Realidad problemática ................................................................................................. 70
1.4. Formulación del problema ........................................................................................... 73
1.4.1. Problema General ............................................................................................... 73
1.4.2. Problemas Específicos ........................................................................................ 73
1.5. Objetivos ...................................................................................................................... 73
1.5.1. Objetivo general .................................................................................................. 73
1.5.2. Objetivos específicos........................................................................................... 73
1.6. Hipótesis ...................................................................................................................... 73
1.6.1. Hipótesis general ................................................................................................. 73
1.6.2. Hipótesis específicas ........................................................................................... 73
CAPÍTULO II. METODOLOGÍA ................................................................................................... 74
2.1. Tipo de investigación ................................................................................................... 74
2.2. Población y muestra .................................................................................................... 75
2.3. Técnicas, instrumentos y procedimientos de recolección de datos ............................ 76
2.4. Métodos, instrumentos y procedimientos de análisis de datos ................................... 78
2.5. Procedimiento.............................................................................................................. 79
2.6. Aspectos éticos ........................................................................................................... 79
CAPÍTULO III. RESULTADOS .................................................................................................... 80
3.1. Prueba de normalidad ................................................................................................. 80
3.2. Análisis descriptivo ...................................................................................................... 81
3.2.1. Análisis descriptivo de la variable Vigilancia preprueba ..................................... 81
Masgo Ferreyra Divad Jair vi

3.2.2. Análisis descriptivo de la dimensión Modelo de Comportamiento preprueba .... 82

3.2.3. Análisis descriptivo de la dimensión Modelo de Actuación preprueba ............... 83
3.2.4. Análisis descriptivo de la variable Vigilancia posprueba ..................................... 84
3.2.5. Análisis descriptivo de la dimensión Modelo de Comportamiento posprueba .... 85
3.2.6. Análisis descriptivo de la dimensión Modelo de Actuación posprueba ............... 86
3.3. Cruce de variables Preprueba y Posprueba ............................................................... 87
3.3.1. Análisis descriptivo de la variable Vigilancia preprueba y posprueba ................ 87
3.3.2. Análisis descriptivo de la dimensión Modelo de Comportamiento preprueba y
posprueba ............................................................................................................................ 88
3.3.3. Análisis descriptivo de la dimensión Modelo de Actuación preprueba y posprueba
89
3.4. Prueba de hipótesis ..................................................................................................... 90
3.4.1. Prueba de hipótesis general ................................................................................ 91
3.4.2. Prueba de hipótesis de la dimensión Modelo de Comportamiento ..................... 92
3.4.3. Prueba de hipótesis de la dimensión Modelo de Actuación................................ 93
CAPÍTULO IV. DISCUSIÓN Y CONCLUSIONES....................................................................... 94
4.1. Discusión ..................................................................................................................... 94
4.2. Conclusiones ............................................................................................................... 97
REFERENCIAS ........................................................................................................................... 98
ANEXOS .................................................................................................................................... 103
Anexo n.° 1. Matriz de Consistencia ...................................................................................... 104
Anexo n.° 2. Matriz de Operacionalización de Variables ...................................................... 106
Anexo n.° 3. Instrumento de Recolección de Datos .............................................................. 107
Anexo n.° 4. Confiabilidad del Instrumento de Recolección de Datos .................................. 109
Anexo n.° 5. Validez del Instrumento de Recolección de Datos ........................................... 112
Anexo n.° 6. Base de Datos................................................................................................... 120
Anexo n.° 7. Formatos Trabajo de Campo ............................................................................ 126
Anexo n.° 8. Justificación de la Investigación........................................................................ 234
Anexo n. ° 9. Marco Conceptual ............................................................................................ 235
Anexo n.° 10. Producto .......................................................................................................... 237
Masgo Ferreyra Divad Jair vii

ÍNDICE DE TABLAS
Página
Tabla n.° 1. Comparación entre líderes de mercado en APIs de visión ..................................... 36
Tabla n.° 2. Primera generación de los sistemas de vigilancia inteligentes ............................... 43
Tabla n.° 3. Segunda generación de los sistemas de vigilancia inteligentes ............................. 44
Tabla n.° 4. Tercera generación de los sistemas de vigilancia inteligentes ............................... 45
Tabla n.° 5. Competencia de los Gobiernos Locales en materia de Seguridad Ciudadana ....... 48
Tabla n.° 6. Número total de efectivos policiales y serenos por habitante ................................. 72
Tabla n.° 7. Diseño de un solo grupo con preprueba y posprueba............................................. 74
Tabla n.° 8. Cálculo de la confiabilidad ....................................................................................... 77
Tabla n.° 9. Ficha técnica de recolección de datos .................................................................... 77
Tabla n.° 10. Expertos que validaron el instrumento de recolección de datos ........................... 78
Tabla n.° 11. Resumen de procesamiento de casos .................................................................. 80
Tabla n.° 12. Pruebas de normalidad .......................................................................................... 80
Tabla n.° 13. Resultados preprueba de la variable Vigilancia .................................................... 81
Tabla n.° 14. Resultados preprueba de la dimensión Modelo de Comportamiento ................... 82
Tabla n.° 15. Resultados preprueba de la dimensión Modelo de Actuación .............................. 83
Tabla n.° 16. Resultados posprueba de la variable Vigilancia ................................................... 84
Tabla n.° 17. Resultados posprueba de la dimensión Modelo de Comportamiento ................... 85
Tabla n.° 18. Resultados posprueba de la dimensión Modelo de Actuación .............................. 86
Tabla n.° 19. Resultados preprueba y posprueba de la variable Vigilancia ............................... 87
Tabla n.° 20. Resultados preprueba y posprueba de la dimensión Modelo de Comportamiento
..................................................................................................................................................... 88
Tabla n.° 21. Resultados preprueba y posprueba de la dimensión Modelo de Actuación ......... 89
Tabla n.° 22. Resultados de la prueba de hipótesis general ...................................................... 91
Tabla n.° 23. Resultados de la prueba de hipótesis de la dimensión Modelo de Comportamiento
..................................................................................................................................................... 92
Tabla n.° 24. Resultados de la prueba de hipótesis de la dimensión Modelo de Actuación ...... 93
Tabla n.° 25. Matriz de Consistencia ....................................................................................... 104
Tabla n.° 26. Matriz de Operacionalización de Variables ......................................................... 106
Tabla n.° 27. Matriz de preguntas e índices .............................................................................. 109
Tabla n.° 28. Base de datos de la prueba piloto ....................................................................... 110
Tabla n.° 29. Base de datos de la dimensión Modelo de Comportamiento preprueba ............ 120
Tabla n.° 30. Base de datos de la dimensión Modelo de Actuación preprueba ....................... 121
Tabla n.° 31. Base de datos de la variable Vigilancia preprueba ............................................. 122
Tabla n.° 32. Base de datos de la dimensión Modelo de Comportamiento posprueba ............ 123
Tabla n.° 33. Base de datos de la dimensión Modelo de Actuación posprueba....................... 124
Tabla n.° 34. Base de datos de la variable Vigilancia posprueba ............................................. 125
Masgo Ferreyra Divad Jair viii

ÍNDICE DE FIGURAS
Página
Figura n.° 1. Esquema básico de una aplicación web ................................................................ 13
Figura n.° 2. Diagrama de bloques de las etapas típicas en un sistema de visión artificial ....... 15
Figura n.° 3. Esquema del sistema de visión artificial ................................................................. 15
Figura n.° 4. Relación entre dispositivos y el computador .......................................................... 17
Figura n.° 5. Esquema de funcionamiento de un filtro ................................................................ 17
Figura n.° 6. Ejemplo de segmentación identificando un texto ................................................... 18
Figura n.° 7. Esquema general de funcionamiento de un clasificador ........................................ 18
Figura n.° 8. Representación del problema de correspondencia en la visión estéreo................ 19
Figura n.° 9. Proyección perspectiva. ......................................................................................... 20
Figura n.° 10. Dispersión de luz al golpear una superficie y óptica de la lente. ......................... 20
Figura n.° 11. Matriz de filtro de color Bayer. .............................................................................. 20
Figura n.° 12. Algunas operaciones de procesamiento de imágenes más comunes. ................ 21
Figura n.° 13. Variedades de detectores de características y descriptores pueden ser usados
para analizar, describir y coincidir imágenes. ............................................................................. 22
Figura n.° 14. Algunas imágenes populares de técnicas de segmentación. .............................. 23
Figura n.° 15. Calibración y alineamiento geométrico. ............................................................... 24
Figura n.° 16. Estructura de sistemas de movimiento ................................................................ 25
Figura n.° 17. Estimación de movimiento. ................................................................................... 26
Figura n.° 18. Costura de imágenes ........................................................................................... 27
Figura n.° 19. Fusión de exposiciones múltiples para crear imágenes de alto rango dinámico. 28
Figura n.° 20. Fusionar fotografías con flash y sin flash. ............................................................ 28
Figura n.° 21. Mateado y composición de imagen. ..................................................................... 28
Figura n.° 22. Llenado de agujeros con pintura. ......................................................................... 28
Figura n.° 23. Par de imágenes con desplazamiento ................................................................. 29
Figura n.° 24. Un trazador estéreo analítico generando diagramas de contorno. ...................... 30
Figura n.° 25. Imagen sombreada ............................................................................................... 30
Figura n.° 26. Gradiente de texturas ........................................................................................... 31
Figura n.° 27. Escanear una escena con una sombra de palo. .................................................. 31
Figura n.° 28. Fusión de mapas de rango en un modelo 3D. ..................................................... 31
Figura n.° 29. Modelado automatizado en 3D de un edificio, rostro y cuerpo. ........................... 32
Figura n.° 30. Vista 3D de una reconstrucción de Photo Tourism. ............................................. 32
Figura n.° 31. Detección de rostros en tiempo real. .................................................................... 33
Figura n.° 32. Reconocimiento basado en características y regiones. ....................................... 33
Figura n.° 33. API Vision de Google ........................................................................................... 34
Figura n.° 34. Comparación de características entre APIs populares de cómputo en la nube. . 38
Figura n.° 35. Geolocalización en diversos dispositivos con API Maps ..................................... 40
Figura n.° 36. Plataforma Bing Maps de Microsoft...................................................................... 40
Figura n.° 37. Plataforma Bing Maps de Microsoft...................................................................... 41
Masgo Ferreyra Divad Jair ix

Figura n.° 38. Mejores APIs de mapeo. ...................................................................................... 41

Figura n.° 39. Modelo taxonómico para sistemas de vigilancia .................................................. 43
Figura n.° 40. Comisaría de Lince. .............................................................................................. 48
Figura n.° 41. Jerarquía del indicador Detección. ....................................................................... 50
Figura n.° 42. Jerarquía del indicador Posicionamiento. ............................................................ 51
Figura n.° 43. Jerarquía del indicador Identificación. .................................................................. 51
Figura n.° 44. Jerarquía del indicador Rastreo. .......................................................................... 52
Figura n.° 45. Diseño de anillo y modelo de cobertura de islas. ................................................. 53
Figura n.° 46. Jerarquía del indicador Manejo de Contenido. ..................................................... 54
Figura n.° 47. Jerarquía del indicador Tipo de Sensor. .............................................................. 55
Figura n.° 48. Jerarquía del indicador Conectividad de Nodo. ................................................... 55
Figura n.° 49. Jerarquía del indicador Fijación de Nodo. ............................................................ 56
Figura n.° 50. Diagrama de flujo del sistema de detección de intrusos. ..................................... 57
Figura n.° 51. Captura continua de imágenes............................................................................. 57
Figura n.° 52. Principales víctimas de actos de delincuencia en Latinoamérica ........................ 70
Figura n.° 53. Población del área urbana víctima de algún hecho delictivo agosto 2018 a enero
2020 ............................................................................................................................................. 71
Figura n.° 54. Cantidad de denuncias por comisión de delitos ................................................... 72
Figura n.° 55. Zonas del distrito de Lince .................................................................................... 75
Figura n.° 56. Distribución de frecuencias de la variable Vigilancia preprueba .......................... 81
Figura n.° 57. Distribución de frecuencias de la dimensión Modelo de Comportamiento preprueba
..................................................................................................................................................... 82
Figura n.° 58. Distribución de frecuencias de la dimensión Modelo de Actuación preprueba .... 83
Figura n.° 59. Distribución de frecuencias de la variable Vigilancia posprueba ......................... 84
Figura n.° 60. Distribución de frecuencias de la dimensión Modelo de Comportamiento posprueba
..................................................................................................................................................... 85
Figura n.° 61. Distribución de frecuencias de la dimensión Modelo de Actuación posprueba ... 86
Figura n.° 62. Distribución de porcentaje de la variable Vigilancia preprueba y posprueba ...... 87
Figura n.° 63. Distribución de porcentaje de la dimensión Modelo de Comportamiento preprueba
y posprueba ................................................................................................................................. 88
Figura n.° 64. Distribución de porcentaje de la dimensión Modelo de Actuación preprueba y
posprueba.................................................................................................................................... 89
Figura n.° 65. Fórmula Coeficiente Alfa de Cronbach .............................................................. 111
Masgo Ferreyra Divad Jair x

ÍNDICE DE ECUACIONES
Página
Ecuación n.° 1. Fórmula Coeficiente Alfa de Cronbach .............................................................. 77
Masgo Ferreyra Divad Jair xi

RESUMEN
La presente investigación tiene como objetivo determinar la influencia que existe al implementar
un sistema web basado en visión artificial y geolocalización, y su influencia en la vigilancia de las
zonas vecinales del distrito de Lince en el año 2020. Para lograr este objetivo, se emplearon
herramientas tecnológicas, innovadoras y algoritmos potentes, que funcionan a través de
servicios web proporcionados por empresas como Google y Microsoft. Algunas de las funciones
empleadas son el reconocimiento de rostros, detección de objetos y reconocimiento de
caracteres.
El enfoque usado en esta investigación fue el cuantitativo de tipo aplicada, además de

ser explicativo, se aplicó el diseño experimental de tipo preexperimental, con dos momentos de
recopilación de información (antes y después de aplicado el reactivo). Para tal fin se empleó un
cuestionario aplicado al coordinador encargado del Centro de Monitoreo ubicado en el distrito de
Lince. El instrumento de recolección de datos estuvo constituido por 17 preguntas con 5 opciones
de respuesta, los agentes brindaron información acerca de la variable vigilancia, por medio de la
evaluación de sus dimensiones. La información recabada se presenta en la parte de resultados
por medio de gráficos y explicaciones textuales.
La investigación concluye que la implementación de un sistema web basado en visión

artificial y geolocalización no influye positivamente en la vigilancia de las zonas del distrito de
Lince en el año 2020. Considerando la significancia (sig. unilateral = 0.074 > 0.05).
Palabras clave: Vigilancia; visión artificial; geolocalización; automatización; seguridad.
Masgo Ferreyra Divad Jair xii

CAPÍTULO I. INTRODUCCIÓN
1.1. Bases Teóricas
1.1.1. Bases Teóricas de la variable Sistema Web basado en Visión
Artificial y Geolocalización
1.1.1.1. Definición de Sistema Web
Un sistema o aplicación basada en la web emplea componentes estandarizados que contribuyen
a su desarrollo haciéndolo más simple. El cliente, el servidor web y el protocolo (en este caso
HTTP) se encuentran previamente estandarizados y se comunican a través de Internet como se
muestra en la figura n° 1 (Luján, 2002, citado por Grandez, 2018).
Figura n.° 1. Esquema básico de una aplicación web

fuente: (Luján, 2002, p. 51)
Del mismo modo, Idárraga (2016) manifiesta que su nombre se debe a que emplea la
red para su ejecución haciendo que los contenidos alojados en la web sean accedidos desde un
ordenador mediante una conexión a internet.
Molina, Zea, Contento y García (2017), mencionan que las aplicaciones web son
herramientas que permiten efectuar operaciones desde un ordenador por medio de Internet
logrando aminorar el tiempo usado para cada actividad, además remarca que esta característica
ha permitido la aceptación y usabilidad por parte de los usuarios de este tipo de software. En ese
sentido, también permite el acceso simultaneo de usuarios a sus operaciones mediante la
composición de tareas relacionadas a la base de datos. (p.58)
Algo semejante ocurre con lo afirmado por Caivano y Villoria (2009) citado por Molina et.
al. (2017) acerca de las aplicaciones web, estas generan dinámicamente unas páginas en un
formato estandarizado como HTML y XHML los cuales son soportados por los navegadores web
comunes.
Esto nos lleva a deducir que los sistemas o aplicaciones web están hechos con el objetivo
de ser usables y desarrollados mediante el uso de estándares tanto en la comunicación como en
el proceso, empleando técnicas de centralización, accesibilidad y simultaneidad que demuestra
una ventaja frente a otras tecnologías.
Masgo Ferreyra Divad Jair 13

1.1.1.2. Definición de Visión Artificial

Vélez, Moreno, Sánchez y Sánchez-Marín (2003) citado por Loaiza, Manzano y Múnera (2012)
afirman que: “La visión artificial tiene como finalidad la extracción de información del mundo físico
a partir de imágenes, utilizando para ello un computador. Se trata de un objetivo ambicioso y
complejo que actualmente se encuentra en una etapa primitiva” (p.16).
Por otro lado, Szeliski (2010) sostiene que la visión artificial tiene un enfoque humano
orientado a la percepción ya que percibimos la estructura tridimensional del mundo en el que
vivimos con mucha facilidad. Además, nos ilustra una situación cotidiana que nos muestra cómo
podemos percibir características tan complejas como la forma y transparencia de los pétalos de
un simple jarrón de flores, incluso de reconocer sutiles patrones de luz y sombreado. Incluso al
mirar un retrato de grupo enmarcado, se puede contar y nombrar fácilmente a todas las personas
en la imagen adivinando sus emociones desde su aspecto facial.
A su vez, Porras (2014) describe la función principal de la visión artificial, sosteniendo

que trata de simular el proceso del sentido de la visión de los seres vivos, es decir, que cuando
un objeto es captado mediante receptores para luego ser enviados como impulsos nerviosos que
finalmente serán procesados por el cerebro.
En cuanto al control de procesos en tiempo real, es posible que mediante técnicas de

visión artificial se puedan tomar datos rápidamente. Esto significa que estos procesos pueden
trabajar de una manera autónoma, validando exhaustivamente cada parte producida. (Alegre;
Barreiro; Castejón y Suarez, 2008)
Además, se definen dos términos equivalentes “la visión artificial o visión por computador
es la ciencia y la tecnología que permite a las ‘máquinas’ ver, extraer información de las imágenes
digitales, resolver alguna tarea o entender la escena que están visionando”. (García, 2012, p.5)
Teniendo en cuenta los conceptos expuestos en los párrafos precedentes, existe

consenso en que la visión artificial principalmente se encarga de la extracción de información de
imágenes y por consecuencia tratar de simular el sentido de la vista de los seres vivos
realizándolo de manera rápida.
1.1.1.3. Etapas de la Visión Artificial

Vélez et al. (2003) manifiestan que “se ha visto que el ser humano captura la luz a través de los
ojos, y que esta información circula a través del nervio óptico hasta el cerebro donde se procesa”
(p.18). Asimismo, proponen que la descomposición de imágenes comprende la búsqueda de
elementos más simples, conformando el primer paso del procesado; posteriormente, el cerebro
descifra la escena para finalmente efectuar una acción. En consecuencia, con la finalidad de
imitar este comportamiento, Vélez et al. (2003) define cuatro fases principales como se observa
en la figura n.° 2:

Figura n.° 2. Diagrama de bloques de las etapas típicas en un sistema de visión artificial
fuente: (Vélez et al., 2003, p. 19)
La primera fase, que es puramente sensorial, se refiere a la captura o adquisición
de imágenes digitales mediante cierto tipo de sensor. La segunda etapa se
enfoca en el tratamiento digital de imágenes, con la finalidad de facilitar las
etapas consecutivas; en esta etapa de procesamiento previo con ayuda de filtros
y transformaciones geométricas, se eliminan partes indeseables de una imagen
o se destacan partes interesantes de la misma. La siguiente fase se denomina
segmentación, y consiste en separar los elementos que interesan de una escena
para estudiarla. Finalmente, en la etapa de reconocimiento o clasificación se
pretende distinguir los objetos segmentados, por medio del análisis de ciertas
características diferenciadoras que se establecen con antelación. (Vélez et al.,
2003, pp. 19-20)
Por otra parte, Loaiza et al. (2012) describe en un esquema el proceso general de visión
artificial (figura n.° 3) que consta en adquisición de imágenes, segmentación, descripción, y
detección de movimiento y seguimiento.
Figura n.° 3. Esquema del sistema de visión artificial

fuente: (Loaiza et al., 2012, p. 89)

Según el esquema mostrado en la figura n.° 3, Loaiza et al. (2012) describe los siguientes
procesos: El primer proceso se denomina adquisición de imágenes, el cual comprende la captura
de imágenes de los tipos de intensidad, alcance y las térmicas, las cuales siempre se obtiene
una matriz 2D de valores. El segundo, se refiere a la segmentación, que consiste en la división
de una imagen digital en regiones similares en relación a características específicas, con el fin
de analizar más fácilmente. La descripción, el tercer proceso, toma las regiones de interés para
extraer propiedades o atributos para la identificación de estructuras consideradas necesarias
para su uso en las aplicaciones. Por último, la detección de movimiento y seguimiento se refiere
a las tareas que: establecen la diferencia entre el fondo de la escena y los objetos en movimiento;
distinguir esos objetos identificándolos como persona o el tipo de interés; y finalmente realizar el
seguimiento a dichos objetos a través de la escena. (pp. 89-91)
Los enfoques de Vélez et al. (2003) y Loaiza et al. (2012) coinciden en que existen cuatro
procesos necesarios para desarrollar la visión artificial, asimismo mencionan los procesos de
captura y segmentación con una diferencia en la etapa final, ya que Loaiza et al. (2012) no solo
considera el reconocimiento, sino que hace énfasis en el seguimiento a través de la escena.
1.1.1.4. Clasificación de Visión Artificial

La visión artificial es clasificada por Vélez et al. (2003) en cinco procesos, mientras que Szeliski
(2010) considera trece procesos importantes que se deben tener en cuenta. Ambas posturas son
presentadas a continuación:
Clasificación según Vélez
Por un lado, Vélez et al. (2003) clasifica la visión artificial en cinco procesos:
Adquisición y representación de imágenes digitales
Este proceso comprende las cualidades principales de la fase que involucra a la captura y
digitalización de una imagen, la adquisición de la misma del mundo físico y su progreso hacia el
dominio discreto y virtual. Asimismo, Vélez et al. (2003) sostiene que una imagen bidimensional
digital está conformada por un conjunto píxeles, que a su vez cada uno provee información sobre
una zona específica de la imagen. En el caso de imágenes conformadas por escalas de gris,
está relacionada al brillo. Por otro lado, en las imágenes a color se puede obtener mediante la
intensidad individual de los componentes que conforman el modelo cromático como el RGB. A
su vez, se encuentran involucradas técnicas de compresión dedicadas a encontrar la manera
más eficiente de almacenar imágenes. Por último, este proceso abarca también las relaciones
esenciales entre píxeles que es posible conformar en una imagen. (Vélez et al., 2003, p. 23)
Esto nos hace deducir que la elección del dispositivo de captura relacionada al
computador (figura n.° 4) y uso que se le quiera dar, influye de sobremanera en el resultado de
este nivel.

Figura n.° 4. Relación entre dispositivos y el computador

fuente: (Vélez et al. 2003, p. 35)
Filtrado y realzado de imagen
También con respecto a este nivel, Vélez et. al. (2003) dice que este proceso abarca las
operaciones y transformaciones que se ejecutan en las imágenes digitales antes de la
segmentación y reconocimiento; de tal modo que tiene por finalidad enriquecer o acentuar algún
componente de la imagen, haciendo posible que las siguientes etapas de segmentación y
clasificación se desarrollen lo más simple posible. Por otro lado, la teoría de filtros explica parte
de las operaciones involucradas en este proceso; en ese sentido, un filtro se podría definir como
una forma de cambio o transformación asociada a una señal de entrada, que mediante la
transferencia logra una señal de salida como se muestra en la figura n.° 5., estas comúnmente
pueden ser sonidos o imágenes. (p. 61)
Figura n.° 5. Esquema de funcionamiento de un filtro

Segmentación
Vélez et al. (2003) afirma que en este proceso se obtienen regiones homogéneas a partir de una
imagen digital, tomando en cuenta algunas propiedades tales como el brillo o el color, con la
misión de simplificar su análisis posterior y reconocimiento. Por ejemplo, al encontrar en una
fotografía el rostro de una persona o los límites de un texto determinado como se observa en la
figura n.° 6. (p. 111)

Figura n.° 6. Ejemplo de segmentación identificando un texto

A pesar de que existen diferentes maneras para realizar este proceso, podemos crear
técnicas a medida obedeciendo al problema elegido ya que cuenta con reglas estrictas.
Adicionalmente, se consideran métodos que permiten segmentar objetos independientemente
de la posición y escala con la finalidad de afrontar algunos inconvenientes en la descripción de
los objetos que resulten de este proceso. (Vélez et al., 2003, citado por Loaiza et al., 2012, p. 90)
Lo detallado anteriormente describe un proceso muy conveniente para la tarea de

detección de placas de autos y rostros para efectos de la seguridad ciudadana ya que permite
reemplazar la tarea del visualizador humano haciéndola más óptima y precisa.
Clasificadores
Para comprender este proceso, Vélez et al. (2003) emplea el concepto de clases que mediante
diferentes algoritmos nos ayudan clasificar los elementos determinados que se encuentra dentro
de una escena para poder entenderla. Estos algoritmos tienen el trabajo de diferenciar entre
múltiples objetos sobre un universo de trabajo. Los clasificadores son métodos que permiten
precisar automáticamente la pertenencia de determinados objetos de un conjunto a una clase
(figura n°. 7). (p. 151)
Figura n.° 7. Esquema general de funcionamiento de un clasificador

Con esta información podremos hacer una correspondencia para efectos de esta
investigación: objeto (elemento determinado en la vía), universo de trabajo (calles del distrito) y
clases (vehículos, peatones, señales de tránsito, etc.).

Visión tridimensional
Vélez et al. (2003) manifiesta que la adquisición de un sistema en tres dimensiones de una
escena se manifiesta como uno de los mayores desafíos. La reconstrucción tridimensional para
algunos seres vivos es tan cotidiana como respirar, sin embargo, comprende la(s) proyección(es)
de un escenario real en zonas fotosensibles. Para formular el problema de una manera más
básica, emplea el método del par estereoscópico mostrado en la figura n.° 8. (p. 187)
Figura n.° 8. Representación del problema de correspondencia en la visión estéreo

Esto se puede notar en el proceso de caza de un depredador aéreo, el cual obtiene

mediante movimientos diversas perspectivas de la presa que está acechando. Asimismo, las
cámaras tipo Domo pueden asemejar las funciones del depredador ya que constantemente giran
para obtener imágenes desde diversos ángulos.
Clasificación según Szeliski
Por otro lado, Szeliski (2010) propone trece procesos para esta clasificación de la visión artificial:
Formación de imágenes
El proceso de formación de imágenes se entiende como la producción de una imagen particular

dado un conjunto de condiciones de iluminación, geometría de la escena, propiedades de la
superficie y óptica de la cámara. Además, propone que dicho proceso involucra las primitivas
geométricas básicas (puntos, líneas y planos) y las transformaciones geométricas que proyectan
estas cantidades 3D en las propiedades de la imagen 2D (figura n.° 9). (Szeliski, 2010, p.31)

Figura n.° 9. Proyección perspectiva.

fuente: (Szeliski, 2010, p. 30)
Por otro lado, se describe como la iluminación, las propiedades de la superficie (izquierda
de la figura n.° 10) y la óptica de la cámara (derecha de la figura n.° 10) interactúan para producir
los valores de color innecesarios para el sensor. (p.31)
Figura n.° 10. Dispersión de luz al golpear una superficie y óptica de la lente.
Por último, se configura el proceso que involucra la conversión de las imágenes de color
continuo en muestras digitales discretas dentro del sensor de imagen (figura n.° 11) y evitar las
deficiencias de muestreo, como el “aliasing”.
Figura n.° 11. Matriz de filtro de color Bayer.

Procesamiento de imágenes
Considerando como las imágenes se forman a través de la interacción de elementos de escena

3D, iluminación, y ópticas y sensores de cámara, podemos enfocarnos en la primera etapa del
grueso de las aplicaciones sobre visión artificial, es decir, el uso de este procedimiento permite
pre procesar la imagen y facilitar su análisis posterior. Para efectos prácticos se definen algunos
ejemplos como la rectificación en cuanto a exposición y equilibrio de color, la reducción de
interferencias en la imagen, el aumento de la nitidez o el enderezamiento de la imagen al girarla
(figura n.° 12). Con la finalidad de lograr resultados aceptables en esta etapa, se debe tener

presente que la fotografía computacional y el reconocimiento abarcan el procesamiento de

imágenes dentro de la visión artificial. (Szeliski, 2010, p.101)
(a) imagen original;

(b) incremento de
contraste;
(c) cambio en la
tonalidad;
(d) “posterized”
(colores
cuantificados);
(e) borroso;
(f) girado.
Figura n.° 12. Algunas operaciones de procesamiento de imágenes más comunes.

Detección y coincidencia de características
Se definen como componentes esenciales de muchas aplicaciones de visión artificial. El primer

tipo de característica que podemos observar son ubicaciones específicas en las imágenes, como
los picos de montañas, esquinas de edificios, marcos de puerta o interesantes figuras en la nieve.
Este tipo localizado a menudo se llama punto clave o punto de interés (o incluso esquina) y a
menudo se describen por la aparición de parches de píxeles que rodean la ubicación del punto
como se aprecia en la figura n.° 13. (Szeliski, 2010, p. 207)

(a) interés puntual;

(b) interés por
región;
(c) bordes;
(d) líneas rectas.
Figura n.° 13. Variedades de detectores de características y descriptores pueden ser usados
para analizar, describir y coincidir imágenes.
Otras clases de características igual de importantes son los bordes, por ejemplo, el perfil
de las montañas contra el cielo. Es posible combinar este tipo de características según su
orientación y apariencia local (perfiles de borde), y además pueden ser buenos indicadores de
los límites de los objetos y eventos de oclusión en secuencias de imágenes. Los bordes se
pueden agrupar en curvas más largas y segmentos de línea recta, que se pueden emparejar o
analizar directamente para encontrar puntos de fuga y, por lo tanto, parámetros de la cámara
interna y externa.
Segmentación
Szeliski (2010) sostiene también que la segmentación de imágenes es la tarea de encontrar

grupos de píxeles que vayan juntos. En estadística, este problema es conocido como “cluster
analysis” y es un área ampliamente estudiada con cientos de algoritmos diferentes. Asimismo,
dice que la segmentación de imágenes es uno de los problemas más antiguos y ampliamente
estudiados. Las primeras técnicas tienden a usar la división de regiones o la fusión, que
corresponden a los algoritmos de división y aglomeración en la literatura de agrupamiento.
Algoritmos más recientes a menudo optimizan algunos criterios globales, tales como la
consistencia intra-region y las longitudes de los límites inter-region o la disimilitud. La figura n.°
14 muestra algunos ejemplos de estas técnicas aplicadas a diferentes imágenes. (p.269)

(a) contornos
activos;
(b) ajustes de
niveles;
(c) fusión basada
en gráficos;
(d) cambio medio;
(e) textura y cortes
intervenidos
basados en el
contorno
normalizado;
(f) MRF binario
resuelto mediante
gráficos.
Figura n.° 14. Algunas imágenes populares de técnicas de segmentación.

Dado que la teoría sobre segmentación de imágenes es tan extensa, una buena forma
de manejar algunos de los algoritmos de mejor rendimiento es observar las comparaciones
experimentales en bases de datos con etiquetas humanas (Arbeláez, Maire, Fowlkes et al.,
2010). El más conocido de estos es Berkeley Segmentation Dataset y Benchmark (Martin,
Fowlkes, Tal et al., 2001), que consta de 1000 imágenes pertenecientes a un conjunto de datos
de Corel, las mismas que fueron etiquetadas a mano por 30 sujetos humanos.
Muchos de los algoritmos de segmentación de imágenes más recientes informan

resultados comparativos sobre esta base de datos. Por ejemplo, Unnikrishnan, Pantofaru y
Hebert (2007) proponen nuevas métricas para comparar tales algoritmos. Estrada y Jepson
(2009) comparan cuatro algoritmos de segmentación bien conocidos en el conjunto de datos de
Berkeley y concluyen que, si bien el algoritmo SE-MinCut (Estrada, Jepson y Chennubhotla,
2004) supera a los demás por un pequeño margen, todavía existe una gran brecha entre la
productividad de la segmentación automatizada y humana.
Alineación basada en características
Luego de extraer las características de las imágenes, Szeliski (2010) manifiesta que la siguiente
etapa descrita en muchos algoritmos de visión es hacer coincidir estas características en
diferentes imágenes. Un componente importante de este emparejamiento es verificar si el
conjunto de características coincidentes es geométricamente consistente, por ejemplo, si los

desplazamientos de características se pueden describir mediante una simple transformación

geométrica 2D o 3D. Los movimientos calculados se pueden usar luego en otras aplicaciones,
como el cosido de imágenes o la realidad aumentada. Además, implica el análisis del registro
geométrico de imágenes, es decir, el cálculo de las transformaciones 2D y 3D que mapean las
características de una imagen a otra como se aprecia en la figura n.° 15. Un caso especial de
este problema es la estimación de postura, que comprende determinar la posición de una cámara
con respecto a un objeto o escena 3D conocida. Otro caso es el cálculo de la calibración propia
de una cámara, que radica en los parámetros internos, tales como la distancia focal y la distorsión
radial. Posteriormente, se pueden observar los problemas relacionados de cómo estimar la
estructura de puntos 3D a partir de coincidencias 2D (triangulación) y cómo estimar
simultáneamente la geometría 3D y el movimiento de la cámara (estructura desde el movimiento).
(p.311)
(a) alineamiento
geométrico de
imágenes en 2D
para coser;
(b) un objetivo de
calibración
bidimensional;
(c) calibración
desde puntos de
fuga;
(d) escena con
líneas fáciles de
encontrar y
direcciones de
desaparición.
Figura n.° 15. Calibración y alineamiento geométrico.

Estructura del movimiento
A diferencia de la alineación de puntos en 2D y 3D que pueden ser usados para los parámetros
de calibración de las cámaras, la estructura de movimiento trata del problema de la estimación
de ubicaciones de los puntos 3D a partir de múltiples imágenes, dando como resultado un
conjunto escaso de coincidencias entre las características de la imagen. (Szeliski, 2010, p.345)
Según Ullman (1979) citado por Szeliski (2010), a pesar de que este proceso a menudo
implica la estimación simultanea de la geometría 3D (estructura) y la posición de la cámara
(movimiento), es conocido como la estructura del movimiento. Además, la geometría proyectiva

y la estructura del movimiento constituyen temas muy enriquecedores para diversos autores de
libros y encuestas.
Este proceso implica también el problema de la triangulación que comprende en la

estimación de la ubicación 3D de un punto cuando se ve desde múltiples cámaras. Otro de los
inconvenientes radica en la determinación de la geometría epipolar entre dos cámaras y que
también puede utilizarse para recuperar cierta información sobre los propios de la cámara
empleando la auto calibración. También se analiza los enfoques de factorización para estimar
simultáneamente la estructura y el movimiento partiendo de una significativa cantidad de pistas
puntuales usando aproximaciones ortográficas al modelo de proyección como se aprecia en la
figura n.° 16.
Figura n.° 16. Estructura de sistemas de movimiento

Estimación de movimiento denso
Szeliski (2010) también manifiesta que los algoritmos para alinear imágenes y estimar el
movimiento en secuencias de video se encuentran entre los más utilizados en la visión artificial.
Por ejemplo, la alineación de imagen de velocidad de fotogramas es empleada en videocámaras
y cámaras digitales para implementar su función de estabilización de imagen (IS). Algunos
autores (Lucas y Kanade, 1981; Le Gall, 1991 citados por Szeliski) indicaron que un caso de un
algoritmo de registro de imágenes constantemente utilizado es la técnica de alineación
traslacional basada en parches (flujo óptico) como se aprecia en la figura n°.17, además
manifiestan que existen variantes de este algoritmo que se usan en casi todos los esquemas de
compresión de video con compensación de movimiento tales como MPEG y H.263. Algunos
algoritmos similares de estimación de movimiento paramétrico han encontrado una amplia
variedad de aplicaciones, incluidos los resúmenes de video, video estabilización y la compresión
de video. También se han desarrollado algoritmos de registro de imágenes más sofisticados para
imágenes médicas y teledetección. (p.383)

(a-b) flujo óptico

basado en
regularización;
(c-d) estimación de
movimiento en
capas;
(e-f) imagen de
muestra y flujo de
verdad de la base
de evaluación.
Figura n.° 17. Estimación de movimiento.

Costura de imágenes (Image Stitching)
Asimismo, Szeliski (2010) manifiesta que los algoritmos para alinear imágenes y unirlas en foto
mosaicos sin costura, se encuentran entre las más antiguas y más utilizadas en la visión artificial
como las de Miligram en 1975 y Peleg en 1981. Los algoritmos de costura de imagen crean los
mosaicos fotográficos de alta resolución utilizados para producir los mapas digitales y fotografías
de satélite actuales. También vienen con la mayoría de las cámaras digitales y se pueden usar
para crear hermosas panorámicas ultra gran angular.
Las costuras de imágenes se originaron en la comunidad de fotogrametría, donde los

métodos más intensivos manualmente basados en puntos de control terrestre sondeados o
puntos de enlace registrados manualmente se han utilizado durante mucho tiempo para registrar
fotos aéreas en mosaicos fotográficos a gran escala. Uno de los avances clave en esta
comunidad fue el desarrollo de algoritmos de ajuste de paquetes, que podrían resolver
simultáneamente las ubicaciones de todas las posiciones de la cámara, produciendo soluciones
consistentes a nivel mundial. Otro problema recurrente en la creación de mosaicos fotográficos
es la eliminación de las costuras visibles, para intentar resolverlo se han desarrollado una
variedad de técnicas a través de los años. (Szeliski, 2010)

(a) porción de un
panorama
cilíndrico;
(b) panorama
esférico construido
con 54 fotografías;
(c) panorama de
múltiples imágenes
ensamblado
automáticamente a
partir de una
colección de fotos
desordenadas;
(d) sin movimiento;
(e) con eliminación
de objetos en
movimiento.
Figura n.° 18. Costura de imágenes

Fotografía computacional (Computational Photography)
Szeliski (2010) sostiene también que, al combinar múltiples imágenes en panoramas de amplio
campo de visión, podemos crear fotografías que no podrían capturarse con una cámara normal.
Así pues, el mismo autor dice que la fotografía computacional implica el análisis de imágenes y
los algoritmos de procesamiento que se aplican a una o más fotografías para crear imágenes
que van más allá de las capacidades de los sistemas de imágenes tradicionales. Algunas de
estas técnicas ahora se están incorporando directamente en cámaras digitales. Por ejemplo,
algunas de las cámaras digitales más recientes tienen modos de barrido panorámico y toman
varias tomas en condiciones de poca luz para reducir el ruido de la imagen.
Uno de los algoritmos usados en la fotografía computacional comprende la revisión de

la calibración de la imagen fotométrica, es decir, la medición de las respuestas de la cámara y la
lente, que es un requisito previo para muchos de los algoritmos. Las imágenes de alto rango
dinámico capturan completamente el brillo en una escena a través del uso de múltiples
exposiciones (figura n.° 19).

Figura n.° 19. Fusión de exposiciones múltiples para crear imágenes de alto rango dinámico.
Otro campo de análisis comprende a los operadores de mapeo de tonos, que vuelven a
mapear imágenes ricas en dispositivos de visualización normales, como pantallas e impresoras,
así como algoritmos que combinan imágenes con y sin flash para obtener mejores exposiciones
(figura n.° 20).
Figura n.° 20. Fusionar fotografías con flash y sin flash.

Además, podemos encontrar algunos algoritmos para cortar trozos de imágenes de una
fotografía y pegarlas en otras (figura n.° 21).
Figura n.° 21. Mateado y composición de imagen.

También debemos conocer cómo generar nuevas texturas a partir de muestras del
mundo real para aplicaciones tales como rellenar agujeros en imágenes (figura n.° 22).
Figura n.° 22. Llenado de agujeros con pintura.


Coincidencia estéreo (Stereo correspondence)
La coincidencia estéreo es el proceso de tomar dos o más imágenes y estimar un modelo 3D de

la escena al encontrar los píxeles correspondientes en las imágenes y convertir sus posiciones
2D en profundidades 3D. Existen técnicas para recuperar posiciones de cámara y construir
modelos 3D dispersos de escenas u objetos. Es por esto que existe la cuestión de cómo construir
un modelo 3D más completo, por ejemplo, un mapa de profundidad escasa o densa que asigna
profundidades relativas a píxeles en las imágenes de entrada. También se debe analizar el tema
de los algoritmos estéreo de múltiples vistas que producen modelos de objetos 3D volumétricos
o basados en la superficie. (Szeliski, 2010, p.535)
Desde las primeras investigaciones sobre la percepción visual, se sabía que percibimos
la profundidad en función de lo que vemos diferente entre el ojo izquierdo y el derecho. Lo
podemos comprobar simplemente manteniendo el dedo verticalmente frente a los ojos y cerrando
cada ojo alternativamente. Notará que el dedo salta hacia la izquierda y hacia la derecha con
respecto al fondo de la escena. El mismo fenómeno es visible en el par de imágenes de la figura
n.° 23, en el que los objetos del primer plano se desplazan hacia la izquierda y hacia la derecha
en relación con el fondo.
Figura n.° 23. Par de imágenes con desplazamiento

Los primeros algoritmos de coincidencia estéreo se desarrollaron en el campo de la

fotogrametría para construir automáticamente mapas topográficos de elevación a partir de
imágenes aéreas superpuestas. Antes de esto, los operadores usaban trazadores estéreos
fotogramétricos, que mostraban versiones cambiadas de tales imágenes en cada ojo y permitían
al operador hacer flotar un cursor de puntos alrededor de contornos de elevación constantes
(figura n.° 24). El desarrollo de algoritmos de coincidencia estéreo totalmente automáticos fue un
gran avance en este campo, permitiendo un procesamiento mucho más rápido y menos costoso
de imágenes aéreas (Hannah 1974, Hsieh, McKeown y Perlant 1992 citado por Szeliski, 2010).

Figura n.° 24. Un trazador estéreo analítico generando diagramas de contorno.

Reconstrucción 3D
Según Szeliski (2010) debemos considerar que la coincidencia estéreo desarrolla diversas
técnicas para reconstruir modelos 3D de alta calidad a partir de dos o más imágenes, por
consiguiente, dice que el estéreo corresponde principalmente a una de las muchas señales
potenciales que se pueden usar para inferir la forma de las imágenes. A su vez manifiesta que
la reconstrucción 3D abarca varias de estas técnicas, que incluyen no solo indicaciones visuales
como sombreado y enfoque, sino también técnicas para fusionar imágenes de rango múltiple o
profundidad en modelos 3D, así como técnicas para reconstruir modelos especializados, como
cabezas, cuerpos o arquitectura. Entre las diversas señales que pueden usarse para inferir la
forma, el sombreado en una superficie (figura n.° 25) puede proporcionar mucha información
sobre las orientaciones de superficie locales y, por lo tanto, sobre la forma general de la
superficie. Este enfoque se vuelve aún más poderoso cuando las luces que brillan desde
diferentes direcciones se pueden encender y apagar por separado considerado “photometric
stereo”. (p.579)
Figura n.° 25. Imagen sombreada

Además, sostiene sobre los gradientes de textura (figura n.° 26) que el acortamiento de
los patrones regulares a medida que la superficie se inclina o se dobla alejándose de la cámara,
pueden proporcionar indicaciones similares sobre la orientación de la superficie local. El enfoque
es otra indicación poderosa para la profundidad de la escena, especialmente cuando se usan
dos o más imágenes con diferentes configuraciones de enfoque.

Figura n.° 26. Gradiente de texturas

Sobre las formas 3D dice que también se pueden estimar utilizando técnicas de
iluminación activa como franjas de luz (figura n.° 27) o buscador de rango de tiempo de vuelo.
Figura n.° 27. Escanear una escena con una sombra de palo.
Los modelos obtenidos aplicando las técnicas mencionadas anteriormente pueden luego
fusionarse en otros modelos de superficie 3D más coherentes (figura n.° 28). Dichas técnicas se
han utilizado para construir modelos de patrimonio cultural muy detallados y precisos, como sitios
históricos.
Figura n.° 28. Fusión de mapas de rango en un modelo 3D.

El modelado 3D puede ser más eficiente y efectivo si sabemos algo sobre los objetos
que estamos tratando de reconstruir. Además, podemos observar tres ejemplos especializados
(figura n.° 29), pero de ocurrencia común, a saber, la arquitectura, las cabezas y los rostros, y
los cuerpos completos. Cabes señalar que además de modelar personas, también es posible
emplear técnicas para rastrearlas.

Figura n.° 29. Modelado automatizado en 3D de un edificio, rostro y cuerpo.

Renderizado basado en imágenes (Image-based rendering)
Además, Szeliski (2010) manifiesta que el renderizado basado en imágenes se convirtió en una
de las aplicaciones más interesantes de la visión computacional, debido a que las técnicas de
reconstrucción 3D de la visión artificial se combinan con técnicas de renderizado de gráficos por
computadora que utilizan vistas múltiples de una escena para crear experiencias interactivas de
realismo fotográfico, como el sistema Photo Tourism que se muestra en la figura n.° 30.
Figura n.° 30. Vista 3D de una reconstrucción de Photo Tourism.

Existe una variedad de técnicas de representación basadas en imágenes, partiendo por

la interpolación de vistas, que crea una transición sin interrupciones entre dos imágenes de
referencia que utilizan uno o más mapas de profundidad pre calculados. Estrechamente
relacionado con esta idea están los mapas de textura dependientes de la vista, que combinan
múltiples mapas de textura en la superficie de un modelo 3D. (Szeliski, 2010, p.621)
Reconocimiento
De todas las tareas visuales que podemos pedirle a una computadora que realice como analizar
una escena y reconocer todos los objetos integrantes sigue siendo la más desafiante. Mientras
que las computadoras se destacan por reconstruir con precisión la forma 3D de una escena a
partir de imágenes tomadas desde diferentes vistas, no pueden nombrar todos los objetos y
animales presentes en una imagen, incluso a nivel de un niño de dos años. Ni siquiera hay
consenso entre los investigadores sobre cuándo se puede lograr este nivel de rendimiento. En
ese sentido, partiendo de la dificultad del reconocimiento, podemos comprender que el mundo
real está hecho de un revoltijo de objetos, que se obstruyen entre sí y aparecen en diferentes
posiciones. Además, la variabilidad propia de una clase, debido a una articulación compleja no
rígida y variaciones extremas en forma y apariencia como la diferenciación entre distintas razas

de perros, hace improbable que podamos simplemente realizar una comparación exhaustiva con
una base de datos de ejemplos. (Szeliski, 2010, p.657)
Szeliski (2010) también desglosa el problema de reconocimiento a lo largo de varios ejes.

Por ejemplo, si sabemos lo que estamos buscando, el problema radica en la detección de
objetos, que implica escanear rápidamente una imagen para determinar dónde se puede producir
una coincidencia (figura n.° 31); si tenemos un objeto rígido específico que estamos tratando de
reconocer, podemos buscar puntos de coincidencia y verificar que se alineen geométricamente
de manera ordenada.
Figura n.° 31. Detección de rostros en tiempo real.

Asimismo, Szeliski (2010) manifiesta que la versión más desafiante de este tipo de tarea
es el reconocimiento general de la categoría (o clase), que puede implicar el reconocimiento de
instancias de clases extremadamente variadas, como animales o muebles. Algunas técnicas
dependen puramente de la presencia de características (conocidas como modelo "bag of
words”), sus posiciones relativas (modelo basado en partes), mientras que otras comprometen
la segmentación de imágenes en regiones semánticamente significativas (figura n.°32).
Figura n.° 32. Reconocimiento basado en características y regiones.

En muchos casos, el reconocimiento depende potencialmente del contexto de los objetos

circundantes y los elementos dentro de la escena. El aprendizaje está involucrado también en
estas técnicas, dado que los reconocedores de objetos específicos hechos a mano parecen un
enfoque útil dada la complejidad del problema. (Szeliski, 2010, p.657)

Como podemos observar, ambas clasificaciones cuentan con aspectos en común tales
como la segmentación, el tratamiento de imágenes según sus características y la ubicación en
un plano tridimensional. Con esto, ambos autores tratan de asemejarse a la capacidad de
algunos seres vivos y sobre todo a la capacidad humana de comprender imágenes y extraer
información de ellas en tiempo real.
1.1.1.5. Aplicaciones de la Visión Artificial

A continuación, presentamos algunos de los productos que ofrecen las empresas de servicios
en la nube más populares.
Google API Vision
Según Google (2017), la API Vision de Google Cloud ayuda a la comprensión del contenido de
imágenes empleando técnicas de aprendizaje automático, a través de una API REST muy
amigable para los programadores. Las funciones principales radican en la clasificación de
imágenes en categorías, detección de posibles objetos y rostros dentro de una imagen, así como
la identificación de textos. Además, permite la creación de colecciones con tu propio catálogo,
monitorear contenido inapropiado, tener la capacidad de analizar sentimientos aplicándolo a
técnicas de mercadotecnia. Cabe destacar que adicionalmente puedes optar por el
almacenamiento en la nube que provee el servicio.
Figura n.° 33. API Vision de Google

fuente: (Google Cloud Platform, 2017)
Computer Vision API Microsoft
Según Microsoft (2017), la API Computer Vision basada en la nube proporciona a los
desarrolladores acceso a algoritmos avanzados para procesar imágenes y devolver información.
Proporcionando una imagen o enlace a una imagen en la nube, puede analizar el contenido
visual de diferentes formas dependiendo de los datos de entrada y las preferencias del usuario.
Con esta API los usuarios pueden analizar imágenes permitiendo:
- Etiquetar diferentes imágenes dependiendo del contenido.
- Categorizar imágenes.

- Identificar tipo y calidad de una imagen.
- Detecta rostros humanos y devuelve sus coordenadas.
- Reconoce el contenido específico del dominio.
- Genera descripciones del contenido.
- Reconocer caracteres para extraer determinado texto en una imagen.
- Reconocer el texto manuscrito.
- Distinga esquemas de color.
- Marcar contenido para adultos.
- Recortar fotos para usar como miniaturas.
Requisitos
- Métodos de entrada admitidos: binario de imagen sin procesar en forma de secuencia

de aplicación / octeto o URL de imagen.
- Admite imágenes en los siguientes formatos: JPEG, PNG, GIF, BMP.
- Peso del fichero la imagen: menos de 4 MB.
- Dimensión de la imagen: más de 50 x 50 píxeles.
Microsoft (2017) manifiesta que la API “devuelve etiquetas basadas en más de 2000
objetos reconocibles, seres vivos, paisajes y acciones” (p.1). Asimismo, manifiesta que este
servicio provee indicios cuando las etiquetas encontradas son confusas o de conocimiento
general, con esto trata de clarificar el sentido de la etiqueta en un entorno más familiar. Cabe
precisar que las etiquetas no se comportan de manera jerárquica, ya que forman colecciones
que a su vez sirven para constituir una descripción que sea mucho más comprensible cuando se
formen oraciones íntegras.
El siguiente paso a la definición de una imagen, comprende la exposición de etiquetas

relacionadas a objetos y acciones que se lograron identificar. En ese sentido, Microsoft (2017)
dice que esta función no se sujeta solamente al objeto en primer plano, por el contrario, también
considera los que se encuentran en el entorno. Además, cuenta con la posibilidad de detectar
rostros y proporcionar las coordenadas que conforman los rasgos faciales, con esto es posible
definir la posición de la cara, género y edad.
Amazon Rekognition
Permite añadir fácilmente el análisis de imagen y video en sus aplicaciones. Solo es necesario
proporcionar una imagen o video a la API de Amazon Rekognition y el servicio podrá identificar
objetos, personas, texto, escenas y actividades. Para este fin emplea “…la misma tecnología de
aprendizaje profundo de eficacia probada y altamente escalable desarrollada por científicos de
visión artificial de Amazon para analizar miles de millones de imágenes al día”. Otro aspecto a
destacar son los casos de uso comunes que incluyen: biblioteca de imágenes y video que permite

realizar búsquedas; verificación facial de usuarios; análisis de emociones y datos demográficos,

búsqueda de rostros; búsqueda de contenido no seguro; reconocimiento de famosos; detección
de texto; y etiquetas personalizadas. (Amazon, 2020)
Comparación entre APIs de Visión
Según Jayakody (2018) al momento de seleccionar una API de Visión, además de las
funcionalidades que ofrece, se debe considerar las herramientas de desarrollador (Software
Development Kit SDK), la capacidad de agregar nuestros propios modelos de entrenamiento
para un grupo de datos personalizados, el costo promedio del consumo uso de la API y la
escalabilidad. Considerando los criterios mencionados, podemos elegir más fácilmente con la
información de la tabla n.° 1.
Tabla n.° 1.
Comparación entre líderes de mercado en APIs de visión
Característica AWS recognition Google Vision Microsoft Congnitive

Services
Detección facial Si. Si. Si, atributos faciales,
Adicionalmente ofrece Detección de rostros puntos de referencia
la función de con cuadro faciales, detección de
comparación de delimitador, puntos de edad, comparaciones
rostros referencia de rostros, faciales y búsqueda
orientación de rostros facial similar
Análisis de video en
tiempo real
Reconocimiento Si No No
facial
(Reconociendo
a ciertas
personas)
Análisis de Si Si Detección de edad,
sentimientos pero sin análisis
faciales sofisticado de
(alegría, sentimientos
tristeza, enojo)
Detección de Sí, con etiquetas y Si, detección de Si, detección de
objetos puntuaciones de objetos con valores de objetos con etiquetas
confianza confianza
Sin cuadro delimitador
para objetos
identificados
Detección de Si Si Si
escena
Detección de No Si No
puntos de
referencia

Detección de No Si Si
logos
Procesamiento No No Si
de video para
detección de
rostros y
escenas
Detección de Si Si Si
contenido
inapropiado
Detección de No Si Si
texto / OCR
Código de Si Si Si
ejemplo,
documentación
para
desarrollador
Entrenamiento Si No directamente, pero Si
de modelos se puede hacer
usando Tensor Flow
Java SDK Si Si No
Eclipse toolkit Si No No
Consola de Si Si Si
desarrollador
Procesamiento Si Si No
por lotes
Costo Primer millón $1 por Primeras 1000 Nivel gratuito: hasta

1000 unidades unidades gratis. 5000 llamadas por
1001 – 1M $1.50 por mes.
1000 unidades Nivel estándar: $1.50
por 1000 unidades
Fuente: (Jayakody en Zaizi, 2018), traducido por el tesista.
Otra forma de poder elegir la tecnología que deseamos emplear en nuestro proyecto, la
hace Singh, Wheeler, Fong y Chaudhary (2019), en esta ocasión toma en cuenta también otras
empresas diferentes a las líderes del mercado como Clarifai, IBM y Kairos (figura n.° 34).

Figura n.° 34. Comparación de características entre APIs populares de cómputo en la nube.
fuente: (Singh et al., 2019)
Finalmente, notamos que con los datos mencionados anteriormente podemos deducir
que el servicio de Azure que pertenece a Microsoft ofrece una mejor opción, ya que cuenta con
diversas características que lo diferencian de sus competidores (detección de objetos con
etiquetas, comparación de rostros y creación de modelos personalizados) y la oferta económica
hace que el sistema vaya creciendo a la par con el costo de sus servicios ya que cuenta con un
nivel gratuito de 5000 llamadas mensuales.
1.1.1.6. Definición de Geolocalización

Según la Oficina de Seguridad del Internauta de España ([OSI], 2016), la geolocalización consiste
en obtener la ubicación geográfica de un objeto tal como un smartphone, un vehículo o una vía.
También manifiesta que “Para obtener la ubicación geográfica aproximada de un smartphone se
utiliza un sistema de posicionamiento global. El sistema está formado por una red de satélites
geoestacionarios que dan cobertura a toda la Tierra” (p.1).
Por otro lado, Techopedia (2014) citado por Data Centric (2018) dice que la
geolocalización implica la identificación de la ubicación de un dispositivo tecnológico conectado
a Internet como un radar, teléfono móvil. Asimismo, manifiesta que la geolocalización emplea el
Sistema de Posicionamiento Global (GPS) y otras tecnologías relacionadas para evaluar y
especificar ubicaciones geográficas.

Otra definición se refiere a la geolocalización como la capacidad de asignar coordenadas

geográficas a la información mediante herramientas informáticas con la ayuda de la
generalización GPS en dispositivos móviles y ordenadores personales haciendo que esté al
alcance de cualquier ciudadano y permitiendo su aplicación a distintos ámbitos. (Rodríguez,
2020, pp.3-4)
Para Beltrán (2015), “la geolocalización es un concepto que hace referencia a la situación
que ocupa un objeto en el espacio y que se mide en coordenadas de latitud (x), longitud (y) y
altura (z).” (p.104)
Los conceptos detallados anteriormente abonan a la idea del uso de este tipo de
tecnología para la obtención de la ubicación de dispositivos, apoyándose en la tecnología GPS
de localización mediante satélites.
1.1.1.7. Ventajas y Desventajas de la Geolocalización

Por una parte, este tipo de tecnología nos ayuda a hacer más eficiente algunos aspectos
cotidianos de nuestra vida. Algunas de estas tareas son ejemplificadas en el cálculo de la ruta
más corta hacia nuestro destino o el seguimiento de nuestros paquetes comprados por internet.
Es por esto que la información compartida beneficia tanto al usuario como a las organizaciones
que brindan estos servicios ya que nos permite a acceder a una mejor experiencia de usuario.
(OSI, 2016)
Por otro lado, al ser una aplicación tan accesible debemos protegernos ante cualquier
peligro que se puedan presentar controlando las funcionalidades de ubicación de los dispositivos,
asimismo se puede emplear para mostrarte publicidad relacionada a tu ubicación en Google o
Facebook, sin embargo, pueden darle algunos usos más creativos al intentar invadir nuestra
privacidad y darle usos que no permitimos. (Data Centric, 2018, OSI, 2016)
1.1.1.8. Aspectos Legales de la Geolocalización en el Perú

El Congreso de la República del Perú (2015) mediante el Decreto Legislativo N° 1182 intenta
regular el Uso de Datos Derivados de las Telecomunicaciones para la Identificación, Localización
y Geolocalización de Equipos de Comunicación, en el marco de la lucha contra la delincuencia y
el crimen organizado. Que actúa regulando el acceso de la unidad especializada de la Policía
Nacional del Perú, en casos de flagrancia delictiva, a la localización o geolocalización de
teléfonos móviles o dispositivos electrónicos de naturaleza similar.
1.1.1.9. Aplicaciones de Geolocalización

Google Maps API
Permite crear mapas atractivos para tus sitios, apps y plataformas internas. Utilizando la
inteligencia geográfica puede abrir nuevas posibilidades de crecimiento para las empresas.

Las API de Google Maps ofrecen acceso ilimitado a la base de datos mundial de Google
para su aplicación, con más de cien millones de fichas de empresas y lugares de interés. Si
necesita mostrar a los usuarios bares, cafeterías, aeropuertos o tiendas de alimentos cercanos,
puede proporcionar una lista filtrada con los lugares más relevantes para ellos. (Google, 2017)
Figura n.° 35. Geolocalización en diversos dispositivos con API Maps

fuente: (Google Developers, 2017)
Bing Maps
Microsoft (2020) describe a Bing Maps como una plataforma que proporciona múltiples APIs que
permiten acceder a los mapas en diversas modalidades: la API de control web de Bing Maps V8
que soporta Javascript y Typescript usa HTML5 y trabaja bien en la mayor parte de los sistemas
operativos del mercado; los servicios REST de Bing utilizan URL REST para realizar tareas como
crear una imagen estática de un mapa con marcadores, codificar geográficamente una dirección,
recuperar metadatos de imágenes o calcular una ruta; servicio de datos espaciales de Bing; el
SDK de control de Bing Maps; y aplicaciones para Windows 10.
Figura n.° 36. Plataforma Bing Maps de Microsoft

fuente: (Microsoft, 2020)

Mapbox
Es una plataforma de mapeo de código abierto para el diseño de mapas personalizados, también
cuentan con APIs y SDKs que se emplean como componentes básicos para integrar la
localización en cualquier aplicación móvil o web. (Mapbox, 2020).
Figura n.° 37. Plataforma Bing Maps de Microsoft

fuente: (Microsoft, 2020)
Comparación entre APIs de Mapas
RapidAPI (2018) hace una comparación entre los diez mejores servicios de mapas para
desarrolladores (figura n.° 38). Para lo cual se toman diversos criterios que posicionan a Google
Maps como el indicado para el desarrollo del sistema web.
Figura n.° 38. Mejores APIs de mapeo.

Fuente: (RapidAPI, 2018)

De acuerdo a los datos comparados anteriormente, es posible deducir que el servicio de

Google Maps cuenta con más funcionalidades disponibles (indicaciones de viaje, acceso a mayor
información de interés).
1.1.2. Bases Teóricas de la variable Vigilancia

1.1.2.1. Definición de Vigilancia
Ahmad, O'Nils y Lawal, (2013) sostienen que los modernos sistemas de vigilancia consisten en
miles de cámaras que se despliegan en un área de vigilancia para recopilar datos. Se extrae
información útil de estos datos para detectar, rastrear y reconocer objetos de interés para
comprender y analizar sus actividades.
Para Gil (2009), el objetivo principal de un sistema de vigilancia recae en la prevención

de acciones que puedan violar la seguridad de un lugar supervisado, en la cual se incluyen el
vandalismo, intrusión, monitoreo y registro de determinados espacios. Como en el caso del
recuento de automóviles que circulan en una carretera.
Por otro lado, Foresti (2000) referente a los sistemas de vigilancia genéricos “Consiste
en una serie de sensores, situados en posiciones estratégicas del espacio a vigilar y conectados,
a través de medios de transmisión adecuados, al correspondiente receptor” (p. 21). No obstante,
el sistema de sensores puede estar formado por distintos tipos de elementos y a su vez usar solo
algunos de ellos; sin embargo, esto no implica, que los sensores comprendidos no puedan ser
utilizados juntamente con otros para mejorar el rendimiento del sistema.
En cambio, el Centro de Innovación del Sector Público de PwC e IE Business School

(2015) hace referencia a los servicios de videovigilancia inteligente como:
Sistemas de seguridad apoyados en el uso de cámaras, ciberseguridad frente a
ataques a servicios públicos esenciales, seguridad en el transporte, centros de mando
y control para la gestión de emergencias, alertas públicas de desaparecidos, sistemas
de localización mediante tecnología GPS y soluciones de videovigilancia inteligente
aplicadas a la protección del patrimonio y las infraestructuras. (p.27).
Esto quiere decir que la videovigilancia inteligente abarca un mayor campo de influencia
a la hora de combatir no solo la inseguridad ciudadana, sino todo acto que vaya en contra de
algún bien público o privado.
Finalmente, el Congreso de la República del Perú (2015) define la videovigilancia como

“un sistema de monitoreo y captación de imágenes, videos o audios de lugares personas u
objetos”. Esto conforma una base de referencial para la redacción del Decreto Legislativo n°
1218, el cual busca legislar en cuanto al fortalecimiento de la seguridad ciudadana, lucha contra
la delincuencia y el crimen organizado.

1.1.2.2. Clasificación de Vigilancia

Ahmad et al. (2013), clasifican la vigilancia en tres modelos los cuales representan diferentes
aspectos de un problema de vigilancia dado, tal y como se puede apreciar en la figura n°. 39.
Partiendo del modelo de implementación que sugiere las soluciones físicas para poder
implementar las funciones que se identifican en el modelo de comportamiento. Luego el modelo
de actuación implementa acciones y actividades necesarias para lograr los objetivos de la
vigilancia.
Figura n.° 39. Modelo taxonómico para sistemas de vigilancia

fuente: (Ahmad, O’Nils y Lawal, 2013, p. 7)
1.1.2.3. Evolución de Vigilancia

Según Valera en 2006, la evolución de los sistemas de vigilancia basada en videos comienza
con los sistemas análogos de circuitos cerrado de televisión (CCTV). Estos sistemas consistían
en un número de cámaras ubicadas en distintas locaciones remotas y conectadas a uno o más
monitores, usualmente colocados en un solo cuarto de control como se muestran en la tabla n.°
2.
Tabla n.° 2.
Primera generación de los sistemas de vigilancia inteligentes
1° generación
Técnicas Sistemas analógicos de CCTV

Ventajas - Proveen buen rendimiento en algunas situaciones.

- Tecnología madura.
Problemas Uso de técnicas analógicas para la entrega y almacenamiento de
las imágenes.
Investigación - Digital versus analógico
Actual - Grabación de video digital
- Compresión de video CCTV
Fuente: (Valera y Velastin, 2005), traducido por el tesista.
Por otro lado, la discusión radica en el monitoreo de los sistemas de transporte
integrando diversos sistemas CCTV. Un gran número de estos sistemas emplean técnicas de
tipo analógicas en la distribución y almacenamiento de imágenes como se puede apreciar en la
tabla n.° 3. Para dicho fin se emplean cables coaxiales en la conexión de las cámaras CCTV
convencionales y la matriz compuesta por monitores y equipos de grabación. (Valera, 2006, p.
19)
Tabla n.° 3.
Segunda generación de los sistemas de vigilancia inteligentes
2° generación
Técnicas Vigilancia visual automatizada mediante la combinación de la
tecnología de visión por computadora con sistemas CCTV.
Ventajas Incrementa la eficiencia de la vigilancia de los sistemas CCTV.
Problemas Robustez de los algoritmos de detección y rastreo requeridos para

el análisis de comportamiento.
Investigación - Robustez de algoritmos de visión artificial trabajando en tiempo
Actual real.
- Aprendizaje automático de la variabilidad de la escena y patrones
de comportamiento.
- Cerrando la brecha entre el análisis estadístico de una escena y la
producción de interpretaciones del lenguaje natural.
Posteriormente, con la aparición de novedosas técnicas se pudo realizar avances
significativos, haciendo de los sistemas de vigilancia más eficientes.
La creación de la vigilancia a control remoto se debió a la introducción de nuevas

tecnologías en el mercado, como las redes de alta velocidad. Estos sistemas se apoyan en el
uso de sensores, como cámaras instaladas para el levantamiento de pesas, donde el íntegro de
la información se procesa en una ubicación remota. La tercera generación de sistemas de
vigilancia consiste en la integración de estas nuevas tecnologías con las técnicas de
procesamiento provenientes de sistemas anteriores (tabla n.° 4). Por lo tanto, dichos sistemas
se basan en la distribución y separación de las tareas de procesamiento en un nivel bajo y alto
en parte debido a la proliferación de los dispositivos llamados procesadores de señal digital

(DSP), que permite construir cámaras inteligentes o cámaras inteligentes con autonomía (local)
capacidades de procesamiento. (Valera, 2006, p.20)
Tabla n.° 4.
Tercera generación de los sistemas de vigilancia inteligentes
3° generación
Técnicas Sistema de vigilancia wide-area.
Ventajas - Información más precisa como resultado de combinar
diferentes tipos de sensores.
- Distribución.
Problemas - Distribución de la información (integración y comunicación)
- Metodología de diseño.
- Plataformas móviles.
- Plataformas multi-sensor.
Investigación Actual - Inteligencia distribuida versus centralizada.
- Fisión de datos.
- Marco de razonamiento probabilístico.
- Técnicas de vigilancia multi-camera.
1.1.2.4. Técnicas de Vigilancia

Para Collins, Lipton y Kanade (2000) existen tres categorías que involucran la videovigilancia
como tema de investigación.
Detección y rastreo
Para Collins et al. (2000) implica la extracción en tiempo real de objetos de un video y el
seguimiento continuo de este a lo largo del tiempo formando trayectorias. De acuerdo con
Stauffer y Grimson existen técnicas de aprendizaje estadístico no supervisado para agrupar la
trayectoria de objetos producida por la extracción del background perteneciente a una escena
específica. Un punto de vista específico describe la trayectoria de múltiples cámaras combinadas
dentro de una escena en común, utilizando una técnica de calibración descrita por Lee, Romano
y Stein, quienes determinan de manera automática de las vistas superpuestas de la cámara
mientras observa un conjunto reducido de objetos en movimiento localizados en un entorno
plano.
Análisis de movimientos humanos
Ésta técnica se relaciona con la detección periódica de movimientos que implican la marcha
humana y las descripciones del cuerpo humano a través del tiempo. (Collins et al., 2000)
Análisis de actividad
Así pues, Collins et al. (2000) manifiesta que esta categoría tiene la misión de analizar
secuencias temporales de observaciones de objetos para producir descripciones de alto nivel
involucrando diferentes tipos de agentes. Esto lo presenta como una de las más importantes
áreas de futuras investigaciones en la videovigilancia.

1.1.2.5. Sistemas de Vigilancia Inteligente

Albusac (2008) sostiene que “gran parte de los sistemas implantados actualmente son una
evolución de los sistemas de primera generación (formados principalmente por una sola cámara
y un monitor)” (p.1). Asimismo, manifiesta que lo conforman un grupo de cámaras que se
comunica con un local centralizado que cuenta con monitores de visualización y un operador.
Tan Kok Kheng (s.f.) citado por Albusac (2008), alto funcionario de una de las empresas
que implementan sistemas de vigilancia más importantes, considera que “tras 20 minutos de
vigilancia, la atención humana a los detalles del vídeo disminuye hasta niveles inaceptables y la
vídeovigilancia deja de tener sentido. La vídeovigilancia tradicional ya no puede cumplir las, cada
vez mayores, demandas del sector” (p.1). Esto quiere decir que la desventaja principal de estos
sistemas va en relación a la vinculación intensa con el humano que está detrás, debido a
circunstancias como el cansancio por largas horas de trabajo, la atención reducida por el uso de
una gran cantidad de pantallas simultáneamente que disminuyen la efectividad al momento de
descubrir circunstancias extrañas simultáneamente. Por lo que, este funcionario propone el uso
de sistemas de vigilancia que tengan la posibilidad de comprender lo que está sucediendo.
Por otro lado, Valera (2006) manifiesta que uno de los mayores avances de la historia
de sociedad fue la industrialización y por lo tanto la automatización de ciertos procesos. Desde
entonces, las investigaciones y desarrollo fueron orientándose a la automatización de más
actividades en la industria, reduciendo costos, tiempo y uso de recursos humanos. Los sistemas
de visión pudieron crecer en algunos campos, el grado de automatización de procesos o incluso
introducir un cierto grado de automatización en procesos que no fueron automatizados. En ese
contexto, la aplicación de sistemas de visión es globalmente usada en el campo médico para la
propuesta de diagnóstico como en (Tierney et al. 2000), o la probabilidad de eficiencia en el
catálogo de información. La rapidez del envío de datos resultando de la operación de
herramientas online y sistemas de procesamiento de imágenes definan pasos importantes para
los sistemas de salud modernos en las que la comunicación entre instituciones permita el
intercambio de información y consecuentemente aumente la eficiencia del sistema de salud.
Tradicionalmente, los sistemas de vigilancia fueron construidos para monitorear ciertas

actividades en unidades militares como aviones y naves usando sensores como radares y
sonares. Eventos recientes, incluyendo el mayor ataque terrorista, provocaron un incremento en
la demanda de la sociedad. Esto provocó que los gobiernos se vieran forzados a tener como
prioridad el reforzamiento de sus instituciones policiales. Los sistemas de visión están
rápidamente ganando mayor importancia en el terreno de la vigilancia, permitiendo la
automatización de las actividades de vigilancia además de adaptarse al entorno donde estos se
aplican. (Valera, 2006)
En conclusión, la demanda para el monitoreo remoto orientado a la seguridad recibe

particular atención en algunas áreas como los controles de tráfico, estacionamientos en
instalaciones públicas o privadas, aeropuertos o transporte subterráneo. Todo esto empleando
técnicas de automatización como manifiestan los autores anteriormente citados.

1.1.2.6. Seguridad Ciudadana

En 2014, según el Programa de las Naciones Unidas para el Desarrollo [PNUD], “la seguridad
ciudadana consiste en la protección de un núcleo básico de derechos, incluidos la vida, el respeto
a la integridad física y material de la persona, y su derecho a tener una vida digna.” (p.5).
Asimismo, PNUD (2014) considera que “el fortalecimiento de la seguridad ciudadana

depende de la construcción de instituciones y formas de convivencia democráticas que permitan
proteger de manera efectiva, sostenible y con apego a los derechos humanos, la integridad física
y material de las personas.” (p.6).
Por otra parte, el Ministerio del Interior ([MININTER], 2013) considerando la creación del
Sistema Nacional de Seguridad Ciudadana [SNSC] creado por Ley 27933 plantea que la
seguridad ciudadana es “la acción integrada que desarrolla el Estado, con la colaboración de la
ciudadanía, para asegurar la convivencia pacífica, la erradicación de la violencia y la utilización
pacífica de las vías y espacios públicos, así como para contribuir a la prevención (…)”. (p.8)
En ese sentido, a nivel nacional existen instituciones encargadas de velar por la

seguridad del país, principalmente la Policía Nacional del Perú a cargo del Ministerio del Interior:
Policía Nacional del Perú
En el año 2016, el Congreso de la República del Perú establece en el artículo II del Decreto
Legislativo n.° 1267 manifiesta que la Policía Nacional del Perú es un “órgano de carácter civil al
servicio de la ciudadanía, que depende del Ministerio del Interior; con competencia administrativa
y operativa para el ejercicio de la función policial en todo el territorio nacional” (p.1)
También destaca las funciones de la Policía Nacional del Perú en el artículo III del mismo
decreto:
(1) Garantiza, mantiene y restablece el orden interno, orden público y la
seguridad ciudadana. (2) Presta protección, y ayuda a las personas y a la
comunidad. (3) Garantiza el cumplimiento de las leyes y la seguridad del
patrimonio público y privado. (4) Previene, investiga los delitos y faltas, combate
la delincuencia y el crimen organizado. (5) Vigila y controla las fronteras. (6) Vela
por la protección, seguridad y libre ejercicio de los derechos fundamentales de
las personas y el normal desarrollo de las actividades de la población. (7) Presta
apoyo a las demás instituciones públicas en el ámbito de su competencia. (p.1)
Para tales efectos, en el Decreto Supremo n.° 026-2017-IN establece que las comisarías
forman parte de la estructura orgánica de la PNP como un órgano desconcentrado:

Comisaría
Según INEI (2012) el término comisaría se refiere a una “dependencia policial encargada de
mantener el orden público, con funciones preventivas y de investigación en una determinada
jurisdicción a nivel nacional” (p.255).
“La visión de una comisaría es ser una dependencia de la Policía Nacional del Perú,
generadora de seguridad, protección, tranquilidad y paz social, consolidando la confianza y
credibilidad de la comunidad, mediante un servicio de calidad.” (Municipalidad Provincial de Ilo,
p.1) Asimismo, tiene la misión de “garantizar el orden público, la seguridad ciudadana y la paz
social, contribuyendo al desarrollo socio-económico en su circunscripción territorial”.
(Municipalidad Provincial de Ilo, 2016, p.1)
En Lince existe solo una comisaría que brinda seguridad al distrito como se puede
apreciar en la figura n° 40.
Figura n.° 40. Comisaría de Lince.

fuente: (MININTER, 2020)
En relación a lo mencionado anteriormente, el Ministerio de Economía y Finanzas ([MEF],

2015) establece las competencias de los Gobiernos Locales en materia de Seguridad Ciudadana
establecidas en la siguiente tabla (tabla n.° 5).
Tabla n.° 5.
Competencia de los Gobiernos Locales en materia de Seguridad Ciudadana
Ley Competencia que establece la ley

Constitución “Los gobiernos locales promueven, apoyan y reglamentan la
Política del Estado participación vecinal en el desarrollo local. Asimismo, brindan
servicios de seguridad ciudadana, con la cooperación de la
Policía Nacional” (Constitución Política del Perú, Art. 197. 31 de
agosto de 1993, Perú).
Ley del Sistema “Los alcaldes presiden los respectivos comités provinciales y
Nacional de distritales de seguridad ciudadana que están encargados de
Seguridad elaborar el diagnóstico y de formular, implementar y evaluar los
Ciudadana, y su planes de seguridad ciudadana, en sus localidades” (Ley 27933
Reglamento (Ley de 2003, Ley del Sistema Nacional de Seguridad Ciudadana, Art.
27933) 15 al 18. 7 de marzo de 2003).

Ley Orgánica de Las municipalidades provinciales deben:

Municipalidades “(1) Establecer un sistema de seguridad ciudadana, con la
(Ley 27972) participación de la sociedad civil y la policía. (2) Normar el
establecimiento de los servicios de serenazgo, vigilancia
ciudadana, rondas urbanas o similares, de alcance distrital. (3)
Coordinar, con las municipalidades distritales y la policía, el
servicio interdistrital de serenazgo”. (Ley 27972 de 2003, Ley
Orgánica de Municipalidades, Art. 85. 27 de marzo de 2003)
Las municipalidades distritales organizan el servicio de
serenazgo y vigilancia municipal en sus localidades.
Fuente: (MEF, 2015).
1.1.2.7. Aspectos Legales de la Videovigilancia en el Perú

El Congreso de la República del Perú (2015) define algunas reglas referentes al uso de cámaras
de videovigilancia en el Decreto Legislativo N° 1218, que suscribe en el capítulo 1, artículo 3
sobre el ámbito de aplicación que están incluidas “personas naturales o jurídicas, públicas o
privadas, propietarias o poseedoras de cámaras de videovigilancia ubicadas en bienes de
dominio público” además de ”vehículos de servicio de transporte público de pasajeros y
establecimientos comerciales abiertos al público con un aforo de cincuenta (50) personas o más”
(p.26), en el artículo 4 del mismo capítulo se detallan las siguientes reglas:
(a) Disponibilidad. - Asegurar que las imágenes, videos o audios se encuentren
disponibles siempre que una persona autorizada necesite hacer uso de ellos. (b)
Integridad. - Las imágenes, videos o audios capturados no deben ser alteradas
ni manipuladas. (c) Preservación. - Salvaguardar las imágenes, videos o audios
captados por las cámaras de videovigilancia que presenten indicios razonables
de comisión de un delito o falta. (d) Reserva. - Todo funcionario o servidor público
que conozca de imágenes, videos o audios captados por las cámaras de
videovigilancia está obligado a mantener reserva de su contenido. (p.26)
1.1.3. Bases Teóricas de la dimensión Modelo de Comportamiento

El primer modelo que describe Ahmad et al. (2013) ayuda a comprender la naturaleza de un
problema de vigilancia identificando las funciones clave necesarias para darle solución a un
problema dado.
Por otro lado, Ko (2011) sostiene que existe una necesidad en crecimiento de las
aplicaciones de vigilancia hacia el análisis del comportamiento humano e identificación de sujetos
con la finalidad de detectar posibles amenazas.
Según Folgado (2012) el comportamiento de un humano “en una escena es claramente

dinámico, ya que sus acciones dependen tanto de estímulos exteriores como de su historia
anterior, lo que hace necesario utilizar modelos dinámicos para su descripción computacional.”
(p.37).

Entonces, los autores mencionados anteriormente coinciden en que este proceso se

desarrolla en un entorno o escena dada, y que trata de comprender el comportamiento de
cualquier objeto dentro de un entorno dado mediante el análisis.
En esa línea, Ahmad et al. (2013) plantea algunas soluciones para este modelo como
detección, posicionamiento, identificación y seguimiento:
Detección
Ahmad et al. (2013) manifiesta que esta función define un evento como la intrusión de un objeto
en un área de vigilancia, por lo que, para lograr una seguridad efectiva, es de suma importancia
tratar de detectar dichos eventos para poder notificar al sistema.
Detección
Sin detección
Cobertura parcial
Cobertura total
Figura n.° 41. Jerarquía del indicador Detección.

fuente: (Elaboración propia, 2020)
Asimismo, Ahmad et al. (2013) revela que existen dos tipos de detección que se deben
considerar al medir esta solución: detección basada en cobertura total y detección basada en
cobertura parcial. Este último necesita que el posicionamiento de los nodos asegure la detección
de los objetos con relación a un modelo de movimiento específico de los objetos. (figura n.° 41)
Posicionamiento
A diferencia de la función anterior, Ahmad et al. (2013) manifiesta que esta función calcula la
posición de un objeto intruso en el área de vigilancia. Siendo la latitud, longitud y altitud los
parámetros con que se describe la posición del objeto. La función de posicionamiento puede
dividirse en dos tipos: mapeado y basado en triangulación. El de tipo mapeado utiliza una
referencia con respecto a algún punto o superficie plana. A su vez, el posicionamiento basado
en triangulación utiliza la técnica del mismo nombre, que consiste en la superposición de al
menos dos cámaras. La superposición puede ser de dos tipos: fija o dinámica. La primera de
estas se obtiene con cámaras estáticas mientras que la segunda con cámaras PTZ. (figura n.°
42)

Posicionamiento
Sin
posicionamiento
Mapeado
Superposición fija
Triangulación
Superposición
dinámica
Figura n.° 42. Jerarquía del indicador Posicionamiento.

Identificación
Esta función reconoce el objeto intruso identificando su forma, tamaño y la distancia del objeto
con respecto al nodo de monitoreo. Para lo cual procede a identificar una clase de objetos o a
un individuo específico en una clase (figura n.° 43). Dicho de otra manera, si existe la necesidad
de detectar cualquier ser humano, entonces se aplica la identificación basada en la clase. En
cambio, si es necesario identificar a un ser humano específico dentro de un grupo de humanos,
entonces estará basada en el individuo. (Ahmad et al., 2013)
El autor comenta también que para lograr un resultado satisfactorio es necesario emplear
un modelo estadístico al momento de identificar un objeto consiguiendo una alta probabilidad de
identificación.
Identificación
Sin identificación
Individual
Clase
Figura n.° 43. Jerarquía del indicador Identificación.

Rastreo
Ahmad et al. (2013) para la función de rastreo, manifiesta que monitorea el desplazamiento de
un objeto en la zona de vigilancia, esto dependiendo de la cobertura suministrada por las

cámaras. El autor también identifica dos tipos de rastreo: uno basado en cobertura total y otro en
cobertura parcial (figura n.° 44).
Sin rastreo
Rastreo
Cobertura total
Cobertura parcial
Figura n.° 44. Jerarquía del indicador Rastreo.

El primero engloba conjunta e individualmente los puntos en la superficie de vigilancia

empleando la resolución mínima requerida. Al contrario, la segunda no cubre los puntos en su
totalidad o no cumple con la resolución mínima requerida para el reconocimiento preciso de
objetos. A su vez existen varios problemas que aparecen cuando no aplica una cobertura total;
tales como cuando no se colocan las cámaras correctamente o la calidad de imagen es deficiente
debido al enfoque de la óptica de la cámara. Entonces si se cumplen algunos de estos casos la
cobertura es parcial.
En cuanto al empleo de la cobertura parcial, es adecuado indicar que su aplicación puede

responder a la reducción de costos de implementación de una red. De manera que, existen
coberturas comprendidas en esta función: basada en anillo y basada en islas como se muestra
en la figura n.° 45.

Figura n.° 45. Diseño de anillo y modelo de cobertura de islas.

fuente: (Ahmad, O’Nils y Lawal, 2013, p.8)
Como su propio nombre lo dice, el primer tipo de cobertura forma un anillo alrededor del
área de vigilancia empleado para la detección, posicionamiento e identificación de objetos. Con
esto el área interna puede rastrear un objeto más no identificarlo, haciendo que la tarea de
supervisión se divida en dos partes: identificación (anillo) y seguimiento (área interna).
Lo que se refiere a la cobertura basada en islas consiste en un área que contiene

pequeñas islas dispersas, proporcionando cobertura total en dichas islas, mientras que en las
áreas que no lo son, la cobertura es limitada o nula. Por lo general, para este sistema se emplea
algún tipo de modelo estadístico en la detección de objetos.
Manejo de contenido
Los datos de video recopilados en el área de vigilancia son manejados por esta función. Los
sistemas CCTV es un ejemplo común de este tipo. A su vez algunas aplicaciones recopilan estos
datos y los muestran en un terminal de video donde personas puedan monitorearlos. Existen
también los que adicionalmente a esta función, almacenan los datos de video para su uso
posterior (figura n.° 46). (Ahmad et al., 2013)

Manejo de Contenido
Sin manejo de
contenido
Mostrado
Almacenado
Figura n.° 46. Jerarquía del indicador Manejo de Contenido.

1.1.4. Bases Teóricas de la dimensión Modelo de Implementación

En el segundo modelo que describe Ahmad et al. (2013) se implementan componentes como los
sensores de cámara, óptica de acompañamiento y la ubicación de estos componentes en el área
de vigilancia. Este modelo se utiliza para estructurar las decisiones que son necesarias para
implementar las funciones de vigilancia, reconocidas durante el análisis de comportamiento del
problema.
Por otro lado, Aviles y Cobeña (2015) demostraron que la implementación de un sistema
de seguridad compuesto a su vez por un sistema de alarma y otro sistema de Circuito Cerrado
de Televisión (CCTV), conlleva el empleo de cámaras, sensores magnéticos y sensores de
presencia o volumétrico.
Asimismo, Sabri, Salim, Fouad, Aljunid, Al-Dhief y Rashidi (2018) implementaron un

sistema de vigilancia empleando sensores (PIR), el cual es un dispositivo que mide los cambios
en los niveles infrarrojos en su campo de visión y describe un flujo de proceso que se tomará en
cuenta al momento de su ejecución.
En resumen, para Ahmad et al. (2013) el modelo de implementación es un conjunto de

constructos que incluyen el tipo de sensor, el accesorio del nodo y la conectividad del nodo, los
cuales se describen a continuación:
Tipo de sensor
Un sensor es una parte vital de un nodo de monitoreo. Se divide en dos categorías principales:
sensores ópticos y multimodales (figura n.° 47). Un sensor óptico detecta la luz que puede caer
en tres categorías, como la luz visible, la luz infrarroja (IR) o la luz ultravioleta (UV). Asimismo,
un sensor óptico puede ser de color, monocromático, infrarrojo, tiempo de vuelo (time-of-flight),
escáner láser, etc. El tipo de sensor de cámara que será seleccionado para una aplicación
depende de la naturaleza de la aplicación. Los sensores multimodales incluyen sensores que
detectan características físicas distintas de la luz, como sonido, movimiento, presión, etc.

Algunos ejemplos de sensores multimodales incluyen sensores acústicos, de movimiento, de

vibración, sísmicos, de temperatura y de humedad. (Ahmad et al., 2013)
Tipo de Sensor
Óptico
Multimodal
Figura n.° 47. Jerarquía del indicador Tipo de Sensor.

Conectividad de nodo
Ahmad et al. (2013), con respecto a los nodos desplegados para una aplicación de vigilancia,
pueden funcionar como nodos aislados o nodos conectados. Los nodos aislados no tienen
colaboración con los nodos vecinos y no pueden formar una red. Los nodos conectados
colaboran y coordinan con los nodos vecinos formando una red. Una red puede ser de dos tipos,
homogénea o heterogénea. En una red homogénea, todos los nodos de monitoreo utilizan el
mismo tipo de sensores y la óptica de acompañamiento. En una red heterogénea, los nodos de
monitoreo usan diferentes tipos de sensores o la óptica de acompañamiento (figura n.° 48).
Conectividad de Nodo
Aislado
Homogéneo
Conectado
Heterogéneo
Figura n.° 48. Jerarquía del indicador Conectividad de Nodo.

Algunos nodos pueden usar sensores ópticos mientras que otros pueden usar sensores
no ópticos. Incluso en el caso de utilizar solo sensores ópticos, el nodo puede formar redes
heterogéneas debido al uso de diferentes tipos de sensores de imágenes. Si los nodos usan el

mismo tipo de sensores de imagen, la red puede ser heterogénea debido al diferente tipo de
óptica utilizada con estos sensores de imagen. (Ahmad et al., 2013)
Fijación de nodo (Node-fixture)
Ahmad et al. (2013) también se refiere a la posibilidad de cambio de posición de un nodo de

monitoreo. Asimismo, existen dos dispositivos de nodo en los que se incluyen dispositivos fijos y
móviles. Como su mismo nombre lo dice, un nodo fijo no puede cambiar su posición una vez
desplegado. Por el contrario, un nodo móvil es movible y puede cambiar su posición. Para este
fin deberá estar equipado con algún tipo de plataforma móvil, como un robot. Un nodo móvil es
más adecuado para la vigilancia de interiores de edificios grandes y complejos.
Dentro de cada tipo de fijación, existen otras dos categorías disponibles en los que se
incluyen nodos estáticos y dinámicos. Estas categorías definen la actividad de un nodo en
términos de cambio en el campo de visión después de la instalación de los nodos. Un nodo
estático tiene un campo de visión fijo. No obstante, un nodo dinámico puede cambiar su campo
de visión tanto horizontal como verticalmente con respecto al espacio después de su despliegue
y además puede cambiar su propiedad de zoom. Un ejemplo se este tipo de nodo se implementa
con cámaras PTZ. (figura n.° 49)
Fijación de Nodo
Estático
Fijo
Dinámico
Estático
Móvil
Dinámico
Figura n.° 49. Jerarquía del indicador Fijación de Nodo.

En conclusión, este modelo se hará valer de elementos que le permitan desplegar

correctamente los dispositivos elegidos y cumplan las funciones definidas en el modelo de
comportamiento.
1.1.5. Bases Teóricas de la dimensión Modelo de Actuación

Este modelo se refiere a la implementación de medidas de precaución cuando un sistema de
vigilancia detecta alguna situación anormal. Por ejemplo, en el caso del sistema DT Bird, el
módulo de disuasión emite señales de advertencia y disuasión a las aves que vuelan en la zona
de alto riesgo de colisión. Otro ejemplo es la generación de señal de parada a una turbina eólica

desde el módulo de control del sistema DT Bird en caso de riesgo de colisión. (Ahmad et al.,
2013)
En ese sentido, Sabri et al. (2018) definen un diagrama de flujo (figura n.° 50) para
mostrar las acciones que realizará cuando se detecte movimiento en la zona de vigilancia, estas
acciones comprenden un sistema de inicialización y configuración, un sistema principal de
activación de monitoreo, otro módulo de actuadores, y la parte que realiza el procesamiento y
comunicación (figura n.° 51).
Figura n.° 50. Diagrama de flujo del sistema de detección de intrusos.

fuente: (Sabri et al., 2018, p.5)
Figura n.° 51. Captura continua de imágenes.

fuente: (Sabri et al., 2018, p.5)
Finalmente, este modelo contempla las acciones a realizar frente a la detección de algún
hecho fuera de lo normal en el área de vigilancia, para tal fin se apoyará en actuadores y
procederá con la captura continua de imágenes.

1.2. Antecedentes
1.2.1. Antecedentes internacionales
1.2.1.1. Variable: Sistema web basado en visión artificial y geolocalización
El artículo científico titulado “Automatic recognition of facial expression based on computer vision”
de Shaoping, Z. (2015). Siendo un paper perteneciente al Department of Information
Management Hunan University of Finance and Economics de Changsha, China. Abarcando un
campo de investigación de la visión artificial ya que tiene como objetivo el reconocimiento de
expresiones faciales en una secuencia de video. Se propone dos fases acerca de las expresiones
faciales (extracción de características y reconocimiento de expresiones faciales). En primer lugar,
se hace uso de Active Appearance Model (AAM) para extraer características de textura global y
técnicas de flujo óptico para caracterizar las expresiones faciales que determina la información
de velocidad facial. Luego, estas dos características son integradas y convertidas a palabras
visuales usando modelos “bag-of-words”, y las expresiones faciales son representadas por un
número de palabras visuales. En segundo lugar, el modelo Latent Dirichlet Allocation (LDA) es
utilizado para clasificar diferentes expresiones faciales tales como “enfado”, “disgusto”, “miedo”,
“felicidad”, “neutralidad”, “tristeza” y “sorpresa”. Los resultados experimentales mostraron que el
método propuesto no solo brindaba estabilidad y robustez, sino que mejora la proporción de
reconocimiento eficientemente, pero también necesita la menor dimensión cuando logra la mayor
proporción de reconocimiento, lo que demuestra que el método propuesto es superior a otros.
Finalmente, llegó a la conclusión de que el reconocimiento de expresiones faciales puede darnos
avances significativos en cuanto a seguridad pública, seguridad financiera, predicción “drug-
activity”, recuperación de imágenes, detección de rostros, etc. Los modelos AAM y de flujo óptico
fueron muy trascendentales a la hora de extraer características de las expresiones faciales, para
luego convertirlas en palabras visuales mediante el modelo “bag-of-words”. El modelo LDA
reconoce diferentes categorías de expresiones faciales y a su vez aumentaba la exactitud
mediante la información de las etiquetas. Los resultados experimentales revelan que el método
propuesto mejora significantemente la exactitud y desempeño mejor que otros realizados
anteriormente. Este antecedente me permitió conocer el alcance del estudio de la visión artificial
aplicado al reconocimiento de expresiones faciales utilizando distintos modelos para la obtención
de una mejor exactitud en sus resultados.
El trabajo de investigación titulado “Diseño e implementación de un sistema para detección de

vehículos robados en movimiento, empleando tecnología Beaglebone, por medio de software
libre” de Garzón, R. y Pacheco, J. (2016). El cual es una tesis para la obtención de Bachiller en
la Universidad de las Fuerzas Armadas de Latacunga, Ecuador. Esta comprende el desarrollo
de un sistema de identificación de vehículos robados en movimiento localizados en la calle
Quijano Ordoñez en la ciudad de Latacunga, para lo cual se analiza el desempeño de la Tarjeta
Beaglebone Black RevC. Adicionalmente, se empleó el sistema operativo Linux apoyado en el
lenguaje de programación Python. La aplicación se centra en el reconocimiento de placas
vehiculares en tiempo real usando una cámara web para la captura de las imágenes y una tarjeta
como unidad de procesamiento; como complemento se aplica un algoritmo que permita realizar

la tarea de identificación y extracción de caracteres pertenecientes a las placas de rodaje, las

cuales posteriormente serán comparadas con una base de datos que ayudará a descubrir el
porcentaje de similitud; para luego mostrar un mensaje de alerta. En síntesis, se halló que el uso
del sistema operativo Debian resultó ser muy eficiente al momento de manejar la Tarjeta
Beaglebone Black, ya que lo caracteriza la ligereza y compatibilidad. Esto ayudó a que el
algoritmo de detección sea más eficiente; sin embargo, en una situación de mayor afluencia de
vehículos pueda disminuir su rendimiento. En concordancia con esto, el consumo de memoria
por parte de la aplicación en la tarjeta ocasionaba la saturación rápida, lo que ocasionaba pérdida
de información y retraso. Por eso concluye que el tiempo necesario para el procesamiento de
imágenes depende exclusivamente de la resolución empleada; por lo que una de 480x864
pixeles sería la más idónea permitiéndonos trabajar a 8fps. De modo que, el motivo de considerar
este antecedente se acopla a la idea de detectar placas vehiculares pertenecientes a este
proyecto de investigación, considerando técnicas de extracción de caracteres y procesamiento
de imágenes en tiempo real.
El trabajo de investigación titulado “Prototype Robot for Computer Vision and Control Systems
Applications” de Masetti, A. (2017). El cual es un paper redactado en el marco del XX Concurso
de Trabajos Estudiantiles en la Universidad Nacional de Rosario, Argentina. Este documento
comprende el diseño y desarrollo de un robot como prototipo útil para la investigación académica
en las áreas de Visión por Computadora y Dinámica de Sistemas de Control. Este robot está
compuesto por tres ruedas, dos de ellas se pueden controlar de forma independiente y la tercera
se usa para estabilizar. El robot también incluye una cámara web provista de control de giro e
inclinación, a su vez puede operar en modo independiente o puede controlarse de forma remota.
Se presentaron algunas aplicaciones ya implementadas en el robot. Finalmente, se consideró
este trabajo de investigación oportunamente ya que en el proceso de construcción del robot se
emplearon algoritmos relacionadas a la dimensión de implementación de la variable dependiente
entre los que están el reconocimiento facial, seguimiento e identificación.
El trabajo de investigación titulado “Vehicle classification and speed estimation using Computer
Vision techniques” de Yabo, A.; Arroyo, S.; Safar F. y Oliva, D. (2016). El cual es un paper
redactado en el marco del XXV Congreso Argentino de Control Automático de la Universidad
Nacional de Quilmes, Argentina. El cual implementa un sistema de clasificación y estimación de
velocidad de vehículos en tiempo real, para aplicar a los vídeos adquiridos de las cámaras de
tráfico instaladas en las carreteras. En este sentido, se realizaron las funciones de: detección de
vehículos en movimiento a través de técnicas de segmentación en segundo plano, comparación
de diferentes clasificadores supervisados (por ejemplo, redes neuronales artificiales) para la
clasificación de vehículos en categorías: (automóvil, motocicleta, camioneta y autobús / camión),
aplicación de un método de calibración para georreferenciar vehículos utilizando imágenes
satelitales y estimación de la velocidad de los vehículos por clase utilizando el seguimiento de
características además de algoritmos de los vecinos más cercanos. Finalmente, dado que el
sistema general se diseñó teniendo en cuenta el costo de tiempo de cada algoritmo, el método
resultante fue capaz de funcionar con una frecuencia de 10 a 15 fps, dependiendo de la

ocupación de la escena, lo que permitió no solo implementaciones offline aplicadas a archivos

de video, sino también análisis online de cámaras IP. En este último caso, el cuello de botella de
velocidad se debió principalmente a la conexión de red. Considerando el motivo de elección de
este antecedente la aplicación de funciones de visión computacional para el monitoreo de
vehículos en carreteras el cual forma parte de la dimensión de comportamiento de la variable
dependiente.
1.2.1.2. Variable: Vigilancia
El trabajo de investigación titulado “Análisis técnico de la implementación de un Sistema de
seguridad de video vigilancia, caso de estudio Aeropuerto Internacional Mariscal Sucre del
Ecuador” de Pavón, J. (2016). Puesto que es una tesis para maestría en la Pontificia Universidad
Católica del Ecuador en Quito, Ecuador. Demostrando que este proyecto estudia los sistemas
de seguridad que utilizan video vigilancia con cámaras IP, que brindan seguridad a aeropuertos
para la consolidación de la vigilancia controlada desde un sistema central con el fin de lograr su
eficiencia. Para el caso específico del Aeropuerto Internacional Mariscal Sucre, existen
requerimientos para optimización con el apoyo de nuevas tecnologías; adicionando a esto, de
manera integral los distintos sistemas electrónicos de seguridad existentes. En ese contexto, las
herramientas existentes resultan insuficientes si no se integran con todos los sistemas de
seguridad, es por eso que el uso de GENETEC presenta características de rendimiento y
funcionalidad. Concluyendo que el aeropuerto posee una infraestructura de red que puede ser
escalable al crecimiento a futuras ampliaciones del sistema; además, la distribución de los
ambientes de comunicación es eficiente, permitiendo un alcance mayor de todos los ambientes
del aeropuerto. Posterior al análisis se consideró que se debe crear VLAN’s para los servidores,
CCTV y equipos diversos para cumplir con políticas de QoS. Con la aplicación implementada se
consiguió un mayor grado de transparencia, interfaz intuitiva y amigable, haciendo el monitoreo
mucho más eficiente. El motivo de elección de este antecedente se relaciona con la perspectiva
sobre la vigilancia aplicada a un establecimiento muy complejo, optimizando el sistema utilizado
en el aeropuerto con el fin de integrar los servicios de monitoreo para brindar un mejor servicio
de seguridad a los pasajeros.
El trabajo de investigación titulado “Robust Multi-person Tracking for Real-Time Intelligent Video
Surveillance” de Jin-Woo, Choi; Daesung, Moon y Jang-Hee, Yoo (2015). El cual es un paper
para el ETRI Journal del programa ICT R&D del MSIP, Rep. de Korea. En este paper se propone
un nuevo algoritmo de seguimiento de múltiples objetos en tiempo real, aplicado a la
videovigilancia inteligente. Para lograrlo se utilizó el filtrado de partículas y múltiples técnicas de
detección con la finalidad de disminuir el tiempo de cálculo del algoritmo. Luego de aplicar estas
técnicas se obtuvo un algoritmo robusto capaz de detectar y rastrear objetivos humanos sin
supervisión, además de hacerlo en tiempo real y con una alta tasa de precisión. Por lo tanto, este
paper aporta a la presente investigación dando luces respecto a la detección de hechos delictivos
y accidentes de tránsito indicadores pertenecientes a la variable dependiente, mediante el rastreo
de personas en tiempo real y así tener la capacidad de generar alertas tempranas.

El trabajo de investigación titulado “Design and Implementation of an Embedded Smart Intruder

Surveillance System” de Sabri et al. (2018). El cual es un artículo desarrollado para el journal
MATEC Web Conferences. En este texto se presenta un sistema de vigilancia de intrusos en
tiempo real basado en un computador de placa única (single board computer) SBC. En tanto, el
diseño y desarrollo de este sistema de gestión de vigilancia rentable basado en SBC sea posible
implementar de manera eficiente en ubicaciones remotas y dispersas. Para tales fines, se empleó
la fusión de código en Python integrado con el SBC que se incorporan a cámaras, sensores de
larga distancia, circuitos de alerta y módulo inalámbrico los cuales presentan una solución
novedosa de costo accesible basada en la integración. El sistema demuestra la satisfactoria
integración sin problemas con la aplicación web, rentabilidad y, por lo tanto, puede implementarse
tantas unidades como sea necesaria para capturar y cubrir de manera concisa áreas remotas y
dispersas. Asimismo, puede ser administrado por un usuario remoto geográficamente lejos o
cerca de cualquier estación de trabajo en red. La solución propuesta ofrece un sistema autónomo
eficiente, flexible a actualizaciones y un desarrollo e instalación económicos, así como una
solución de vigilancia rentable. En conclusión, este trabajo obtuvo que los límites aceptables del
sistema para el reconocimiento exitoso de intrusos y la alerta de advertencia se calculan entre 1
m. y 3 m. de distancia del intruso desde la cámara del sistema. Se logra una tasa de
reconocimiento del 95% y el 83% y la alerta de advertencia exitosa estuvo en el rango de 86-
97%. Finalmente, este trabajo de investigación aporta a la definición de los indicadores de la
variable Vigilancia, en tanto este sistema implementa el uso de sensores de tipo óptico y aplica
el modelo de actuación mediante le diseño de un flujo de tareas a realizar en tanto detecten un
intruso en el área de vigilancia.
El trabajo de investigación titulado “Sistema domótico de vigilancia básico para vivienda en la

Ciudad de México, basado en hardware libre como recurso de bajo costo” de Rosete, L. (2016).
Puesto que es una tesis para maestría en la Universidad Nacional Autónoma de México, México.
La cual desarrolló un estudio de mercado acerca de los sistemas de seguridad para viviendas,
evidenciando su alto costo y la importancia de estos recursos para combatir la delincuencia. Es
por esto que se propone una solución de bajo costo como alternativa a los sistemas de vigilancia
comerciales para las viviendas de clase media. Además, se realizó una análisis con respecto a
otros sistemas similares, concluyendo que este proyecto es lo suficientemente robusto y pude
competir con otros más comerciales debido a su bajo costo de implementación. Finalmente, el
motivo de la elección de este antecedente recae en el uso de tecnologías alternativas e
innovadoras para combatir la delincuencia generando un menor costo en las entidades que las
utilizan, en el caso de la presente investigación sería la Municipalidad Distrital de Lince.
1.2.2. Antecedentes nacionales
El trabajo de investigación titulado “Diseño de un algoritmo de estabilización de video orientado
a la detección de personas” de Inafuku, A. (2015), que es una Tesis para lograr el grado de
Bachiller en la Pontificia Universidad Católica del Perú, Lima, Perú. El cual está orientado al
desarrollo de un algoritmo de estabilización de video robusto y eficiente cuando se presentan

diversos factores atenuantes (cambios de escala, rotación e iluminación). Es por esto que la
etapa de preprocesamiento comprende la eliminación o reducción del ruido que se presenta
como consecuencia de movimientos involuntarios. Además, se aborda la problemática y las
aplicaciones en diversos campos de estudio; mencionando los procesos posteriores que
necesitan de la estabilización para obtener mejores resultados. Adicionalmente, se mencionan
alternativas para la solución del problema central, desarrollando las características, ventajas y
desventajas. Existen las soluciones mecánicas y digitales utilizando Registro de Imágenes para
objetos 2D y Structure From Motion incluyendo Geometría Epipolar para objetos 3D.
Posteriormente se explica el algoritmo de estabilización de video por medio de diagramas,
esquemas e imágenes; con el diagrama de flujo de pasa a realizar el pseudocódigo utilizado en
la solución describiendo sus diferentes etapas de desarrollo. Mediante simulaciones se pudo
ejecutar la evaluación de los resultados obtenidos, utilizando videos de una base de datos se
realizaron las pruebas empleando la herramienta Voodoo Tracker de detección y tracking de
puntos. Llegando a concluir que la Geometría Epipolar reduce el costo computacional debido a
que las relaciones geométricas de proyección son almacenadas en una matriz fundamental de
3x3 por lo que no es necesario almacenar información tridimensional. En cuanto al número de
puntos tomados como referencia condiciona la implementación, debido a los ruidos y
movimientos bruscos o cambios en la iluminación ya que con esto se pierde efectividad. Los
resultados obtenidos reflejaron que el algoritmo de estabilización tiene un efecto en la
disminución del error de distancia de las coordenadas, considerando que los parámetros
atenuantes influyeron de nuevo en los resultados. Para contrarrestar el tiempo de procesamiento
se deben utilizar videos con mayor calidad. Por lo tanto, este antecedente me permitió definir el
indicador que hace referencia a la detección de personas mediante el uso de diferentes
herramientas y algoritmos.
El artículo científico titulado “Estudio de un sistema de visión para control de pesos y tamaño de
racimos de uva de mesa” de Basilio, O. (2015). Siendo una tesis para optar por el grado de
Magister en Ingeniería Mecatrónica en la Pontificia Universidad Católica del Perú en Lima, Perú.
El cual tiene como objetivo determinar la viabilidad del uso de redes neuronales y sistemas de
visión para la determinación de peso y tamaño de racimos de uva. Para esto se diseñó un sistema
que permite extraer de manera automatizada el peso de los racimos de uva. Además, se
aplicaron técnicas de visión por computadora. Al finalizar, se obtuvo que el sistema generó una
eficiencia del 95% en la fase de clasificación del tamaño y 70% en la clasificación por peso.
Concluyendo que este tipo de algoritmo de visión es adecuado realizando el entrenamiento
correspondiente. Con esto, el motivo de la elección del antecedente recae en el empleo de la
fase de clasificación de imágenes mediante el proseo de entrenamiento, la cual se utiliza en la
presente investigación.
El artículo científico titulado “Desarrollo de un Sistema de Visión Artificial para realizar una
Clasificación Uniforme de Limones” de Del Castillo, E. (2018). Siendo una tesis para optar por el
título profesional de Ingeniero de Sistemas Computacionales en la Universidad Privada del Norte
en Trujillo, Perú. El cual tiene como objetivo principal la creación de un sistema de visión artificial

que realice una clasificación uniforme de limones. Las formas y dimensiones de los limones a
ser analizados están sujetos al códex de la lima-limón de la Organización de Comida y Agricultura
de las Naciones Unidas. Para esto se diseñó una solución de acuerdo a las fases de la visión
artificial y aplicando los algoritmos correspondientes se obtuvo como resultado de eficacia de
83.9%, sensibilidad de 82.8% y especificidad del 100%, logrando clasificar los limones en 0.33
segundos. Concluyendo que el sistema de visión artificial implementado permite realizar una
clasificación uniforme de limones. Por lo tanto, la consideración de este antecedente responde a
que la implementación de algoritmos de visión artificial de acuerdo con sus fases tiene pertinencia
con la presente investigación ya que trata de aplicarlos a diferentes escenarios empleando la
clasificación vista en el modelo de comportamiento de la variable dependiente.
El artículo científico titulado “Propuesta de un Modelo para el Reconocimiento de escenas

violentas en video” de Ramírez, J. (2017). Siendo una tesis para optar por el título profesional de
Ingeniero de Sistemas en la Universidad Nacional de San Agustín en Arequipa, Perú. El cual
tiene como objetivo proponer un método que realice el reconocimiento de escenas violentas en
video para aplicaciones de videovigilancia en cárceles, centros psiquiátricos o en las calles ya
que muchos de los sistemas de videovigilancia actuales no cuentan con identificación espacial
de eventos violentos. Con este fin se evaluaron más de 100 videos para usar descriptores locales
de reconocimiento. Como resultado de los experimentos usando el descriptor STIP se obtuvo
una tasa de acierto de 90.4% y una segmentación espacial de 74% concluyendo que se
produjeron mejores resultados a comparación de otros métodos. Finalmente, este antecedente
fue elegido por el uso de descriptores de reconocimiento que forman parte de la visión artificial y
el manejo de contenido en video pertenecen a la dimensión de comportamiento de la variable
dependiente.
El trabajo de investigación titulado “Diseño de un Centro de Control y Monitoreo (CCTV) con
Sistema de Radioenlaces para la Seguridad en la Municipalidad de Islay Matarani, Arequipa” de
Salcedo, S (2018). El cual es una tesis para licenciatura en la Universidad Nacional de San
Agustín de Arequipa en la ciudad del mismo nombre, Perú. Asimismo, es un trabajo de
investigación en el que se analizan los problemas de seguridad que tiene el distrito de Islay
Matarani para luego determinar el diseño de un centro de control y monitoreo con cámaras
conectadas vía radioenlaces. Para tal fin, se estableció un diseño que permitió la conectorización
de equipos, evitar la ralentización de imágenes, adecuando el ancho de banda tomando en
cuenta los diferentes tipos de zonas geográficas, sistemas de circuito cerrado y todas sus
características. Finalmente, se lograron cumplir los objetivos definidos empleando radioenlaces,
reduciendo así los recursos indispensables para la implementación final. En tanto al motivo de
considerar este antecedente radica en el uso de los equipos considerados también en la presente
investigación en cuanto al modelo de implementación asociados al tipo de sensor y conectividad
de los nodos considerados para cumplir con el despliegue del diseño planteado por Salcedo.
El trabajo de investigación titulado “La Seguridad Ciudadana en el Perú: Análisis de la seguridad

y su convencionalidad en el Estado de Emergencia del Callao” de Ubillús, J. (2016). El cual es

un trabajo de investigación en el marco del Concurso Anual de Investigación Jurídica: “Carolina

Rosenberg Guttman”. El objetivo de esta investigación fue estudiar el concepto de seguridad, la
seguridad ciudadana en el Perú, estados de excepción y su aplicación en el Estado de
Emergencia en el Callao considerando los estándares internacionales respecto a los derechos
humanos como del Programa de las Naciones Unidas para el Desarrollo (PNUD), la
jurisprudencia de la Corte Interamericana de Derechos Humanos, Tribunales Penales
Internacionales Ad Hoc y legislación nacional para determinar si la ejecución de este periodo de
emergencia fue convencional. En tanto se realizó el análisis respectivo, se llegó a la conclusión
de que el Estado de Emergencia en el Callao presentó una aparente inconvencionalidad debido
al uso de la criminalidad común y organizada para sustentar su aplicación en ese contexto, sin
embargo, la desproporción del plazo de siete meses y su incidencia solo en el crimen común
hace pensar que se pudo haber tomado otras medidas igualmente idóneas para atacar el crimen
organizado. Siendo el motivo por el cual se escogió este antecedente, la contextualización de la
seguridad ciudadana aplicada al caso peruano considerando los distintos enfoques legales
tomados en cuenta en las bases teóricas de la presente investigación y la realidad problemática.
El trabajo de investigación titulado “Evaluación de las Metodologías de Vigilancia Tecnológica

Aplicadas por Expertos Nacionales en el Perú” de Guevara C. (2017). La cual es una tesis para
optar el título de Maestro en Gestión y Política de la Innovación y la Tecnología en la Pontificia
Universidad Católica del Perú en Lima, Perú. Esta investigación tiene como objetivo principal
conocer la situación de la Vigilancia Tecnológica del Perú mediante el apoyo en 19 especialistas
peruanos que cuentan con productos o servicios de vigilancia tecnológica, para lo cual se aplicó
una encuesta de acuerdo a los modelos metodológicos existentes. Posterior a esto se consiguió
dos grupos de resultados, uno enfocado al perfil y experiencia del especialista y el otro abarca
temas metodológicos y a procesos de VT. Asimismo, se advirtió que los especialistas del primer
grupo proceden en su mayoría del campo de la ingeniería, precedido de las ciencias naturales y
sociales. En contraparte, en el segundo grupo existen diversas coincidencias respecto a la
metodología aplicada. Siendo los factores de diferenciación las preferencias por herramientas
poco conocidas y la experiencia en la búsqueda de estos. Por lo tanto, el motivo de elegir este
antecedente recae en el estudio metodológico y multidisciplinario de las metodologías aplicadas
en la vigilancia en el Perú, dando luces respecto al sujeto que se le realiza la encuesta, tomando
en cuenta sus preferencias y experiencia en diversas herramientas del mercado.
El trabajo de investigación titulado “Identificación Automática de Acciones Humanas en

Secuencias de Video para Soporte de Videovigilancia” de Fernández, L. (2017). La cual es una
tesis para optar el grado de magister en la Pontificia Universidad Católica del Perú en Lima, Perú.
El objetivo de esta investigación fue emplear un modelo de detección de acciones humanas y
aplicarlo a secuencias de videovigilancia utilizando redes neuronales profundas, con la finalidad
de poder realizar la tarea de clasificación. Dicho modelo se basó en la extracción de
características convolusionales y temporales utilizando una parte de la red Inception V3 y una
red LSTM, finalmente se aplica el modelo en el dataset UCF101 que contiene acciones humanad
diversas y luego sobre el dataset VIRAT 2.0 Ground con secuencias de videvigilancia. Luego de

aplicar este modelo se concluyó que para el uso de la solución en un sistema de videovigilancia
se debería implementar una técnica de segmentación automática de acciones que permita
recortar automáticamente las múltiples acciones que se puedan identificar en una secuencia de
videovigilancia. En tanto al motivo de elección de este trabajo de investigación, responde a que
abarca las técnicas de vigilancia propuestas por Collins et al. (2000) como la detección y rastreo,
análisis de movimientos humanos, y análisis de actividad; todo esto relacionándolo a la etapa de
segmentación de la visión artificial que describen Vélez et al. (2003).
1.2.3. Antecedentes locales
El trabajo de investigación titulado “Histograma de orientación de gradientes aplicado al
seguimiento múltiple de personas basado en video” de Tolentino A. (2015). La cual es una tesis
para optar por el grado académico de Magíster en Informática con mención en Ciencias de la
Computación en la Pontificia Universidad Católica del Perú en Lima, Perú. En relación con el
contenido de este trabajo de investigación se puede desprender que en cuanto a la visión
computacional es trascendente el seguimiento múltiple de personas en escenas reales, aplicado
a los sistemas de vigilancia, robótica, seguridad peatonal o marketing. Por lo tanto, el objetivo se
centra en exponer una propuesta basada en Histograma de Orientación de Gradientes (HOG)
para el seguimiento múltiple de personas basadas en video. Concluyendo que se buscó combinar
clasificación, seguimiento y asociación, presentándose así una alta tasa de exactitud para la
clasificación de personas sobre imágenes. Por tal motivo se recogió este antecedente ya que
describe la relación entre visión artificial y aplicaciones como la videovigilancia, ambas variables
independientes y dependiente correspondientemente, ratificando la influencia que implica una en
la otra. Además de que el seguimiento de personas ayude a determinar el nivel de calificación
sobre uno de los indicadores de la variable dependiente.
El trabajo de investigación titulado “Diseño e Implementación de un sistema de geolocalización

en interiores para plataforma Android vía la red ENTERPRISE WLAN de la PUCP” de Gáloc J.
(2016). La cual es una tesis para obtener el grado de bachiller en la Pontificia Universidad
Católica del Perú en Lima, Perú. Acerca del trabajo realizado en esta investigación, es
conveniente resaltar que consiste en el desarrollo e implementación de una aplicación en Android
que sea capaz de localizar a los usuarios a través de sus dispositivos móviles en las instalaciones
de la universidad ya mencionada. Con el uso de técnicas de localización y algoritmos
matemáticos de estimación se logró desarrollar el proceso de geolocalización. Concluyendo que
la solución planteada es viable, amparada en los resultados satisfactorios obtenidos con el
estimador ML. A su vez, se detectó que la orientación del dispositivo móvil con respecto al AP
influye en el rendimiento del proceso de geolocalización. Entonces, la elección de este
antecedente responde a que los métodos planteados por el tesista en el proceso de
geolocalización aportan a la evaluación de desempeño de la variable independiente en los
momentos de observación (preprueba y posprueba).
El trabajo de investigación titulado “Prototipo computacional para la detección y clasificación de

expresiones faciales mediante la extracción de patrones binarios locales” de Cama, Y. (2015),

Que es una tesis para lograr el grado de Bachiller en la Pontificia Universidad Católica del Perú,
Lima, Perú. En el que se aborda el uso del descriptor LBP con el fin de describir expresiones
faciales para luego clasificarlas dentro de emociones generales. A su vez, las técnicas de
aprendizaje automático conforman una herramienta verdaderamente funcional que combina
entrenamiento del software y optimización de recursos con el fin de realizar cálculos complejos
en el menor tiempo posible. En cuanto a las expresiones faciales conocidas, existen inexactitudes
delimitadas por el fingimiento de expresiones o la cultura, ya que ambas pueden transmitir
información errónea. Para darle solución a este inconveniente, existen los Sistemas de
Codificación de Acción Facial (FACS) que utilizan unidades de acción (AU) para la identificación
de músculos en el rostro, ya que individual o grupalmente causan cambios en el comportamiento
facial. Las principales emociones reconocidas comprenden enojo, asco, felicidad, tristeza, miedo
y asombro. Para eso se describe los siguientes pasos para la obtención del resultado esperado
(fase de detección, caracterización y clasificación). Las imágenes utilizadas en el experimento
fueron obtenidas de la base de datos Cohn-Kanade, permitiendo que se puedan elegir en su
mayoría para el entrenamiento del modelo y otras para las pruebas. Una de las conclusiones a
la que llegó fue que la primera fase desarrollada en el método de Viola-Jones, contemplaba que
fuera posible brindar una tasa de detección elevada; sin embargo, esta no permitía rotaciones
mayores a 15 grados, entonces es necesario utilizar un método más robusto. En cambio, en la
siguiente fase, el método LBP pudo representar y acentuar satisfactoriamente las líneas
marcadas por las expresiones en los rasgos faciales. En consecuencia, la experimentación lleva
a pensar que debe existir un equilibrio en la gradualidad de las tazas de reconocimiento y
pudiendo ajustar el número de divisiones en la imagen LBP se obtienen variaciones mucho más
relevantes. Este antecedente me permitió recoger uno de los tantos indicadores descritos en esta
investigación, además del uso de algoritmos y métodos que serán utilizados en la práctica del
reconocimiento facial.
El trabajo de investigación titulado “Sistema en tiempo real de detección y seguimiento de objetos

esféricos en videos digitales” de Tafur, J. (2015). El cual es una Tesis para obtener el grado de
Bachiller en la Pontificia Universidad Católica del Perú, Lima, Perú. El cual se sostiene que las
tecnologías orientadas a la interacción humano – computador están en alza debido a la aparición
de modernos dispositivos que hacen la vida más fácil a las personas. Debido a esto, este
proyecto desarrolla un sistema que permite la detección y seguimiento de un objeto esférico en
tiempo real, utilizando una cámara de video se capta los movimientos realizados delante de la
cámara. Inspirado en el Play Station Move, permite el uso de un controlador de movimiento para
seguir a un objeto esférico, dándole realismo y control; sin embargo, este sistema se diferencia
de su objeto de inspiración ya que no presenta acelerómetros en el proceso. Con el fin de brindar
una mejor relación con el usuario, el sistema se desarrolla con precisión y tiempo de
procesamiento; con la ayuda de algoritmos en lenguaje C orientados a las matemáticas permiten
el correcto funcionamiento. Existe una librería llamada ffmpeg, la cual es utilizada en la interfaz
computador – cámara de video la cual es aplicada bajo el sistema operativo Linux; además posee
formatos, códecs, filtros y funciones que proporcionan un trabajo óptimo. El laboratorio DSP

(Digital Signal Processing) de la PUCP proporciona programas que se encargan de recibir la

señal de video proporcionada por la cámara web. Concluyendo que, en cuanto a las pruebas
realizadas a una distancia de 20 cm a 135 cm de profundidad desde la cámara, se puede
asegurar un error de 5 cm máximo con respecto a la esfera en sus 3 dimensiones. Además, en
cuanto a la rapidez se trabaja a 10 cuadros por segundo. El uso correcto de los parámetros como
resolución y color permite implementar los procesos de calibración y seguimiento correctamente;
con esto se pudo ahorrar tiempo y recursos. La obtención de los parámetros de la esfera se
realizó óptimamente mediante la aplicación del algoritmo “least-square-circle-fit”, pudiendo
segmentar a través del color. Finalmente, con la implementación de algoritmos más eficientes se
puede aumentar la velocidad aún más, ya que le proporcionaría un procesamiento optimizado y
eficiente con los recursos. Por lo tanto, el motivo de considerar este antecedente se reduce a la
obtención de mejores técnicas de procesamiento de imágenes para generar resultados exactos
al momento de automatizar el proceso de vigilancia, además de considerar las herramientas
usadas en este proyecto y usarlas en la implementación.
El trabajo de investigación titulado “Desarrollo de una aplicación web para el monitoreo de

vehículos con dispositivos GPS que comercializa una empresa de telecomunicaciones” de
Bocanegra, R (2012). La misma que representa una tesis para optar por el título profesional de
Ingeniero Informático en la Universidad Ricardo Palma en Lima, Perú. Esta tesis desarrolla todo
lo concerniente a la realización de una aplicación encargada de monitorear vehículos mediante
dispositivos GPS, el cual forma parte del servicio que presta una empresa de
telecomunicaciones. Esta solución agrupa las mejores funcionalidades en materia de monitoreo
de vehículos que existe en el mercado, adicionando a eso la navegación en una plataforma web.
Concluyendo que la implementación del producto cumplía con las funcionalidades más
representativas que una solución de monitoreo puede brindar de manera inmediata, ya que
cuenta con 95 clientes y 200 unidades transmitiendo todos los días, siendo la principal
herramienta de monitoreo de muchas de ellas. Considerando lo mencionado anteriormente, se
eligió este antecedente debido a que desarrolla las funcionalidades más representativas del
monitoreo con ayuda de la geolocalización la cual pertenece a la variable independiente de la
presente investigación.
El trabajo de investigación titulado “Propuesta Smart City: para la seguridad ciudadana – cámaras
inteligentes” de Fuentes, P. & Montesinos M. (2017). La cual es una tesis para obtener el grado
académico de Magíster en Administración de Empresas en la Universidad Peruana de Ciencias
Aplicadas en Lima, Perú. El cual describe las acciones y recursos necesarios justificando el
rumbo de un proyecto empresarial, que tiene como finalidad contribuir con el conocimiento para
la transformación de las ciudades en ciudades inteligentes o (Smart Citys). Concluyendo que
este proyecto se considera innovador y de gran expectativa ya que enfrenta a uno de los
problemas más críticos del Perú. Además, refleja que es sumamente rentable debido a que se
puede recuperar la inversión inicial el mismo año. Es entonces importante el enfoque proactivo
con el que se presenta este problema y no de forma reactiva como antes se planteaba. De esta

manera se sustenta el enfoque de investigación explicativo, ya que describe detalladamente la

viabilidad de un proyecto de inversión relacionada a la variable dependiente.
El trabajo de investigación titulado “Propuesta del Sistema de Video Vigilancia en la Seguridad

Ciudadana distrito de Pueblo Libre 2016-2020” de Sierra C. (2017). La cual es una tesis para
optar el título de Maestro en Gestión Púbica en la Universidad César Vallejo en Lima, Perú. El
objetivo de esta investigación fue implementar y articular el sistema de videovigilancia para
solucionar una parte importante del problema de la seguridad ciudadana en el distrito de Pueblo
Libre entre el 2016 y 2020, la que tiene a cargo la Gerencia de Seguridad Ciudadana del
mencionado municipio. Posteriormente, se concluyó que se requiere de seis centrales de control
de videovigilancia descentralizados, además del centro de control principal, la instalación de
sesenta cámaras de videovigilancia, en los lugares recomendados con la coordinación de
Serenazgo Municipal, Policía Nacional del Perú y Juntas Vecinales. Tomando en cuenta lo
mencionado anteriormente, el motivo principal para considerar este antecedente es el análisis
que se realiza para la mejora del sistema de vigilancia utilizado en la lucha contra la inseguridad
del distrito de Pueblo Libre el cual se encuentra ubicado dentro de Lima Metropolitana al igual
que el lugar de aplicación de la presente investigación.
El trabajo de investigación titulado “Aplicación de la plataforma VMS para optimizar la seguridad

electrónica del Centro de Monitoreo de la Universidad Ricardo Palma.” de Gongora, F. y Nolasco,
R. (2019). La cual configura una tesis para optar el título profesional en la Universidad Ricardo
Palma en Lima, Perú. El cual es un trabajo de investigación que tiene como objetivo la
optimización de los sistemas de seguridad electrónica (videovigilancia y control de acceso) para
tal efecto se propone la implementación de una plataforma VMS empleando una red LAN,
aplicando una interfaz versátil y altos estándares de seguridad modernos. Con esta premisa, se
logró elegir los dispositivos adecuados en base a términos económicos y compatibilidad técnica,
asimismo, se determinó el diseño de topología adecuado para la plataforma VMS. En conclusión,
se pudo optimizar adecuadamente la plataforma VMS Security Center del Centro de Monitoreo
de la universidad Ricardo Palma con altos niveles de seguridad física perimetral aplicando
políticas de seguridad. En tanto al motivo de considerar este antecedente, radica en la forma de
abordar la optimización de los procesos de vigilancia con un enfoque en los Centros de Monitoreo
incluidos en la presente investigación con la finalidad de llegar a cierto nivel de automatización
sin descuidar los niveles de seguridad necesarios para este tipo de aplicaciones.
El trabajo de investigación titulado “Planeamiento Estratégico del Sector Seguridad y Vigilancia

de Lima Metropolitana” de Contreras W., Hinostroza E., Madalengoitia J. & Quispesivana B.
(2016). La cual es una tesis para optar el título de Maestro en Administración Estratégica de
Empresas en la Pontificia Universidad Católica del Perú en Lima, Perú. El objetivo de esta
investigación fue poder establecer estrategias alcanzables y medibles con objetivos a largo plazo
hasta el 2025. Con esto se busca desarrollar un modelo de agremiación de la empresa privada
encaminado a mermar los índices de inseguridad de Lima Metropolitana mediante un nuevo
sistema tecnológico integrado de seguridad y vigilancia. Los resultados mostraron que no existe

integración personal y tecnológica con los organismo e instituciones involucradas en la seguridad

de la ciudad, además de la poca presencia en la legislación y normativa vigente. Por lo tanto, la
implementación del planeamiento estratégico traerá mejoras en materia jurídica, tecnológica y
social. Con lo mencionado anteriormente se pasa a detallar el motivo de elección de este trabajo
de investigación, gracias al detallado estudio de la problemática de la inseguridad de la ciudad
de Lima y la posterior elaboración de un plan estratégico que involucra la población de la presente
investigación y pasa a detallar los lineamientos y recomendaciones a seguir si se desea obtener
un mejor funcionamiento del sistema de vigilancia actual.

1.3. Realidad problemática

La videovigilancia ha generado grandes proyectos de investigación en los Estados Unidos,
Europa y Japón, siendo este tema tratado en conferencias y talleres internacionales según
manifiesta Collins, Lipton y Kanade (2000). Todos con el objetivo de mermar los índices y la
percepción de inseguridad globalmente.
Esto se ve reflejado en el Informe Regional de Desarrollo Humano de la PNUD del 2014,

donde se manifiesta el marcado aumento de la percepción de inseguridad en la ciudadanía
debido al incremento de delitos patrimoniales, independientemente de la violencia letal que
aqueja a algunos países.
Según una encuesta realizada por IPSOS (2016), en seis países de Latinoamérica, una
de cada cuatro personas es víctima de algún delito cada año, siendo el Perú, un país con mayor
índice delictivo de esta naturaleza; donde el 33% ha sido blanco de un delito en el último año,
seguido de México con 28%. Esto refleja la sensación de inseguridad tan arraigada en la región.
Figura n.° 52. Principales víctimas de actos de delincuencia en Latinoamérica

Fuente: IPSOS, 2016
Por otra parte, INEI (2020) en sus constantes boletines acerca de la situación peruana,
podemos observar en áreas urbanas desde agosto del 2018 un sostenido incremento y
predominancia de hechos delictivos en las ciudades de 20 mil a más habitantes, de los cuales el
robo de dinero, cartera o celular se destaca como el delito más concurrente. Asimismo, la
percepción de inseguridad puede llegar a más del 85% en las ciudades urbanas.
Masgo Ferreyra Divad Jair pág. 70

Figura n.° 53. Población del área urbana víctima de algún hecho delictivo agosto 2018 a enero
2020
Fuente: INEI, 2020
Esto refleja la urgente necesidad de terminar con este tipo de crímenes en esta parte de
la capital. Siendo la Policía Nacional y la Seguridad Municipal los llamados a velar por la
seguridad de los ciudadanos, los cuales no cumplen en la práctica un papel de autoridad en estos
sectores. Existen medidas por parte del Ministerio de Interior como el Programa de Recompensas
orientado a casos de criminalidad establecido mediante el Decreto Legislativo N°1180, publicado
el 27 de julio del 2015. La cual consiste en la difusión de información perteneciente a los
delincuentes más buscados y ofrecer una recompensa a cambio de información acerca de ellos.
De modo que existen múltiples empresas que brindan seguridad; sin embargo, estos
esfuerzos resultan inoperantes frente al uso de armas por parte de los delincuentes estando
impedidos de alertar a las autoridades acerca del acontecimiento. A su vez algunos distritos
cuentan con redes de vigilancia con cámaras de seguridad, ubicadas en las principales vías de
la ciudad que cumplen un papel importante al momento de identificar a los delincuentes, placas
de autos y servir como medio probatorio. Sin embargo, si este sistema no se encuentra integrado
con las diferentes comisarías de la zona, no es posible tomar acciones preventivas frente a un
acontecimiento delictivo en desarrollo y frustrarlo.
Según INEI (2018), en el distrito de Lince la cantidad de denuncias por comisión de

delitos incrementó en los últimos años, como se muestra en la figura n.° 54. Siendo el 2018 el
pico más alto de esta estadística.

Figura n.° 54. Cantidad de denuncias por comisión de delitos

Fuente: INEI, 2018
En ese contexto, en el año 2013 se formuló el Plan Local de Seguridad Ciudadana

aprobado por medio del Decreto Supremo N°012-2013-IN para un periodo de 5 años, en el cual
se señala la ponderación de la Seguridad Ciudadana como una de las demandas principales de
la población en los últimos veinte años y además definida como un fenómeno social complejo,
multidimensional y multicausal. Asimismo, la Gerencia de Seguridad Ciudadana de Lince (2020),
manifiesta que en cuanto a la cobertura que ofrecen las fuerzas del orden, existe un déficit en la
proporción de serenos y policías para la cantidad de población de Lince pues como se puede
apreciar en la tabla n.° 6, en promedio 01 policía cubre a 575.9 habitantes, mientras que 01
sereno cubre a 357.59 habitantes, considerando a ambos grupos se tiene que cubren a 220.6
habitantes, lo que difiere del estándar internacional recomendado por el Programa de las
Naciones Unidas para el Desarrollo [PNUD] que habla de los países con índices bajos de
delincuencia cuya proporción debe ser de 4 policías por cada 1000 habitantes (1/250) y los
países con altos índices de delincuencia le corresponde 8 policías por cada 1000 habitantes
(1/125). Cabe precisar que los serenos no cuentan con las mismas facultades que un policía y
que están sujetos a la colaboración de los efectivos para concretar la atención del incidente, por
lo que un agente policial siempre apoya en el patrullaje dentro del vehículo de serenazgo.
Tabla n.° 6.
Número total de efectivos policiales y serenos por habitante
Población Policías Serenos Policía / Sereno / Policía –

Lince (2017) habitantes habitantes Sereno /
Habitante
54 711 95 153 575.9 357.59 220.6
Fuente: Comisaría PNP Lince y Gerencia de Seguridad Ciudadana-MDL, 2017

En consecuencia, una opción integral y efectiva sería el reemplazo o la complementación
de la vigilancia humana por la de una máquina, la cual estaría sujeto de una inteligencia artificial
encargada de controlar las alertas que reciba la central de emergencias apoyado en la
infraestructura que posee el distrito (cámaras, puestos de vigilancia, centros de monitoreo y
drones). Todo esto se puede hacer posible gracias a la Visión Artificial que según Vélez, Moreno,
Sánchez y Sánchez-Marín (2003), constan de técnicas de análisis de información extraídas de

imágenes empleando algoritmos, adicional a esto, la Geolocalización nos permite monitorear la

ubicación en tiempo real de múltiples dispositivos y vehículos. La conjunción de estas dos
herramientas muy potentes nos puede llevar a la automatización de la vigilancia con el fin de
disminuir la dependencia de estos sistemas del ojo humano.
1.4. Formulación del problema
1.4.1. Problema General
- ¿De qué manera influye la implementación de un sistema web basado en visión
artificial y geolocalización en la vigilancia de las zonas del distrito de Lince, 2020?
1.4.2. Problemas Específicos
artificial y geolocalización en el modelo de comportamiento en la vigilancia de las
zonas del distrito de Lince, 2020?

artificial y geolocalización en el modelo de actuación en la vigilancia de las zonas del
distrito de Lince, 2020?
1.5. Objetivos
1.5.1. Objetivo general
- Determinar la influencia de la implementación de un sistema web basado en visión
artificial y geolocalización en la vigilancia de las zonas del distrito de Lince, 2020.
1.5.2. Objetivos específicos
artificial y geolocalización en el modelo de comportamiento en la vigilancia de las
zonas del distrito de Lince, 2020.

distrito de Lince, 2020.
1.6. Hipótesis
1.6.1. Hipótesis general
- La implementación de un sistema web basado en visión artificial y geolocalización
influye positivamente en la vigilancia de las zonas del distrito de Lince, 2020.
1.6.2. Hipótesis específicas
influye positivamente en el modelo de comportamiento en la vigilancia de las zonas
del distrito de Lince, 2020.

influye positivamente en el modelo de actuación en la vigilancia de las zonas del

CAPÍTULO II. METODOLOGÍA
2.1. Tipo de investigación

La presente investigación tiene un enfoque cuantitativo, asociada a una de tipo aplicada, además
de ser explicativo alcanzando el tercer nivel de investigaciones científicas junto con las
predictivas según Caballero (2014), con un diseño experimental de tipo preexperimental
conformado por un solo grupo, al que se le aplica el diseño preprueba/posprueba.
En concordancia con lo que se detalla en el párrafo anterior, procedemos a explicar los

términos expresados, entre los cuales está el enfoque cuantitativo donde Caballero (2014),
sostiene que predomina la recolección de datos para probar la hipótesis, utilizando cantidades y
el manejo estadístico matemático en el análisis de los diferentes indicadores para establecer
patrones de comportamiento y probar la teoría principal de esta investigación.
Asimismo, el tipo de esta investigación es aplicada, ya que el objeto de esta es una parte
de la realidad concreta que se da en el tiempo y ocupa espacio. Además, tiene como objetivo
práctico, elaborar y aplicar propuestas prácticas para solucionar los problemas específicos de la
presente investigación o que se pueda investigar soluciones de uso inmediato (Caballero, 2014).
Al mismo tiempo, el presente estudio es explicativo, basado en lo que sostienen

Caballero, 2014; Hernández, Fernández y Baptista, 2010 sugiriendo que implica la cuestión de
la realidad, buscando las causas de la problemática principal, para luego poder explicar
determinado fenómeno de la realidad mediante el uso del análisis y la síntesis. Con esto se busca
establecer proposiciones coherentes sobre el objeto de estudio.
Con un diseño experimental de tipo preexperimental, que según Hernández, Fernández

y Baptista (2014), permite hacer un primer acercamiento al problema de investigación en la
realidad y consiste en aplicar una prueba previa al estímulo o tratamiento experimental, para
después administrar el tratamiento y finalmente aplicar una prueba posterior. Adicionalmente,
este diseño muestra una superioridad sobre el de una sola medición ya que existe una referencia
para saber en qué nivel se encontraba el grupo respecto a las variables dependientes, lo que
evidencia que existe un seguimiento al grupo.
Tabla n.° 7.
Diseño de un solo grupo con preprueba y posprueba
Grupo de Estudio Preprueba Tratamiento Posprueba
G O1 X O2
Fuente: Elaboración propia, 2020

2.2. Población y muestra

Población
Según el Centro de Promoción Educativa de la Universidad Nacional de Trujillo ([CEPEUNT],

1974), la población o universo la conforma un “grupo de personas, seres vivos, objetos, casos,
situaciones, etc. sobre los cuales el investigador está interesado en investigar para comprobar
una hipótesis planteada al respecto de ellos” (p.27). Además de poseer alguna o muchas
características, propiedades o atributos, los cuales necesariamente tienen que ser definidos en
el tiempo y espacio para puedan ser de naturaleza indiscutible.
Con relación a lo detallado anteriormente, la población en la presente investigación la

conforman las nueve zonas vecinales existentes en el distrito de Lince en el año 2020 como se
aprecia en la en la figura n.° 55.
Figura n.° 55. Zonas del distrito de Lince

Fuente: (GOB.PE, 2019)
Muestra
Albert (2007) se refiere a la muestra como una “pequeña porción representativa y adecuada del
universo o población que es definida por el investigador con el objetivo de medir con un criterio
de significatividad y veracidad las variables que se pretende estudiar” (p.24). Esto implica que
dicho grupo tiene que tener representatividad debido a que los resultados necesitan
generalizarse o extrapolarse a la población elegida, en tal sentido se desprende que debe ser
concretado mediante un proceso de muestreo (Albert, 2007).
Tipo de muestreo
Muestreo no probabilístico o dirigido se refiere a “un subgrupo de la población en la que la

elección de los elementos no depende de la probabilidad, sino de las características de la
investigación” (Hernández et al., 2014, p.176).

En concordancia a lo expresado anteriormente, otros autores (Battaglia, 2008;

Hernández et al., 2013; Johnson, 2014) citados por Hernández et al. (2014), indicaron que, en
estos casos de muestreo “…la elección no depende de la probabilidad, sino de causas
relacionadas con las características de la investigación o propósitos del investigador.” (p.176).
Además, Hernández et al. (2014) sostienen lo siguiente sobre las investigaciones con
enfoque cuantitativo:
La ventaja de una muestra no probabilística —desde la visión cuantitativa— es su
utilidad para determinados diseños de estudio que requieren no tanto una
“representatividad” de elementos de una población, sino una cuidadosa y controlada
elección de casos con ciertas características especificadas previamente en el
planteamiento del problema. (p.190)
Con relación a lo detallado previamente, el tipo de muestreo de esta investigación es no

probabilístico o dirigido, ya que se aplicará el estudio a la totalidad de la población.
Tamaño de muestra
Posteriormente, con la población definida se procede a hallar la muestra, que para este caso se
considerará una muestra censal, lo que significa que el estudio se aplicará a toda la población
conformada por las nueve zonas vecinales del distrito de Lince en el año 2020, que forman parte
del grupo de estudio identificado en el diseño de esta investigación.
2.3. Técnicas, instrumentos y procedimientos de recolección de datos

Técnica
“Proceso de la investigación por el que se aprende una determinada realidad para conocer sus
características, definir un problema o evaluar situaciones…puede convertirse en un
procedimiento propio del método utilizado en la comprobación de la hipótesis” (Álvarez y Sierra,
2001 citado por UPN, 2016). Se empleará la observación como técnica de recolección de datos
y el uso del cuestionario aplicado al coordinador de la Central de Monitoreo del distrito,
establecimiento encargado del registro de incidencias, monitoreo de cámaras y vehículos, y
atención al vecino en casos de alertas.
Instrumento de medición
Según UPN (2014), “en el caso de investigaciones descriptivas o explicativas se refieren a los
formatos para registrar o analizar los datos” (p.16). Estos instrumentos deben estar
estandarizados o validados científicamente, en caso no sea así deben estar descritos. Esto
quiere decir que, si el autor es el investigador, es necesario indicarlo y detallar la base teórica
que se empleó para su elaboración (UPN, 2014).

Como instrumento de recopilación de la información se utilizó el cuestionario, compuesto

de una lista de preguntas con respuesta múltiple, el cual fue aplicado al coordinador de la Central
de Monitoreo para su posterior llenado en los dos momentos de observación.
Confiabilidad
Para determinar la confiabilidad del instrumento de recolección de datos utilizado, se empleó el

coeficiente estadístico Alfa de Cronbach, a lo cual Hernández et al. (2014), sostienen que: “Todos
utilizan fórmulas que producen coeficientes de fiabilidad que pueden oscilar entre cero y uno,
donde recordemos que un coeficiente de cero significa nula confiabilidad y uno representa un
máximo de fiabilidad” y que el “método de cálculo de estos requiere una sola administración del
instrumento de medición. Su ventaja reside en que no es necesario dividir en dos mitades a los
ítems del instrumento, simplemente se aplica la medición y se calcula el coeficiente” (pp. 294-
295).
Con la finalidad de obtener la confiabilidad del instrumento se elaboró la siguiente fórmula

en Excel.
K   Si 
2
 =  1− 
K −1  S
2

 T
Ecuación n.° 1. Fórmula Coeficiente Alfa de Cronbach
Considerando que Garson (2013) citado por Hernández et al. (2014) establece que si el
valor del coeficiente es 0.60 se considera aceptable para propósitos exploratorios y 0.70 para
fines confirmatorios, resultando “bueno” 0.80 en un alcance explicativo el cual es empleado en
la presente investigación. Entonces, luego de remplazar los valores obtenemos como resultado
el valor de 0.8. De manera que, se concluye que el instrumento es confiable.
Tabla n.° 8.
Cálculo de la confiabilidad
Expresión Valor
K 17.0
S Si2 3.19
ST2 14.19
Alfa de Cronbach 0.82
Ficha técnica
Tabla n.° 9.
Ficha técnica de recolección de datos
Ítem Descripción
Nombre Cuestionario para variable “Vigilancia”
Autor Divad Jair Masgo Ferreyra

Año 2020
Procedencia Lima – Perú
Tipo de Cuestionario
instrumento
Objetivo Recolectar información para determinar la influencia de la
implementación de un sistema web basado en visión artificial y
geolocalización, y su influencia en la vigilancia de las zonas del
distrito de Lince.
Administración Individual
Duración aprox. 10 min.
Aplicación Directa
Estructura El instrumento consta de 17 ítems o preguntas las cuales se
basan en respuestas con 5 opciones.
Validez
Con el objetivo de señalar la validez del instrumento de recolección de datos se procedió a la

aplicación del juicio de expertos, en ese sentido, se consideró los siguientes profesionales:
Tabla n.° 10.

Expertos que validaron el instrumento de recolección de datos
Nombre Profesión Resultado

Ronald Melgarejo Solís Docente Aplicable
Antonio Arqque Pantegozo Docente Aplicable
Frank Edmundo Escobedo Bailón Docente Aplicable
2.4. Métodos, instrumentos y procedimientos de análisis de datos

Se desarrolla basándose en la demostración precisa de una hipótesis. En este tipo de
investigación experimental se ejerce mayor control sobre las variables, teniendo la posibilidad de
manejar la variable independiente para demostrar su influencia en la variable dependiente.
(Caballero, 2000)
Para ello se empleará el diseño de un grupo experimental con preprueba y posprueba,

esto quiere decir que consta de dos mediciones. “La primera denominada preprueba, que se
aplica antes del tratamiento y la segunda, denominada posprueba, aplicada después del
tratamiento” (Sierra, 2003, pp.144-148).
El análisis de datos comprende la categorización, ordenamiento y resumen de datos

buscando responder las preguntas de investigación. Con la finalidad de sintetizar los datos a una
manera que pueda ser entendible e interpretable buscando también que los vínculos entre los
problemas de investigación puedan ser estudiados y probados (Kerlinger, 1957; Albert, 2007).

2.5. Procedimiento
Según Hernández et al. (2014), las fases del proceso del análisis de datos cuantitativos son:
Primero, seleccionar el programa estadístico para el análisis de datos.
Segundo, ejecutar el programa.
Tercero, explorar los datos: analizarlos y visualizarlos por variable del estudio.
Cuarto, se evalúa la confiabilidad y validez del o de los instrumentos escogidos.
Quinto, se lleva a cabo análisis estadístico descriptivo de cada variable del estudio.
Sexto, se realizan análisis estadísticos inferenciales respecto a las hipótesis planteadas.
Séptimo, se efectúan análisis adicionales.
Finalmente, se preparan los resultados para presentarlos.
Los resultados posteriores al desarrollo de la primera recolección de datos (preprueba)

se exportarán en una hoja de cálculo de Excel para el posterior vaciado de datos al programa
estadístico SPSS versión 22.0, para ello se utilizará la estadística descriptiva, finalmente se
representarán en gráficos estadísticos. Posteriormente, luego de la aplicación del estímulo, para
la posprueba se realizan nuevamente los pasos enumerados anteriormente.
En cada caso mencionado anteriormente se estudian los valores totales de cada

pregunta, dimensión y variable. Apoyándose en el método del cálculo del Baremo de siete
niveles.
2.6. Aspectos éticos

En cuanto a los aspectos éticos de la presente investigación, se considera lo estipulado por el
Decreto Legislativo n.° 822, Ley sobre el Derecho de Autor, los cuales se materializan en el estilo
de redacción empleado en este trabajo de investigación. (Congreso de la República del Perú,
1996)

CAPÍTULO III. RESULTADOS

3.1. Prueba de normalidad
Teniendo en cuenta los resultados obtenidos en los dos momentos de estudio (preprueba y
posprueba), se procedió a realizar las pruebas de normalidad.
Tabla n.° 11.

Resumen de procesamiento de casos
POSPRUEBA Casos
VAR Válido Perdidos Total
VIGILANCIA N Porcentaje N Porcentaje N Porcentaje
PREPRUEBA Moderadamente
1 100,0% 0 0,0% 1 100,0%
VAR alto
VIGILANCIA Alto 6 100,0% 0 0,0% 6 100,0%
Muy alto 2 100,0% 0 0,0% 2 100,0%
Fuente: Elaboración propia asistida por el software SPSS versión 22
Entonces como se puede apreciar en la tabla n.° 11, se observa el resumen de procesamiento
de casos los cuales serán tomados en cuenta en las pruebas de normalidad. Posteriormente,
para realizar este procedimiento se tuvo en cuenta las siguientes premisas:
K < 30 Shapiro-Wilk
K > 30 Kolmogorov-Smirnov
Para determinar el estadístico a utilizar, se plantean las siguientes hipótesis:
H0: Los datos analizados siguen una distribución normal
H1: Los datos analizados no siguen una distribución normal
Debido a que el tamaño de la muestra es menor a treinta, se utiliza el estadístico Shapiro-Wilk.
Tabla n.° 12.

Pruebas de normalidad
POSPRUEBA VAR Shapiro-Wilk

VIGILANCIA Estadístico gl Sig.
PREPRUEBA VAR Alto
,640 6 ,001
VIGILANCIA
De acuerdo con los valores mostrados en la tabla n.° 12, donde se observa que el nivel de
significancia es 0.001. Debido a que el valor de la significancia es menor o igual al error mínimo
aceptado (0.05), se concluye que los datos analizados tienen una distribución normal y con esto
se acepta la hipótesis nula, dando pie a la utilización del coeficiente de correlación de Spearman
en las pruebas de hipótesis.

3.2. Análisis descriptivo

3.2.1. Análisis descriptivo de la variable Vigilancia preprueba
Tabla n.° 13.

Resultados preprueba de la variable Vigilancia
Porcentaje Porcentaje
Valor Frecuencia Porcentaje Valido Acumulado
Muy bajo 1 0 0.00% 0% 0%
Bajo 2 0 0.00% 0% 0%
Moderadamente bajo 3 5 55.56% 56% 56%
Moderado 4 4 44.44% 44% 100%
Moderadamente alto 5 0 0.00% 0% 100%
Alto 6 0 0.00% 0% 100%
Muy alto 7 0 0.00% 0% 100%
Total 9 100.00% 100%
Figura n.° 56. Distribución de frecuencias de la variable Vigilancia preprueba

Fuente: Elaboración propia
En la tabla n.° 13 y figura n.° 56 se observa la distribución de la variable Vigilancia, donde no se

observa resultados en los niveles muy bajo, bajo, moderadamente bajo, alto y muy alto, por lo
tanto, el 56% de los datos corresponden al nivel moderadamente bajo, mientras que el otro 44%
al nivel moderado.

3.2.2. Análisis descriptivo de la dimensión Modelo de Comportamiento

preprueba
Tabla n.° 14.

Resultados preprueba de la dimensión Modelo de Comportamiento
Muy bajo 1 0 0.00% 0% 0%
Bajo 2 0 0.00% 0% 0%
Moderado 4 4 44.44% 44% 100%
Alto 6 0 0.00% 0% 100%
Muy alto 7 0 0.00% 0% 100%
Total 9 100.00% 100%
Figura n.° 57. Distribución de frecuencias de la dimensión Modelo de Comportamiento

preprueba
En la tabla n.° 14 y figura n.° 57 se observa la distribución de la dimensión Modelo de

Comportamiento, donde no se observa resultados en los niveles muy bajo, bajo, moderadamente
alto, alto y muy alto, por lo tanto, el 56% de los datos corresponden al nivel moderadamente bajo,
mientras que el otro 44% al nivel moderado.

3.2.3. Análisis descriptivo de la dimensión Modelo de Actuación preprueba
Tabla n.° 15.

Resultados preprueba de la dimensión Modelo de Actuación
Muy bajo 1 0 0.00% 0% 0%
Bajo 2 0 0.00% 0% 0%
Moderado 4 6 66.67% 67% 100%
Alto 6 0 0.00% 0% 100%
Muy alto 7 0 0.00% 0% 100%
Total 9 100.00% 100%
Figura n.° 58. Distribución de frecuencias de la dimensión Modelo de Actuación preprueba


Implementación, donde no se observa resultados en los niveles muy bajo, bajo, moderadamente
alto, alto y muy alto, por lo tanto, el 33% de los datos corresponden al nivel moderadamente bajo,
mientras que el otro 67% al nivel moderado.

3.2.4. Análisis descriptivo de la variable Vigilancia posprueba
Tabla n.° 16.

Resultados posprueba de la variable Vigilancia
Muy bajo 1 0 0.00% 0% 0%
Bajo 2 0 0.00% 0% 0%
Moderado 4 0 0.00% 0% 0%
Alto 6 6 66.67% 67% 78%
Muy alto 7 2 22.22% 22% 100%
Total 9 100.00% 100%
Figura n.° 59. Distribución de frecuencias de la variable Vigilancia posprueba

En la tabla n.° 16 y figura n.° 59 se observa la distribución de la variable Vigilancia, donde no se

observa resultados en los niveles muy bajo, bajo, moderadamente bajo y moderado, por lo tanto,
el 67% de los datos corresponden al nivel alto, el otro 22% de los datos corresponden al nivel
muy alto, mientras que el otro 11% al nivel moderadamente alto.


posprueba
Tabla n.° 17.

Resultados posprueba de la dimensión Modelo de Comportamiento
Muy bajo 1 0 0.00% 0% 0%
Bajo 2 0 0.00% 0% 0%
Moderado 4 0 0.00% 0% 0%
Alto 6 5 55.56% 56% 78%
Muy alto 7 2 22.22% 22% 100%
Total 9 100.00% 100%
Figura n.° 60. Distribución de frecuencias de la dimensión Modelo de Comportamiento

posprueba

Comportamiento, donde no se observa resultados en los niveles muy bajo, bajo, moderadamente
bajo y moderado, por lo tanto, el 22% de los datos corresponden al nivel moderadamente alto, el
otro 56% de los datos corresponden al nivel alto, mientras que el otro 22% al nivel muy alto.

3.2.6. Análisis descriptivo de la dimensión Modelo de Actuación

posprueba
Tabla n.° 18.

Resultados posprueba de la dimensión Modelo de Actuación
Muy bajo 1 0 0.00% 0% 0%
Bajo 2 0 0.00% 0% 0%
Moderado 4 1 11.11% 11% 11%
Alto 6 3 33.33% 33% 100%
Muy alto 7 0 0.00% 0% 100%
Total 9 100.00% 100%
Figura n.° 61. Distribución de frecuencias de la dimensión Modelo de Actuación posprueba


Implementación, donde no se observa resultados en los niveles muy bajo, bajo y moderadamente
bajo, por lo tanto, el 11% de los datos corresponden al nivel moderado, el 56% de los datos
corresponden al nivel alto, mientras que el otro 11% al nivel muy alto.

3.3. Cruce de variables Preprueba y Posprueba

3.3.1. Análisis descriptivo de la variable Vigilancia preprueba y posprueba
Tabla n.° 19.

Resultados preprueba y posprueba de la variable Vigilancia
POSPRUEBA VAR VIGILANCIA

Muy Moderadam Moder Moderada
bajo Bajo ente bajo ado mente alto Alto Muy alto TOTAL
Muy bajo 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)
PREPRUEBA VAR
Bajo 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)

VIGILANCIA
Mod. bajo 0 (0%) 0 (0%) 0 (0%) 0 (0%) 1 (11%) 4 (44%) 0 (0%) 5 (56%)
Moderado 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 2 (22%) 2 (22%) 4 (44%)
Mod. alto 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)
Alto 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)
Muy alto 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)
TOTAL 0 (0%) 0 (0%) 0 (0%) 0 (0%) 1 (11%) 6 (67%) 2 (22%) 9(100%)
Figura n.° 62. Distribución de porcentaje de la variable Vigilancia preprueba y posprueba

En la tabla n.° 19 y en la figura n.° 62 se observa la distribución de la variable Vigilancia en la
preprueba y posprueba, donde se aprecia que la variación más notable fue que el 44% que
calificó como moderadamente bajo en la preprueba, pasaron al nivel alto en la posprueba.


preprueba y posprueba
Tabla n.° 20.

Resultados preprueba y posprueba de la dimensión Modelo de Comportamiento
POSPRUEBA DIM MODELO DE COMPORTAMIENTO

Muy Moderadam Moder Moderada
bajo Bajo ente bajo ado mente alto Alto Muy alto TOTAL
Muy bajo 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)
COMPORTAMIENTO
PREPRUEBA DIM
Bajo 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)

MODELO DE
Mod. bajo 0 (0%) 0 (0%) 0 (0%) 0 (0%) 2 (22%) 3 (33%) 0 (0%) 5 (56%)
Moderado 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 2 (22%) 2 (22%) 4 (44%)
Mod. alto 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)
Alto 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)
Muy alto 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)
TOTAL 0 (0%) 0 (0%) 0 (0%) 0 (0%) 2 (22%) 5 (56%) 2 (22%) 4(100%)
Figura n.° 63. Distribución de porcentaje de la dimensión Modelo de Comportamiento preprueba

y posprueba
En la tabla n.° 20 y en la figura n.° 63 se observa la distribución de la dimensión Modelo de
Comportamiento en la preprueba y posprueba, donde se aprecia que la variación más notable
fue que el 33% que calificó como moderadamente bajo en la preprueba, pasaron al nivel alto en
la posprueba.

3.3.3. Análisis descriptivo de la dimensión Modelo de Actuación preprueba

y posprueba
Tabla n.° 21.

Resultados preprueba y posprueba de la dimensión Modelo de Actuación
POSPRUEBA DIM MODELO DE ACTUACIÓN

Muy Moderadam Modera Moderada Muy
bajo Bajo ente bajo do mente alto Alto alto TOTAL
Muy bajo 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)
PREPRUEBA DIM
Bajo 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)

MODELO DE
ACTUACIÓN
Mod. bajo 0 (0%) 0 (0%) 0 (0%) 1 (11%) 2 (22%) 0 (0%) 0 (0%) 3 (33%)
Moderado 0 (0%) 0 (0%) 0 (0%) 0 (0%) 3 (33%) 3 (33%) 0 (0%) 6 (67%)
Mod. alto 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)
Alto 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)
Muy alto 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)
TOTAL 0 (0%) 0 (0%) 0 (0%) 1 (11%) 5 (56%) 3 (33%) 0 (0%) 9 (100%)
Figura n.° 64. Distribución de porcentaje de la dimensión Modelo de Actuación preprueba y

posprueba
En la tabla n.° 21 y en la figura n.° 64 se observa la distribución de la dimensión Modelo de
Implementación en la preprueba y posprueba, donde se aprecia que la variación más notable fue
que el 33% que calificó como moderado en la preprueba, pasaron al nivel moderadamente alto
en la posprueba. A su vez, este escenario se repite con otro 33% que calificó como moderado
en la preprueba, pasaron al nivel alto en la posprueba.

3.4. Prueba de hipótesis

Con la finalidad de obtener la hipótesis que será aceptada para esta prueba, Hernández et al.
(2014) dice “lo que el investigador hace por medio de la prueba de hipótesis es determinar si la
hipótesis poblacional es congruente con los datos obtenidos en la muestra” (p.299), para tal
efecto se emplea el nivel de significancia como parámetro de evaluación, el cual se define como
el nivel de la probabilidad de equivocarse fijado por el investigador de manera previa. (Hernández
et al., 2014)
Asimismo, el nivel de significancia determinado para esta investigación es 0.05, el más

común para las ciencias sociales, que implica que se cuenta con un 95% de seguridad para
generalizar sin equivocarse y solo 5% en contra. Para lo cual Babbie (2012) y Mertens (2010)
citado por Hernández (2014) dicen que “Cuando uno lee en un reporte de investigación que los
resultados fueron significativos al nivel de 0.05 (p < 0.05), indica lo que se comentó: que existe
5% de posibilidad de error al aceptar la hipótesis, correlación o valor obtenido al aplicar una
prueba estadística; o 5% de riesgo de que se rechace una hipótesis nula cuando era verdadera”
(p.302)
Por otra parte, la prueba de hipótesis implica un análisis estadístico donde se consideró
el coeficiente de correlación de Spearman, ya que es una medida de correlación para variables
en un nivel de medición ordinal, que se encuentra dentro del tipo no paramétrico. (Hernández et
al., 2014)

3.4.1. Prueba de hipótesis general

Formulación de hipótesis
H0: La implementación de un sistema web basado en visión artificial y geolocalización no influye

positivamente en la vigilancia de las zonas del distrito de Lince, 2020.
H1: La implementación de un sistema web basado en visión artificial y geolocalización influye

positivamente en la vigilancia de las zonas del distrito de Lince, 2020.
Tabla n.° 22.

Resultados de la prueba de hipótesis general
PREPRUEBA VAR POSPRUEBA VAR

VIGILANCIA VIGILANCIA
Rho de PREPRUEBA VAR Coeficiente de
1,000 ,621
Spearman VIGILANCIA correlación
Sig. (unilateral) . ,074
N 9 9
POSPRUEBA VAR Coeficiente de
,621 1,000
VIGILANCIA correlación
Sig. (unilateral) ,074 .
N 9 9
En relación a lo observado en la tabla n.° 22, se tiene un nivel de significancia igual a 0.074 el
cual es mayor a 0.05, que se considera como límite para determinar la hipótesis que será
aceptada. Para tales fines, se encuentra que la significancia unilateral es mayor a 0.05, por lo
tanto, se acepta la hipótesis nula (H0) y se rechaza la hipótesis alternativa (H1). Lo que significa
que la implementación de un sistema web basado en visión artificial y geolocalización no influye

positivamente en la vigilancia de las zonas del distrito de Lince en el año 2020.

3.4.2. Prueba de hipótesis de la dimensión Modelo de Comportamiento

positivamente en el modelo de comportamiento en la vigilancia de las zonas del distrito de Lince,
2020.

positivamente en el modelo de comportamiento en la vigilancia de las zonas del distrito de Lince,
2020.
Tabla n.° 23.

Resultados de la prueba de hipótesis de la dimensión Modelo de Comportamiento
PREPRUEBA DIM POSPRUEBA DIM

MODELO DE MODELO DE
COMPORTAMIENTO COMPORTAMIENTO
Rho de PREPRUEBA DIM Coeficiente de
1,000 ,671*
Spearman MODELO DE correlación
COMPORTAMIENTO Sig. (unilateral) . ,048
N 9 9
POSPRUEBA DIM Coeficiente de
,671* 1,000
MODELO DE correlación
COMPORTAMIENTO Sig. (unilateral) ,048 .
N 9 9
*. La correlación es significativa en el nivel 0,05 (bilateral).
En relación a lo observado en la tabla n.° 23, se tiene un nivel de significancia igual a 0.048 el
cual es menor a 0.05, que se considera como límite para determinar la hipótesis que será
aceptada. Para tales fines, se encuentra que la significancia unilateral es menor a 0.05, por lo
tanto, se acepta la hipótesis alternativa (H1) y se rechaza la hipótesis nula (H0). Lo que significa
que la implementación de un sistema web basado en visión artificial y geolocalización influye
positivamente en el modelo de comportamiento en la vigilancia de las zonas del distrito de Lince
en el año 2020. Asimismo, se determinó con la ayuda del coeficiente de correlación de Spearman
que el nivel de influencia de la variable independiente en la dimensión modelo de comportamiento
de la variable dependiente es 67.1%.

3.4.3. Prueba de hipótesis de la dimensión Modelo de Actuación

positivamente en el modelo de actuación en la vigilancia de las zonas del distrito de Lince, 2020.

positivamente en el modelo de actuación en la vigilancia de las zonas del distrito de Lince, 2020.
Tabla n.° 24.

Resultados de la prueba de hipótesis de la dimensión Modelo de Actuación
PREPRUEBA POSPRUEBA DIM

DIM MODELO MODELO DE
DE ACTUACIÓN ACTUACIÓN
Rho de PREPRUEBA DIM Coeficiente de
1,000 ,612
Spearman MODELO DE correlación
ACTUACIÓN Sig. (unilateral) . ,080
N 9 9
POSPRUEBA DIM Coeficiente de
,612 1,000
MODELO DE correlación
ACTUACIÓN Sig. (unilateral) ,080 .
N 9 9
En relación a lo observado en la tabla n.° 24, se tiene un nivel de significancia igual a 0.08 el cual
es mayor a 0.05, que se considera como límite para determinar la hipótesis que será aceptada.
Para tales fines, se encuentra que la significancia unilateral es mayor a 0.05, por lo tanto, se
acepta la hipótesis nula (H0) y se rechaza la hipótesis alternativa (H1). Lo que significa que la
implementación de un sistema web basado en visión artificial y geolocalización no influye
positivamente en el modelo de actuación en la vigilancia de las zonas del distrito de Lince en el
año 2020.

CAPÍTULO IV. DISCUSIÓN Y CONCLUSIONES

4.1. Discusión
Teniendo en cuenta los resultados obtenidos en el presente trabajo de investigación, se observa
en el análisis descriptivo de la variable Vigilancia, utilizando la tabla de contingencia que la
variación más notable consiste en el cruce del nivel moderadamente bajo y alto en la preprueba
y posprueba según corresponda, lo conforman el 44% del total de la muestra; en la contrastación
de hipótesis, según se refleja en la tabla n.° 22, se observa que el nivel de significancia
equivalente a 0.074 es mayor a 0.05, determinándose de esta manera que no existe influencia
positiva de la variable independiente en la dependiente. Estos resultados concuerdan con lo
expresado por Ahmad et al. (2013, pp.1 y 25) donde afirma que el diseño de sistemas de
vigilancia depende de una serie de campos multidisciplinarios cuyos ejemplos comunes incluyen
el desarrollo de sensores, procesamiento de imágenes, procesamiento de señales, redes,
comunicación, visión por computadora; además sostiene que las disciplinas más importantes que
son vitales para cualquier sistema de vigilancia son el procesamiento de imágenes y señales los
cuales no se aplicaron en su totalidad en base a la taxonomía propuesta por el autor. A diferencia
de lo sostenido anteriormente, Tolentino (2015, p. 40) indica que sus resultados experimentales
demuestran la validez del modelo de visión artificial propuesto, que consta de una estructura
compuesta por clasificación, seguimiento y asociación permitiendo que la misma pueda
convertirse en una herramienta de soporte a decisiones de negocio dentro del campo de
marketing, particularmente en la determinación de patrones de comportamiento de los clientes
basados en sus recorridos por establecimientos como centros comerciales o tiendas por
departamentos; los cuales conforman aplicaciones de la vigilancia pero que no considera todo el
modelo propuesto por Ahmad et al. (2013). En este mismo marco de resultados se encuentra
que Peláez (2013, p. 154) logró demostrar que el diseño de un sistema de video vigilancia IP
mejora la seguridad de los activos de la Corte Superior de Justicia de La Libertad, reduciendo
costos, tiempo de respuesta, pérdida de activos e incrementando el nivel de aprobación de los

encargados del control de activos. Por lo tanto, podemos decir que las limitaciones de esta
investigación estuvieron dispuestas en función del alcance del proyecto, ya que la solución
propuesta no contempló el modelo taxonómico completo, debido a que dependían de la
adquisición de equipos y contratación de servicios en cuanto al análisis de video en tiempo real,
distribución de nodos y su respectiva conectividad. Esto se podría compensar en un proyecto
con un plan de acción que tenga un alcance mucho mayor y que contemple no solo el desarrollo
de un sistema web, sino también la adquisición y despliegue de equipos y servicios necesarios
para tal fin.

A partir de los resultados obtenidos en el presente trabajo de investigación, se observa
en el análisis descriptivo de la dimensión Modelo de Comportamiento, utilizando la tabla de
contingencia que la variación más notable consiste en el cruce del nivel moderadamente bajo y
alto en la preprueba y posprueba según corresponda, lo conforman el 33% del total de la muestra;
en la contrastación de hipótesis, según se refleja en la tabla n.° 23, se observa que el nivel de
significancia equivalente a 0.048 es menor a 0.05 determinándose de esta forma que existe
influencia positiva de la variable independiente en la dependiente; asimismo, se determinó con
la ayuda del coeficiente de correlación de Spearman que el nivel de influencia de la
implementación de un sistema web basado en visión artificial y geolocalización en el modelo de

comportamiento en la vigilancia de las zonas del distrito de Lince en el año 2020 es 67.1%. Estos
resultados concuerdan con Salcedo (2018, p.109), que realizó con éxito un diseño considerando
la distancia de la cámara y objeto además de la distancia del radioenlace para la comunicación,

también tuvo en cuenta la capacidad de almacenamiento, la disponibilidad de las imágenes, la
elección de equipos considerando la conectividad; cumpliendo parcialmente con el modelo
taxonómico de Ahmad et al. (2013) en base a detección, posicionamiento y manejo de contenido.
Asimismo, el presente estudio confirma lo expresado también por Ahmad et al. (2013, p.1) donde
encontró que los resultados del análisis de los sistemas de vigilancia basados en la taxonomía
desarrollada muestran que la mayoría de estos sistemas proporcionan funciones de detección y
posicionamiento, pero un número limitado de ellos proporcionan funciones de identificación y
seguimiento; por otro lado, la función de detección es de tipo distribuido mientras que la función
de identificación está basada en clases; además se determinó que gran parte de los sistemas de
vigilancia no implementan la función de manejo de contenido. En este mismo marco de
resultados se encuentra que Fuentes y Montesinos (2017, p.75) concluyen que uno de los
principales factores del proyecto Smart City: para la seguridad ciudadana – cámaras inteligentes
es ser los primeros en implementar la solución de reconocimiento facial y tratar el problema de
manera proactiva en lugar de reactiva. Cabe destacar que en la presente investigación se
cumplieron las funciones de posicionamiento mediante geolocalización, identificación por clases,
detección y manejo de contenido; sin embargo, la función de rastreo no se consideró debido a
que depende de la cobertura suministrada por las cámaras en la zona de vigilancia, lo que no
era posible por la existencia de zonas ciegas en el distrito, que será posible en un futuro
dependiendo de la instalación de nuevos nodos de vigilancia, considerando no solo las zonas
riesgo en cuanto a la incidencia de delitos.

Apoyándose en los resultados obtenidos en el presente trabajo de investigación, se
observa en el análisis descriptivo de la dimensión Modelo de Actuación, utilizando la tabla de
contingencia que la variación más notable consiste en el cruce del nivel moderado y
moderadamente alto en la preprueba y posprueba según corresponda, lo conforman el 33% del
total de la muestra, a su vez este escenario se repite en el cruce del nivel moderado y alto; en la
contrastación de hipótesis, según se muestra en la tabla n.° 24, se observa que el nivel de
significancia equivalente a 0.08 es mayor a 0.05 determinándose de esta manera que no existe
influencia positiva de la variable independiente en la dependiente. Estos resultados no
concuerdan con Peláez (2013, p. 154) con respecto a la mejora del tiempo de respuesta ya que
la consulta en tiempo real con el sistema actual es de 27.26 segundos, en comparación al sistema
propuesto por Peláez que es de 3.42 segundos, determinando una disminución del tiempo de
23.84 segundos; lo cual permitió una reducción del 87.45% de las consultas de acceso remoto;
por otro lado los resultados que encuentra Gonzales y Johnson (2013, p.76) mediante un análisis
comparativo entre los modelos del proceso de atención en comisarías de otros lugares del
mundo, pudo observar que no existe una solución que resuelva completamente el problema
planteado en cuanto a la atención de los ciudadanos; sin embargo, pudo gestionar eficientemente
las actividades en cuanto a la atención al ciudadano y se implementó una herramienta móvil de
registro para el usuario. Asimismo, el presente estudio confirma lo expresado por Ahmad et al.
(2013, p. 22) donde encuentra que, en cuanto al modelo de actuación, la mayoría de los sistemas
están proporcionando funciones de actuación para manejar situaciones injustas para
implementar la acción deseada en respuesta a un evento en el área de vigilancia. Se puede

destacar que en la presente investigación se pudo implementar algunas acciones en respuesta
a un evento dentro del área de vigilancia, sin embargo, siempre dependen de que tan cerca
estaba un agente de la escena, esto se compensaría mediante la instalación de puestos de
vigilancia mejor distribuidos y con agentes disponibles para atender cualquier situación, además
se debe el evaluar el uso y difusión del aplicativo móvil “Lince Alerta” que ya existía de cara al
ciudadano.

4.2. Conclusiones
Primero Considerando que el valor de la significancia observado en la tabla n.° 22 es 0.074,
en este caso, por ser mayor a 0.05 no se acepta la hipótesis de investigación y se
concluye que no existe influencia positiva del sistema web basado en visión artificial
y geolocalización en la vigilancia de las zonas del distrito de Lince en el año 2020.
Entonces, podemos decir que para mejorar estos resultados se podría desarrollar un
proyecto con un plan de acción que tenga un alcance mucho mayor y que contemple
no solo el desarrollo de un sistema web, sino también la adquisición y despliegue de
equipos considerados en el modelo de implementación, parte del modelo taxonómico
presentado por Ahmad et al. en 2013.
Segundo Considerando que el valor de la significancia observado en la tabla n.° 23 es 0.048,
en este caso, por ser menor a 0.05 se acepta la hipótesis específica de investigación
y se concluye que existe influencia positiva del sistema web basado en visión artificial
y geolocalización en el modelo de comportamiento de las zonas del distrito de Lince
en el año 2020. Asimismo, teniendo en cuenta que el coeficiente de correlación Rho
de Spearman tiene un valor de 0.671, se determina que la variable sistema web
basado en visión artificial y geolocalización influye en un 67.1% de variación sobre la
dimensión modelo de comportamiento.
Tercero Considerando que el valor de la significancia observado en la tabla n.° 24 es 0.08, en
este caso, por ser mayor a 0.05 no se acepta la hipótesis específica de investigación
y se concluye que no existe influencia positiva del sistema web basado en visión
artificial y geolocalización en el modelo de actuación de las zonas del distrito de Lince
en el año 2020. Entonces podemos decir que, para mejorar estos resultados, se
debería trabajar en la instalación de puestos de vigilancia mejor distribuidos y con
agentes disponibles para atender cualquier situación, apoyándose en el uso y difusión
del aplicativo móvil “Lince Alerta”.

REFERENCIAS
Ahmad, N., O’Nils, M., & Lawal, N. (2013). A Taxonomy of Visual Surveillance Systems. Reporte
de Investigación, Mid Sweden University, Department of Electronics Design, Suecia.
Albert Gómez, M. J. (2007). La investigación educativa. España: McGraw-Hill / Interamericana
Editores.
Albusac Jiménez, J. A. (2008). Vigilancia Inteligente: Modelado de Entornos Reales e
Interpretación de Conductas para la Seguridad. España: Universidad Castilla-La
Mancha.
Alegre, E., Barreiro, J., Castejón, M., & Suarez, S. (2008). Computer Vision and Classification
Techniques on the Surface Finish Control in Machining Processes. Universidad de León.
León, España: E.I. Industrial e Informática.
Amazon. (2020). ¿Qué es Amazon Rekognition? Obtenido de
https://docs.aws.amazon.com/es_es/rekognition/latest/dg/what-is.html
Aviles Salazar, A. D., & Cobeña Mite, K. L. (2015). Diseño e implementación de un sistema de
seguridad a través de cámaras, sensores y alarma, monitorizado y controlado
telemétricamente para el centro de acogida “patio mi pana” perteneciente a la fundación
Proyecto Salesiano. Universidad Politécnica Salesiana, FACULTAD DE INGENIERÍAS,
Guayaquil, Ecuador. Obtenido de https://dspace.ups.edu.ec/handle/123456789/10401
Basilio, O. (2015). Estudio de un sistema de visión para control de pesos y tamaño de racimos
de uva de mesa. Tesis de Maestría, Pontificia Universidad Católica del Perú, Escuela de
Posgrado, Lima, Perú.
Beltrán López, G. (14 de Julio de 2015). La Geolocalización Social. Revista de Geografía, 27,
97-118.
Berrios, Y. (2012). Sistema de videovigilancia utilizando cámaras web como alternativa para
mejorar el nivel de percepción de seguridad de la ciudad de Bagua Grande. Tesis de
Bachiller, Universidad Católica Santo Toribio de Mogrovejo, Facultad de Ingeniería,
Chiclayo, Perú.
Bocanegra, R. (2012). Desarrollo de una aplicación web para el monitoreo de vehículos con
dispositivos GPS que comercializa una empresa de telecomunicaciones. Tesis de
Licenciatura, Universidad Ricardo Palma, Facultad de Ciencias e Ingeniería, Lima, Perú.
Caballero Romero, A. (2000). Metodología de la Investigación Científica. Diseños con Hipótesis
Explicativas. Lima: Udegraf.
Caballero Romero, A. (2014). Metodología Integral Innovadora para planes y tesis. México D.F.:
Cengage Learning Editores.
Caivano, R., & Villoria, L. (2009). Aplicaciones web 2.0. Mexico: Eduvim.
Cama, Y. (2015). Prototipo computacional para la detección y clasificación de expresiones
faciales mediante la extracción de patrones binarios locales. Tesis de Bachiller, Pontificia
Universidad Católica del Perú, Facultad de Ciencias e Ingeniería, Lima, Perú.
Cea D'Ancona, Á. (2004). Métodos de encuesta; Teoría y práctica; Errores y mejora. Madrid,
España: Editorial Síntesis.
Centro de Promoción Educativa de la Universidad Nacional de Trujillo (CEPEUNT). (1974).
Seminario Taller de Metodología de la Investigación Científica. Trujillo: Centro de
Promoción Educativa de la Universidad Nacional de Trujillo.
Collins, R., Lipton, A., & Kanade, T. (2000). Introduction to the Special Section on Video
Surveillance. IEEE: Transactions on Pattern Analysis and Machine Intelligence.
Congreso de la República del Perú. (27 de Julio de 2015). Art. 4: "Procedimiento". D. Leg. N 1182
Decreto Legislativo que regula el uso de los datos derivados de las Telecomunicaciones
para la identificación, localización y geolocalización de equipos de comunicación, en la
lucha contra la delincuencia y el crimen organizado. Obtenido de Normas Legales El
Peruano.
Congreso de la República del Perú. (24 de Setiembre de 2015). Art. 8: "Uso de cámaras de
videovigilancia en vehículos de servicio de transporte público de pasajeros". D. Leg. N
1218. Decreto Legislativo que regula el uso de las cámaras de videovigilancia. Obtenido
de Normas Legales El Peruano.

Congreso de la República del Perú. (18 de Diciembre de 2016). TÍTULO I: "Competencias,

Funciones Y Atribuciones". D. Leg. N 1267 Ley de la Policía Nacional del Perú. Perú: El
Peruano.
Contreras, W., Hinostroza, E., Madalengoitia, J., & Quispesivana, B. (2016). Planeamiento
Estratégico del Sector Seguridad y Vigilancia de Lima Metropolitana. Tesis de Maestría,
Pontificia Universidad Católica del Perú, Escuela de Posgrado, Lima, Perú.
Data Centric. (3 de Marzo de 2018). Cómo distinguir entre geolocalización y georeferenciación.
Obtenido de GeoMarketing: https://www.datacentric.es/blog/geomarketing/diferencia-
entre-geolocalizacion-y-georeferenciacion/
Del Castillo, E. (2018). Desarrollo de un Sistema de Visión Artificial para realizar una Clasificación
Uniforme de Limones. Tesis de Licenciatura, Universidad Privada del Norte, Facultad de
Ingeniería, Trujillo, Perú.
Fernández Martínez, L. C. (2017). IDENTIFICACIÓN AUTOMÁTICA DE ACCIONES HUMANAS
EN SECUENCIAS DE VIDEO PARA SOPORTE DE VIDEOVIGILANCIA. PONTIFICIA
UNIVERSIDAD CATÓLICA DEL PERÚ, ESCUELA DE POSGRADO, Lima, Perú.
Folgado Zúñiga, E. (2012). MODELO DE HUMANOS PARA EL ESTUDIO DEL
COMPORTAMIENTO HUMANO EN TAREAS DE SEGURIDAD Y VIGILANCIA.
Universidad Nacional de Educación a Distancia, Departamento de Inteligencia Artificial.
Madrid, España: Escuela Técnica Superior de Ingeniería Informática.
Foresti, G. L., Mahonen, P., & Regazzoni, C. S. (2000). Multimedia Video-Based Surveillance
Systems: Requirements, Issues and Solutions. Massachusetts, USA: Kluwe Academic
Publishers.
Fuentes, P., & Montesinos, M. (2017). Propuesta Smart City: para la seguridad ciudadana –
cámaras inteligentes. Tesis de Maestría, Universidad Peruana de Ciencias Aplicadas,
Escuela de Posgrado, Lima, Perú.
Gáloc, J. (2016). Diseño e Implementación de un sistema de geolocalización en interiores para
plataforma Android vía la red ENTERPRISE WLAN de la PUCP. Tesis de Bachiller,
Pontificia Universidad Católica del Perú, Facultad de CIencias e Ingeniería, Perú.
García, E. M. (2012). Visión Artificial. España: Fundación para la Universitat Orbeta de Cataluya.
Garzón, R., & Pacheco, J. (2016). Diseño e implementación de un sistema para detección de
vehículos robados en movimiento, empleando tecnología Beaglebone, por medio de
software libre. Tesis de Bachiller, Universidad de las Fuerzas Armadas, Departamento
de Eléctrica y Electrónica, Lacatunga, Ecuador.
Gil Jiménez, D. P. (2009). Estudio, diseño y optimización de técnicas de visión artificial para su
aplicación a los sistemas de videovigilancia. Alcalá: Universidad de Alcalá.
Gil Malca, G., & Alva Díaz, D. (1995). Metodología de la Investigación Científica. Trujillo, Perú:
Instituto para el desarrollo, democracia y paz.
Gongora Zalazar, F. A., & Nolasco Arias, R. M. (2019). APLICACIÓN DE LA PLATAFORMA VMS
PARA OPTIMIZAR LA SEGURIDAD ELECTRÓNICA DEL CENTRO DE MONITOREO
DE LA UNIVERSIDAD RICARDO PALMA, 2019. UNIVERSIDAD RICARDO PALMA,
FACULTAD DE INGENIERÍA, Lima, Perú.
Gonzales, T., & Johnson, P. (2013). Análisis, Diseño e Implementación de un Sistema Web y
móvil para el soporte informático a la Gestión de los Servicios de Atención que brindan
las Comisarías a la comunidad. Tesis de Licenciatura, Pontificia Universidad Católica del
Perú, Facultad de CIencias e Ingeniería, Lima, Perú.
Google. (2017). API de Geolocation. Obtenido de Google Cloud Platform:
https://cloud.google.com/maps-platform/?hl=es-419
Google. (2017). Documentación de Cloud Vision. Obtenido de
https://cloud.google.com/vision?hl=es
Grandez, Y. (2018). Aplicativo web para la visualización de resultados clínicos. Revisión de la
Literatura. Universidad Privada del Norte, Facultad de Ingeniería, Lima, Perú. Obtenido
de http://hdl.handle.net/11537/22417
Guerra, F. (2013). Diseño de un Sistema de Control Domótico y Video Vigilancia Supervisado
por un teléfono móvil. Tesis de Licenciatura, Pontificia Universidad Católica del Perú,
Facultad de Ciencias e Ingeniería, Lima, Perú.

Guevara, C. (2017). Evaluación de las Metodologías de Vigilancia Tecnológica Aplicadas por

Expertos Nacionales en el Perú. Tesis de Maestría, Pontificia Universidad Católica del
Perú, Escuela de Posgrado, Perú.
Hannah, M. J. (1974). Computer Matching of Areas in Stereo Images. Tesis de Ph. D.,
Universidad de Stanford.
Hernández Sampieri, R., Fernández Colado, C., & Baptista Lucio, P. (2010). Metodología de la
Investigación (Quinta ed.). Chile: McGraw-Hill / Interamericana Editores.
Hernández, R., Fernández, C., & Baptista, M. (2014). Metodologia de la Investigación (Sexta ed.).
Mexico D.F.: Interamericana Editores.
Hsieh, Y. C., McKeown, D., & Perlant, F. P. (1992). Performance evaluation of scene registration
and stereo matching for cartographic feature extraction. IEEE Transactions on Pattern
Analysis and Machine Intelligence.
Idárraga, E. (2016). Estado Del Arte Sobre Aplicaciones Web Y Móviles Para La Enseñanza De
La Historia Del Arte En Colombia. Universidad Pedagógica Nacional, Facultad de Ciencia
y Tecnología, Bogotá, Colombia. Obtenido de
http://repository.pedagogica.edu.co/bitstream/handle/20.500.12209/174/TO-
19562.pdf?sequence=1&isAllowed=y
Inafuku, A. (2015). Diseño de un algoritmo de estabilización de video orientado a la detección de
personas. Tesis de Bachiller, Pontificia Universidad Católica del Perú, Facultad de
Ciencias e Ingeniería, Lima, Perú.
Instituto Nacional de Estadísitica e Informática. (Julio de 2017). Estadísticas de Seguridad
Ciudadana. Obtenido de Informe Técnico N 4:
www.inei.gob.pe/media/MenuRecursivo/boletines/03-informe-tecnico-n03_estadisticas-
seguridad-ciudadana-nov2016-abr2017.pdf
Instituto Nacional de Estadística e Informática. (2012). Glosario de Términos. Obtenido de I
Censo Nacional de Comisarías 2012. Resultados Definitivos:
https://www.inei.gob.pe/media/MenuRecursivo/censos/cenacomResultadosDefinitivos/g
losario.pdf
Ipsos. (2016). Encuesta sobre Seguridad en Latinoamérica. Obtenido de
https://www.ipsos.com/es-pe/encuesta-sobre-seguridad-en-latinoamerica
Jayakody, D. (11 de Marzo de 2017). AWS, Google and Microsoft Vision API Comparison.
Obtenido de ZAIZI: https://zaizi.com/aws-google-and-microsoft-vision-api-comparison
Jin-Woo, C., Daesung, M., & Jang-Hee, Y. (2015). Robust Multi-person Tracking for Real-Time
Intelligent Video Surveillance. Paper, ICT R&D del MSIP, ETRI Journal, República de
Korea.
Kerlinger, F. N. (1975). Investigación del Comportamiento: Técnicas y Metodología. México D.F.:
Nueva Editorial Interamericana.
Ko, T. (2011). A Survey on Behavior Analysis in Video Surveillance Applications. USA: Raytheon
Company.
Loaiza Quintana, A. F., Manzano Herrera, D. A., & Múnera Salazar, L. E. (2012). Sistema de
visión artificial para conteo de objetos en movimiento. El Hombre y la Máquina(40), 87-
101. Recuperado el 20 de Enero de 2020, de
https://www.redalyc.org/articulo.oa?id=47826850010
Luján Mora, S. (2002). Programación de Aplicaciones Web: Historia, Principios básicos y Clientes
web. Alicante, España: Editorial Club Universitario.
Mapbox. (2020). Maps. Obtenido de Mapbox: https://www.mapbox.com/maps/
Masetti, A. (2017). Prototype Robot for Computer Vision and Control Systems Applications.
Paper, Universidad Nacional de Rosario, XX Concurso de Trabajos Estudiantiles,
Argentina.
Microsoft. (2017). ¿Qué es Computer Vision? Obtenido de https://docs.microsoft.com/es-
es/azure/cognitive-services/computer-vision/overview
Microsoft. (2020). Frecuently Ansered Questions - Bing Maps. Obtenido de Bing Maps:
https://www.microsoft.com/en-us/maps/faq
Ministerio de Economía y Finanzas (MEF). (2015). Guía informativa del Programa Presupuestal
0030 “Reducción de los delitos y faltas que afectan la seguridad ciudadana” Dirigida a

gobiernos locales. Perú: Fortalecimiento del Sistema Nacional Presupuestario en los tres
niveles de gobierno.
Ministerio del Interior - MININTER. (2013). Plan Nacional de Seguridad Ciudadana. Acuerdo
Nacional por la Seguridad Ciudadana. Perú: Consejo Nacional de Seguridad Ciudadana
- CONASEC. Obtenido de http://www.pcm.gob.pe/seguridadciudadana/wp-
content/uploads/2013/05/Plan.Nacional.Seguridad.Ciudadana.2013-2018.pdf
Molina Rios, J. R., Zea Ordoñez, M. P., Contento Segarra, M. J., & García Zerda, F. G. (2017).
ESTADO DEL ARTE: METODOLOGÍAS DE DESARROLLO EN APLICACIONES WEB.
3C Tecnología, 6, 54-71. doi:http://dx.doi.org/10.17993/3ctecno.2016.v6n3e23.54-71
Oficina de Seguridad del Internauta de España. (20 de Setiembre de 2016). Geolocalización
virtudes y riesgos. Obtenido de Blog:
https://www.osi.es/es/actualidad/blog/2016/09/20/geolocalizacion-virtudes-y-riesgos
Pavón, J. (2016). Análisis técnico de la implementación de un Sistema de seguridad de video
vigilancia, caso de estudio Aeropuerto Internacional Mariscal Sucre del Ecuador. Tesis
de Maestría, Pontificia Universidad Católica del Ecuador, Facultad de Ingeniería, Quito,
Ecuador.
Peláez, J. (2013). Diseño de un Sistema de Video Vigilancia IP para la Corte Superior de Justicia
- La Libertad. Tesis de Licenciatura, Universidad Privada del Norte, Facultad de
Ingeniería, Trujillo, Perú.
Porras, J. (2014). CLASIFICATION SYSTEM BASED ON COMPUTER VISION. Escuela
Profesional de Ingeniería Electrónica Universidad Ricardo Palma.
Programa de las Naciones Unidas para el Desarrollo (PNUD). (2014). Informe Regional de
Desarrollo Humano 2013-2014. Seguiridad Ciudadana con Rostro Humano. Estados
Unidos: Centro Regional de Servicios para América Latina y el Caribe.
Ramírez, J. (2017). Propuesta de un Modelo para el Reconocimiento de escenas violentas en
video. Tesis de Licenciatura, Universidad Nacional de San Agustín, Facultad de
Ingeniería de Producción y Servicio, Arequipa, Perú.
RapidAPI. (2020). The Top 10 Mapping & Maps APIs (for Developers in 2018). Obtenido de
https://rapidapi.com/blog/top-map-apis/#summary-best-mapping-apis
Rodriguez Benito, E. (2010). La Geolocalización, Coordenadas hacia el Éxito. II Congreso
Internacional Comunicación 3.0, 1-12.
Rosete, L. (2016). Sistema domótico de vigilancia básico para vivienda en la Ciudad de México,
basado en hardware libre como recurso de bajo costo. Tesis de Maestría, Universidad
Nacional Autónoma de México, México.
Sabri, N., Salim, M. S., Fouad, S., Aljunid, S. A., AL-Dhief, F. T., & Rashidi, C. B. (2018). Design
and Implementation of an Embedded Smart Intruder Surveillance System. MATEC Web
of Conferences. doi:https://doi.org/10.1051/matecconf/201815006019
Salcedo Del Solar, S. C. (2018). DISEÑO DE UN CENTRO DE CONTROL Y MONITOREO
(CCTV) CON SISTEMA DE RADIOENLACES PARA LA SEGURIDAD EN LA
MUNICIPALIDAD DE ISLAY MATARANI, AREQUIPA 2018. UNIVERSIDAD NACIONAL
DE SAN AGUSTIN DE AREQUIPA, FACULTAD DE INGENIERÍA DE PRODUCCIÓN Y
SERVICIOS. Arequipa, Perú: ESCUELA PROFESIONAL DE INGENIERÍA
ELECTRÓNICA.
Seisdedor, G. (2015). Smart Cities: Transformación digital de las ciudades. Centro de Innovación
del Sector Público de PwC e IE Business School.
Shaoping, Z. (2015). Automatic recognition of facial expression based on computer vision. Paper,
University of Finance and Economics, Department of Information Management Hunan,
Changsha, China.
Sierra Bravo, R. (2003). Técnicas de investigación social; Teoría y ejercicios (Cuarta ed.). Madrid:
Internacional Thomson Editores.
Sierra, C. (2017). Propuesta del Sistema de Video Vigilancia en la Seguridad Ciudadana distrito
de Pueblo Libre 2016-2020. Tesis de Maestría, Universidad César Vallejo, Escuela de
Posgrado, Lima, Perú.
Singh, J., Wheeler, J., Fong, N., & Chaudhary, S. (2019). A Comparison of Public Cloud Computer
Vision Services. OSF.

Szeliski, R. (2010). Computer Vision: Algorithms and Applications. Springer.

Tafur, J. (2015). Sistema en tiempo real de detección y seguimiento de objetos esféricos en
videos digitales. Tesis de Bachiller, Pontificia Universidad Católica del Perú, Facultad de
Ciencias e Ingeniería, Lima, Perú.
Techopedia. (2014 de Enero de 2014). What is Geolocation? - Definition from Techopedia.
Obtenido de https://www.techopedia.com/definition/1935/geolocation
Tolentino, A. (2015). Histograma de orientación de gradientes aplicado al seguimiento múltiple
de personas basado en video. Tesis de Maestría, Pontificia Universidad Católica del
Perú, Escuela de Posgrado, Lima, Perú.
Ubillus Segura, J. L. (2016). La seguridad ciudadana en el Perú: Análisis de la seguridad y su
convencionalidad en el Estado de Emergencia de El Callao. Callao, Perú: Concurso
Anual de Investigación Jurídica “Carolina Rosenberg Guttman”.
Ullman, S. (1979). The interpretation of structure from motion. Proceedings of the Royal Society
of London.
Universidad Privada del Norte. (2014). Glosario de Investigación. Perú: Sistema de GEstión de
la Investigación UPN.
Valera Espina, M. (2005). Intelligent distributed surveillance systems: a review. Paper,
Universidad de Kingston, Facultad de Computación, Sistemas de Información y
Matemáticas, UK.
Valera Espina, M. (2006). An approach for designing a real-time intelligent distributed suveillance
system. Tesis de Ph.D., Universidad de Kingston, Facultad de COmputación, Sistemas
de Información y Matemáticas, UK.
Vélez Serrano, J., Moreno Díaz, A., Sanchez Calle, A., & Sanchez-Marín, J. (2003). Visión por
Computador. Universidad Rey Juan Carlos, Departamento de Informática, Estadística y
Telemática, Móstoles, España.
Yabo, A., Arroyo, S., F, S., & Oliva, D. (2016). Vehicle classification and speed estimation using
Computer Vision techniques. Paper, Universidad Nacional de Quilmes, XXV Congreso
Argentino de Control Automático, Argentina.

ANEXOS

Anexo n.° 1. Matriz de Consistencia
Tabla n.° 25.

Matriz de Consistencia
PLANTEAMIENTO OBJETIVOS HIPOTESIS VARIABLES E MUESTRA DISEÑO INSTRUMENTO ESTADISTICA

DEL PROBLEMA INDICADORES
Pregunta General Objetivo General Hipótesis General Variable 1 Población: Método:
¿De qué manera Determinar la La implementación Variable Las nueve zonas vecinales en los que se Cuantitativo Cuestionario COEFICIENTE DE
influye la influencia de la de un sistema web Independiente: divide el distrito de Lince, 2020. CORRELACION
implementación de implementación de basado en visión Sistema web basado DE SPEARMAN
un sistema web un sistema web artificial y en visión artificial y
basado en visión basado en visión geolocalización geolocalización Muestra: Nivel Investigación:
artificial y artificial y influye - Aprendizaje Teniendo en cuenta la cantidad de la Explicativo
geolocalización en la geolocalización en la positivamente en la automático población, se determina la muestra mediante
vigilancia de las vigilancia de las vigilancia de las la siguiente formula:
zonas del distrito de zonas del distrito de zonas del distrito de - Detección de
Lince, 2020? Lince, 2020. Lince, 2020. objetos
𝑍 2 𝑃𝑄𝑁 Diseño:
- Análisis de video 𝑛0 =
𝐸 2 (𝑁 − 1) + 𝑍 2 𝑃𝑄 Pre - Experimental
- Visión 3D
Donde:
Preguntas Objetivo Hipótesis Variable 2 P (0.5): Valor de la proporción estimado
Específicas Específicos Específicas mediante: revisión bibliográfica, estudio
Variable
piloto. Asumiendo P=0.5. El diseño se diagrama de
1. ¿De qué manera 1. Determinar la 1. La Dependiente:
influye la influencia de la implementación de Vigilancia Z (1.96): Valor normal a un nivel de confianza la siguiente manera:
implementación de implementación de un sistema web dado.
- Modelo de
un sistema web un sistema web basado en visión comportamiento E (0.05): Precisión (error máximo tolerable en
basado en visión basado en visión artificial y G O1 X O2
la estimación del parámetro)
artificial y artificial y geolocalización - Modelo de
implementación Q (0.5): Q=1-P
geolocalización en el geolocalización en el influye
modelo de modelo de positivamente en el - Modelo de N (4): Tamaño de la población.
comportamiento en comportamiento en modelo de actuación Donde:
la vigilancia de las la vigilancia de las comportamiento en 𝐺= Grupo experimental
Reemplazando tenemos:
zonas del distrito de zonas del distrito de la vigilancia de las X = Se le aplica el estímulo
Lince, 2020? Lince, 2020. zonas del distrito de
Lince, 2020. 2 𝑂1 = Observación 1
1.96 𝑥0.5𝑥0.5𝑥9
𝑛0 = = 8.96 (Preprueba)
2. ¿De qué manera 2. Determinar la 0.052 (9− 1) + 1.962 𝑥0.5𝑥0.5
𝑂2 = Observación 2
influye la influencia de la 2. La (Posprueba)
implementación de implementación de implementación de 𝑛0 = 9
un sistema web un sistema web un sistema web
basado en visión basado en visión basado en visión
artificial y artificial y artificial y
geolocalización en el geolocalización en el geolocalización

modelo de actuación modelo de actuación influye

en la vigilancia de en la vigilancia de positivamente en el
las zonas del distrito las zonas del distrito modelo de actuación
de Lince, 2020? de Lince, 2020. en la vigilancia de
las zonas del distrito
de Lince, 2020.

Anexo n.° 2. Matriz de Operacionalización de Variables
Tabla n.° 26.

Matriz de Operacionalización de Variables
VARIABLES DEFINICIÓN CONCEPTUAL DIMENSIONES INDICADORES
Variable Dependiente: Vigilancia Los modernos sistemas de Modelo de Comportamiento Tipo de detección
vigilancia consisten en miles de
cámaras que se despliegan en
un área de vigilancia para Cantidad de sucesos localizados
recopilar datos. Se extrae
información útil de estos datos
para detectar, rastrear y
Grado de identificación
reconocer objetos de interés
para comprender y analizar sus
actividades. (Ahmad, O'Nils y
Lawal, 2013) Cantidad de vehículos rastreados
Grado de usabilidad
Modelo de Actuación Nivel de respuesta ante una alerta
Nivel de disponibilidad del servicio

Anexo n.° 3. Instrumento de Recolección de Datos

CUESTIONARIO PARA VARIABLE “VIGILANCIA”
1. ¿Cuál es el tipo de detección utilizada? 7. ¿Cuántos vehículos de serenazgo son
a. Sin detección monitoreados?
b. Basada en cobertura parcial sin a. Ninguno
modelo de movimiento b. Menos de la mitad
c. Basada en cobertura parcial con c. Mitad
modelo de movimiento d. Más de la mitad
d. Basada en cobertura total sin e. Todos
modelo de movimiento 8. ¿Cuál es la función utilizada en el manejo de
e. Basada en cobertura total con contenido?
modelo de movimiento a. No se almacena ni se muestra
2. ¿Cuál es el nivel de localización de hechos b. Solo almacenamiento
delictivos? c. Solo visualización
a. Nulo (0%) d. Almacenamiento y visualización
b. Bajo (0-25%) posterior
c. Medio (25-50%) e. Almacenamiento y visualización en
d. Alto (50-75%) tiempo real
e. Muy alto (75-100%) 9. ¿Cuál es el grado de efectividad del sistema
3. ¿Cuál es el nivel de localización de de vigilancia actual?
accidentes de tránsito? a. Nulo (0%)
a. Nulo (0%) b. Bajo (0-25%)
b. Bajo (0-25%) c. Medio (25-50%)
c. Medio (25-50%) d. Alto (50-75%)
d. Alto (50-75%) e. Muy alto (75-100%)
e. Muy alto (75-100%) 10. ¿Cuál es el grado de eficiencia del sistema
4. ¿Cuál es el nivel de localización de personas de vigilancia actual?
con requisitorias? a. Nulo (0%)
a. Nulo (0%) b. Bajo (0-25%)
b. Bajo (0-25%) c. Medio (25-50%)
c. Medio (25-50%) d. Alto (50-75%)
d. Alto (50-75%) e. Muy alto (75-100%)
e. Muy alto (75-100%) 11. ¿Cuál es el grado de satisfacción del sistema
5. ¿Cuál es el grado de reconocimiento de de vigilancia actual?
placas vehiculares? a. Nulo (0%)
a. Nulo (0%) b. Bajo (0-25%)
b. Bajo (0-25%) c. Medio (25-50%)
c. Medio (25-50%) d. Alto (50-75%)
d. Alto (50-75%) e. Muy alto (75-100%)
e. Muy alto (75-100%) 12. ¿Cuál es el nivel de respuesta ante una alerta
6. ¿Cuál es el grado de reconocimiento de de un hecho pasado?
rostros? a. Muy bajo (mayor a 7 minutos)
a. Nulo (0%) b. Bajo (menor a 7 minutos)
b. Bajo (0-25%) c. Medio (menor a 5 minutos)
c. Medio (25-50%) d. Alto (menor a 3 minutos)
d. Alto (50-75%) e. Muy alto (menor a 1 minuto)
e. Muy alto (75-100%)

13. ¿Cuál es el nivel de respuesta ante una alerta c. Medio (25-50%)

de un hecho en desarrollo? d. Alto (50-75%)
a. Muy bajo (mayor a 7 minutos) e. Muy alto (75-100%)
b. Bajo (menor a 7 minutos) 16. ¿Cuál es el nivel de disponibilidad del
c. Medio (menor a 5 minutos) servicio de vigilancia en la semana?
d. Alto (menor a 3 minutos) a. Nulo (0%)
e. Muy alto (menor a 1 minuto) b. Bajo (0-25%)
14. ¿Cuál es el nivel de respuesta ante una alerta c. Medio (25-50%)
de un hecho futuro? d. Alto (50-75%)
a. Muy bajo (mayor a 7 minutos) e. Muy alto (75-100%)
b. Bajo (menor a 7 minutos) 17. ¿Cuál es el nivel de disponibilidad del
c. Medio (menor a 5 minutos) servicio de vigilancia en el mes?
d. Alto (menor a 3 minutos) a. Nulo (0%)
e. Muy alto (menor a 1 minuto) b. Bajo (0-25%)
15. ¿Cuál es el nivel de disponibilidad del c. Medio (25-50%)
servicio de vigilancia en el día? d. Alto (50-75%)
a. Nulo (0%) e. Muy alto (75-100%)
b. Bajo (0-25%)

Anexo n.° 4. Confiabilidad del Instrumento de Recolección de Datos
Tabla n.° 27.

Matriz de preguntas e índices
Nro. Descripción Índices
Basada en Basada en Basada en Basada en

cobertura parcial cobertura parcial cobertura total cobertura total con
1 Cuál es el tipo de detección utilizada Sin detección
sin modelo de con modelo de sin modelo de modelo de
movimiento movimiento movimiento movimiento
<75%-100%] Muy
2 Cuál es el nivel de localización de hechos delictivos 0% Nulo <0%-25%] Bajo <25%-50%] Medio <50%-75%] Alto
alto
<75%-100%] Muy
3 Cuál es el nivel de localización de accidentes de tránsito 0% Nulo <0%-25%] Bajo <25%-50%] Medio <50%-75%] Alto
alto
<75%-100%] Muy
4 Cuál es el nivel de localización de personas con requisitorias 0% Nulo <0%-25%] Bajo <25%-50%] Medio <50%-75%] Alto
alto
<75%-100%] Muy
5 Cuál es el grado de reconocimiento de placas vehiculares 0% Nulo <0%-25%] Bajo <25%-50%] Medio <50%-75%] Alto
alto
<75%-100%] Muy
6 Cuál es el grado de reconocimiento de rostros 0% Nulo <0%-25%] Bajo <25%-50%] Medio <50%-75%] Alto
alto
Menos de la
7 Cuántos vehículos de serenazgo son monitoreados Ninguno Mitad Más de la mitad Todos
mitad
Almacenamiento Almacenamiento y
No se almacena ni Solo
8 Cuál es la función utilizada en el manejo del contenido Solo visualización y visualización visualización en
se muestra almacenamiento
posterior tiempo real
<75%-100%] Muy
9 Cuál es el grado de efectividad del sistema de vigilancia actual 0% Nulo <0%-25%] Bajo <25%-50%] Medio <50%-75%] Alto
alto
<75%-100%] Muy
10 Cuál es el grado de eficiencia del sistema de vigilancia actual 0% Nulo <0%-25%] Bajo <25%-50%] Medio <50%-75%] Alto
alto
Cuál es el grado de satisfacción del sistema de vigilancia <75%-100%] Muy
11 0% Nulo <0%-25%] Bajo <25%-50%] Medio <50%-75%] Alto
actual alto
Cuál es el nivel de respuesta ante una alerta de un hecho Mayor a 7 minutos Menor a 7 Menor a 5 minutos Menor a 3 Menor a 1 minuto
12
pasado Muy bajo minutos Bajo Medio minutos Alto Muy alto

Cuál es el nivel de respuesta ante una alerta de un hecho en Mayor a 7 minutos Menor a 7 Menor a 5 minutos Menor a 3 Menor a 1 minuto
13
desarrollo Muy bajo minutos Bajo Medio minutos Alto Muy alto
Cuál es el nivel de respuesta ante una alerta de un hecho Mayor a 7 minutos Menor a 7 Menor a 5 minutos Menor a 3 Menor a 1 minuto
14
futuro Muy bajo minutos Bajo Medio minutos Alto Muy alto
Cuál es el nivel de disponibilidad del servicio de vigilancia en el <75%-100%] Muy
día alto
Cuál es el nivel de disponibilidad del servicio de vigilancia en la <75%-100%] Muy
semana alto
Cuál es el nivel de disponibilidad del servicio de vigilancia en el <75%-100%] Muy
mes alto
Tabla n.° 28.

Base de datos de la prueba piloto
ITEM 10
ITEM 11
ITEM 12
ITEM 13
ITEM 14
ITEM 15
ITEM 16
ITEM 17
ITEM 1
ITEM 2
ITEM 3
ITEM 4
ITEM 5
ITEM 6
ITEM 7
ITEM 8
ITEM 9
SUMA
Índices DE
ITEMS
1 4 3 2 1 1 1 1 3 3 3 3 2 2 1 4 3 4 41
2 3 2 1 1 1 1 2 3 2 2 2 2 2 1 3 2 3 33
3 4 3 2 1 1 1 1 3 3 3 3 2 2 1 4 3 4 41
4 3 2 2 2 1 1 1 2 2 2 2 1 1 2 4 3 3 34
VARP (Varianza
S T2
de la población) 0.25 0.25 0.19 0.19 0.00 0.00 0.19 0.19 0.25 0.25 0.25 0.19 0.19 0.19 0.19 0.19 0.25 14.19
3.19


 i 
2
K S
 =  1−
K −1 
2
ST 
 
Figura n.° 65. Fórmula Coeficiente Alfa de Cronbach
K: Número de ítems K 17.00

PARTE 1 1.06
ST2: Varianza de la suma de los ítems PARTE 2 0.78
2
S Si : Sumatoria de varianza de los ítems COEFICIENTE DE
CRONBACH 0.82
α: Coeficiente de alfa de Cronbach

Anexo n.° 5. Validez del Instrumento de Recolección de Datos








Anexo n.° 6. Base de Datos

Dimensión Modelo de Comportamiento Preprueba
Tabla n.° 29.

Base de datos de la dimensión Modelo de Comportamiento preprueba
SUJETOS PREG01 PREG02 PREG03 PREG04 PREG05 PREG06 PREG07 PREG08 PREG09 PREG10 PREG11 TOTAL B_7
S1 4 3 3 2 2 1 2 4 3 3 3 30 4
S2 2 2 2 1 1 1 2 3 2 2 2 20 3
S3 4 2 2 2 2 1 2 3 3 3 3 27 4
S4 2 3 3 1 1 1 2 4 2 2 2 23 3
S5 2 2 2 1 1 1 2 4 2 2 2 21 3
S6 4 3 3 1 2 1 2 4 3 3 3 29 4
S7 4 2 2 2 2 1 2 3 3 3 3 27 4
S8 2 2 2 2 1 1 2 4 2 2 2 22 3
S9 2 2 2 1 1 1 2 3 2 2 2 20 3

Dimensión Modelo de Actuación Preprueba
Tabla n.° 30.

Base de datos de la dimensión Modelo de Actuación preprueba
SUJETOS PREG12 PREG13 PREG14 PREG15 PREG16 PREG17 TOTAL B_7

S1 2 2 2 4 3 4 17 4
S2 2 2 2 4 3 3 16 4
S3 1 1 1 3 2 4 12 3
S4 1 1 1 4 3 3 13 3
S5 2 2 2 3 2 3 14 4
S6 1 1 1 4 3 4 14 4
S7 2 2 2 3 2 3 14 4
S8 2 2 2 3 2 3 14 4
S9 1 1 1 3 2 3 11 3

Variable Vigilancia Preprueba
Tabla n.° 31.

Base de datos de la variable Vigilancia preprueba
SUJETOS TOTAL B_7

S1 47 4
S2 36 3
S3 39 4
S4 36 3
S5 35 3
S6 43 4
S7 41 4
S8 36 3
S9 31 3

Dimensión Modelo de Comportamiento Posprueba
Tabla n.° 32.

Base de datos de la dimensión Modelo de Comportamiento posprueba
SUJETOS PREG01 PREG02 PREG03 PREG04 PREG05 PREG06 PREG07 PREG08 PREG09 PREG10 PREG11 TOTAL B_7
S1 4 4 4 5 5 4 4 5 5 4 5 49 7
S2 4 3 3 4 3 4 4 5 5 3 3 41 6
S3 4 3 3 5 5 4 4 5 4 4 5 46 6
S4 4 4 4 4 3 4 4 5 5 3 3 43 6
S5 4 3 2 4 3 4 4 5 5 3 3 40 5
S6 4 4 4 4 2 4 4 5 4 4 5 44 6
S7 4 4 4 5 5 4 4 5 5 4 5 49 7
S8 2 3 3 5 5 4 4 5 4 3 5 43 6
S9 2 2 2 4 2 4 4 5 4 3 3 35 5

Dimensión Modelo de Actuación Posprueba
Tabla n.° 33.

Base de datos de la dimensión Modelo de Actuación posprueba
SUJETOS PREG12 PREG13 PREG14 PREG15 PREG16 PREG17 TOTAL B_7

S1 4 4 4 5 4 4 25 6
S2 4 4 4 5 4 4 25 6
S3 3 3 3 4 3 3 19 5
S4 3 3 3 5 4 4 22 5
S5 4 4 4 4 3 3 22 5
S6 3 3 3 5 4 4 22 5
S7 4 4 4 5 4 4 25 6
S8 4 4 4 4 3 3 22 5
S9 3 2 2 4 3 3 17 4

Variable Vigilancia Posprueba
Tabla n.° 34.

Base de datos de la variable Vigilancia posprueba
SUJETOS TOTAL B_7

S1 74 7
S2 66 6
S3 65 6
S4 65 6
S5 62 6
S6 66 6
S7 74 7
S8 65 6
S9 52 5

Anexo n.° 7. Formatos Trabajo de Campo












































































































Anexo n.° 8. Justificación de la Investigación

Existe una marcada tendencia en alza que comprende el uso de tecnologías innovadoras en
beneficio de las personas, contribuyendo a que cada vez más empresas tengan que implementar
estas soluciones a sus procesos. Una de las ciencias modernas que es foco de recientes
investigaciones es la visión artificial, ya que encuentra un campo de aplicación en la mayoría de
las industrias, utilizado para automatizar los procesos de selección y clasificación de la materia
prima.
Según Szeliski (2010), este tipo de tecnología tiene aplicación también en diversos
campos como la biometría, entretenimiento, educación, medicina, entre otros. Siendo la
seguridad uno de los campos más explotados actualmente; en comparación, existen diversas
aplicaciones utilizadas en la mayoría de los sistemas de vigilancia.
Por otro lado, los sistemas de videovigilancia se han convertido en un método de

monitoreo de las calles muy utilizado en las ciudades modernas, esto implica el uso de cámaras
que se despliegan en un área de vigilancia para recopilar datos de los cuales se extrae la
información útil para detectar, rastrear y reconocer objetos de interés para luego comprender y
analizar sus acciones. Estos sistemas han hecho posible el monitoreo de casas, hospitales,
estaciones de trenes, estacionamientos, tiendas y autopistas.
Es entonces cuando podemos ampararnos en la utilización de estos métodos para darle

una solución integral e innovadora al problema de la delincuencia que asoma hace mucho tiempo
en el distrito de Lince, automatizando la vigilancia. Añadiendo funciones mucho más complejas
a los sistemas ya existentes, como la detección de rostros, objetos, rastreo de movimiento y
reconocimiento de caracteres.
Los retos planteados en el uso de sistemas de vigilancia modernos están orientados a la

capacidad de adaptarse a condiciones variantes del entorno, dependiendo de la luz, temperatura
y condiciones climáticas; además, la autonomía es una característica fundamental para la
eficiencia del sistema ya que la inteligencia computacional está en camino a reemplazar la vista
del hombre en tareas tediosas y repetitivas.
Así pues, de lograr los resultados esperados en esta investigación, la propuesta podría
ser replicada en otros distritos de la capital, que cuenten con sistemas de vigilancia similares.
Significando una merma en los indicadores tan de inseguridad actuales del país, combatiendo
así a la delincuencia común y organizada.
En cuanto al objetivo de la investigación universitaria, es conveniente mencionar que

reforzar el conocimiento y la proyección social en los estudiantes a través de la investigación e
innovación, incentiva a que se apliquen los conocimientos ganados en la solución de
problemáticas que aquejan nuestro entorno.

Anexo n. ° 9. Marco Conceptual

Cámaras de Vigilancia
Las cámaras de vigilancia son las encargadas de captar todo lo que ocurra en una casa o
negocio, por lo que son un elemento vital en cualquier instalación.
Circuito Cerrado de Televisión (CCTV)
Es una red de visión remota más abierta, con acceso vía redes locales o globales como Internet.
Comisaría
Dependencia policial encargada de mantener el orden público, con funciones preventivas y de

investigación en una determinada jurisdicción a nivel nacional.
Google Maps
Permite crear mapas atractivos para tus sitios, apps y plataformas internas. Utilizando la
inteligencia geográfica puede abrir nuevas posibilidades de crecimiento para las empresas.
Inteligencia Artificial
Comprende la simulación de procesos de inteligencia humana por parte de máquinas,

especialmente sistemas informáticos. Estos procesos incluyen el aprendizaje, el razonamiento y
la autocorrección. Las aplicaciones particulares de la AI incluyen sistemas expertos,
reconocimiento de voz y visión artificial.
Interfaz de Programación de Aplicaciones (API)
Comprende un conjunto de comandos, funciones, protocolos y objetos que los programadores

pueden usar para crear software o interactuar con un sistema externo, proporcionando comandos
estándar para realizar operaciones comunes para que no tengan que escribir código desde cero.
Policía Nacional
La Policía Nacional del Perú es una institución del Estado creada para garantizar el orden interno,
el libre ejercicio de los derechos fundamentales de las personas y el normal desarrollo de las
actividades ciudadanas. Es profesional y jerarquizada.
Programa de Recompensas
El Programa de Recompensas para casos de criminalidad fue establecido por el Ejecutivo

mediante el Decreto Legislativo N°1180, publicado el 27 de julio del 2015, y su respectivo
reglamento, oficializado el 18 de febrero del 2016.
Serenazgo Municipal
Es un organismo municipal que brinda servicios de seguridad a la población. Están orientados a

la protección de personas, bienes y el mantenimiento de la tranquilidad y el orden ciudadano.

Sistema Web
Aplicaciones alojadas en un servidor en Internet o Intranet, a diferencia de las páginas web, estas
tienen funcionalidades más complejas y potentes que responden a casos muy particulares.
Videovigilancia
Un sistema de video vigilancia utiliza cámaras IP para su monitoreo, las cuales pueden ser
colocadas en lugares públicos y privados para la prevención del crimen y/o combate del crimen.

Anexo n.° 10. Producto

1. Documentación Técnica
1.1. Acta del Proyecto

ACTA DEL PROYECTO
Fecha Nombre del Proyecto
26 de marzo de 2020 Implementación de un sistema web basado en
visión artificial y geolocalización, y su influencia
en la vigilancia de las zonas del distrito de
Lince, 2020 - “LISA”
Áreas de conocimiento / procesos: Área de aplicación (Sector / Actividad):
Procesos: Iniciación, Planeación, Ejecución, Sector: Vigilancia
Control y Cierre. Actividad: Sistema de vigilancia automatizada
Áreas: Alcance, Tiempo, Costos, Calidad,
Comunicaciones y Adquisiciones.
Fecha de inicio del proyecto Fecha tentativa de finalización del proyecto
26 de marzo de 2020 26 de julio de 2020
Objetivos del proyecto (general y específico)
Objetivo general:
artificial y geolocalización en la vigilancia de las zonas del distrito de Lince, 2020.
Objetivos específicos:
artificial y geolocalización en el modelo de comportamiento en la vigilancia de las zonas
del distrito de Lince, 2020.
Justificación o propósito del proyecto (Aporte y resultados esperados)

El distrito de Lince es una vía de paso obligada para cruzar la capital atrayendo a muchos
comercios y centros de diversión nocturnos. Debido a esto, la tarea de mantener la seguridad
ciudadana es más que necesaria, para eso se han implementado redes de vigilancia mediante
cámaras que son controladas desde los centros de monitoreo con el objetivo de bridar atención
inmediata al ciudadano, dicha red abarca las nueve zonas vecinales en los que se divide el distrito.
Sin embargo, la posibilidad de atrapar a los delincuentes en flagrancia, juega un papel
fundamental al momento de la captura y juzgamiento, haciendo que el tiempo de respuesta sea
cada vez más rápido.
Debido a la aparición de nuevos avances en cuanto a la vigilancia y geolocalización, hace posible
la implementación de nuevos algoritmos en el análisis de imágenes. Con la posibilidad de brindar
alertas tempranas ante actos delictivos y tomar acciones correspondientes. En consecuencia, la
implementación de este sistema permitirá reducir el impacto los hechos delictivos en el distrito.
Descripción del producto o servicio que generara el proyecto – Entregables finales del
proyecto
El producto final será un sistema web, el cual permitirá monitorear las alertas apoyadas en
imágenes de cámaras de seguridad ubicadas en las zonas de seguridad del distrito. En el cual se
aplican algoritmos de visión artificial y geolocalización que brindan un mayor grado de
automatización del sistema, haciendo que no sean dependientes del accionar humano para la
toma de decisiones.
Supuestos
- Nuestra institución tiene la suficiente infraestructura y personal capacitado para realizar
este proyecto.

- El proyecto cuenta con aval de la Gerencia de Seguridad Ciudadana del distrito de

Lince.
- Los esfuerzos por mitigar la problemática de la inseguridad tienen una gran aceptación
por parte de nuestros usuarios en este proyecto.
Restricciones
- Disponibilidad de las cámaras de vigilancia actualmente presentes en el distrito.
- Disponibilidad de los recursos económicos para la configuración final del software, así
como la implementación de las pruebas finales.
Información histórica relevante
En el año 2013 se formuló el Plan Local de Seguridad Ciudadana aprobado por medio del Decreto
Supremo N°012-2013-IN para un periodo de 5 años, en el cual se señala la ponderación de la
Seguridad Ciudadana como una de las demandas principales de la población.
En ese contexto, según INEI (2018) en el distrito de Lince la cantidad de denuncias por comisión
de delitos incrementó en los últimos años siendo el 2018 el pico más alto de esta estadística.
En el año en promedio 01 policía cubre a 579.24 habitantes, mientras que 01 sereno cubre a
362.97 habitantes
Identificación de grupos de interés (Stakeholders)
Gerente de Seguridad Ciudadana.
Coordinador de Centro de Monitoreo.
Operadores de cámaras.
Aprobado por: Firma:
Realizado por: Masgo Ferreyra, Divad Jair.

1.2. Estructura de Desglose de Trabajo - EDT

1.3. Matriz de Requerimientos Funcionales
Proceso Actividades Responsables ¿Automatizable? RQ Requerimiento Caso de Uso Actor

Análisis de Identifica objetivo BW_Agente No - - - -
Imágenes
Capturar imagen Si RF 01 Permitir capturar una imagen mediante una cámara Analizar Imagen Agente
Sube imagen para analizar Si RF 02 Permitir subir imagen para analizar
Identifica objetivo en la imagen Si RF 03 Permitir la identificación y clasificación de objetos en
imágenes
Registra etiqueta BW_Técnico Si RF 04 Permitir registrar etiquetas para el análisis de imágenes Gestionar Etiqueta Técnico
Sube imagen de etiqueta Si RF 05 Permitir subir imagen para asociar a una etiqueta
Consulta etiquetas creadas Si RF 06 Permitir consultar las etiquetas registradas Consultar Etiqueta
Registra video Si RF 07 Permitir guardar los videos grabados por las cámaras Gestionar Video
de seguridad
Elimina videos periódicamente Si RF 08 Permitir eliminar videos cada mes automáticamente
Visualiza videos Si RF 09 Permitir visualizar videos guardados en la nube Consultar Video
Gestión de Identifica hecho delictivo BW_Agente No - - - -
Alertas
Ingresa datos de alerta Si RF 10 Permitir ingresar datos para registrar una alerta Generar Alerta Agente
Registrar alerta Si RF 11 Permitir registrar una alerta de hecho delictivo
Obtiene ubicación de alerta Si RF 12 Permitir obtener la ubicación de la persona que genera
la alerta
Recibe notificación de alerta BW_Técnico No - - - -
Consulta bitácora de alertas Si RF 13 Permitir visualizar la bitácora de alertas registradas Consultar Bitácora de Técnico
Alertas
Asignar agente encargado No - - - -
Geolocalización Obtiene localización del Si RF 14 Permitir obtener la ubicación del vehículo Registrar Técnico
vehículo Localización
Registra posición del vehículo Si RF 15 Permitir registra la ubicación del vehículo de manera
automática
Consulta bitácora de Si RF 16 Permitir visualizar la bitácora de localización de la flota Consultar Bitácora de
localización vehicular Localización
Gestión de Registra datos de vehículo Si RF 17 Permitir registrar datos de vehículos nuevos Gestionar Flota
Activos Vehicular
Modifica datos de vehículo Si RF 18 Permitir modificar datos de vehículos registrados
Elimina datos de vehículo Si RF 19 Permitir dar de baja a vehículos registrados

Consulta datos de flota Si RF 20 Permitir visualizar una lista de vehículos registrados Consulta Flota
vehicular Vehicular
Registra datos cámara de Si RF 21 Permitir registrar datos de cámaras de seguridad Gestionar Cámara
seguridad nuevas
Modifica datos de cámara de Si RF 22 Permitir modificar datos de cámaras registradas
seguridad
Elimina datos de cámara de Si RF 23 Permitir dar de baja a cámaras registradas
seguridad
Consulta datos de cámaras de Si RF 24 Permitir visualizar una lista de cámaras registradas Consultar Cámara
seguridad
Registra datos de PARMET Si RF 25 Permitir registrar datos de PARMET nuevos Gestionar PARMET
Modifica datos de PARMET Si RF 26 Permitir modificar datos de PARMET registrados
Elimina datos de PARMET Si RF 27 Permitir dar de baja a PARMET registrados
Consulta datos de PARMET Si RF 28 Permitir visualizar una lista de PARMET registrados Consultar PARMET
Registra datos de usuario Si RF 29 Permitir registrar datos de usuarios nuevos Gestionar Usuario
Modifica datos de usuario Si RF 30 Permitir modificar datos de usuarios registrados
Elimina datos de usuario Si RF 31 Permitir dar de baja a usuarios registrados
Consulta datos de usuario Si RF 32 Permitir visualizar una lista de usuarios registrados Consultar Usuario
Gestión de Visualiza reportes de alertas Si RF 33 Permitir visualizar reportes de alertas generados en el Consultar Reporte de
Reportes diarios día Alertas
Visualiza reportes de alertas Si RF 34 Permitir visualizar reportes de alertas generados en la
semanales semana
Visualiza reportes de alertas Si RF 35 Permitir visualizar reportes de alertas generados en el
mensuales mes
Visualiza reporte de flota Si RF 36 Permitir visualizar reportes de la flota vehicular Consultar Reporte de
vehicular Flota Vehicular
Visualiza reportes de ubicación Si RF 37 Permitir visualizar reportes de ubicaciones de vehículos
de vehículos

1.4. Matriz de Requerimientos no Funcionales

RQ Tipo Descripción
RNF 01 Mensaje de Error El sistema debe presentar los errores de forma explícita de manera que el
usuario pueda saber el motivo del error y una posible solución.
RNF 02 Mensaje de confirmación El sistema debe presentar una ventana de diálogo al usuario a fin de que
confirme los cambios a realizar en la transacción o para corroborar los
cambios que desea realizar
RNF 03 Lenguaje empleado El lenguaje empleado en la interfaz del sistema respetará los términos
usados en el negocio para su mejor comprensión.
RNF 04 Acceso desde Internet El usuario debe acceder al sistema a través de internet, desde lugares
externos.
RNF 05 Manejo Interfaz El manejo de la interfaz gráfica de la aplicación debe de ser intuitivo para el
usuario
RNF 06 Tiempo de respuesta El 95% de las actividades no deben de exceder del siguiente tiempo de
respuesta dentro de la interfaz de la aplicación.
- Hasta 10 segundos para consultas y transacciones.
RNF 07 Concurrencia El sistema permite como máximo el acceso concurrente de 50 usuarios.
RNF 08 Caducidad de sesión El tiempo límite de inactividad del sistema debe ser de una hora, caso
contrario el sistema cerrará la sesión.
RNF 09 Backups El sistema deberá proveer mecanismos para generar backups
periódicamente de la información que se mantiene en el sistema. Los
backup ś deben ser responsabilidad del administrador del sistema quien
deberá crearlos, almacenarlos y recuperar la información en el caso de un
evento de pérdida de datos.
RNF 10 Navegador Web El sistema debe soportar los navegadores más comerciales Chrome y Firefox
en sus versiones más recientes.
RNF 11 Lenguaje de programación El sistema será desarrollado en Visual Studio Code, empleando el lenguaje
Typescript y con el apoyo del framework web Angular y Nodejs en el
backend.
RNF 12 Motor de Base de Datos El sistema usará MSSQL Server como motor de base de datos.
RNF 13 Integridad y consistencia de El sistema manejará transacciones protegidas ante eventuales errores. Ante
los datos la falla del aplicativo, se contará con mecanismos de restauración con el
objetivo de evitar inconsistencia de datos.
RNF 14 Tiempo de sesión El tiempo máximo por inactividad de una sesión de usuario será de 20
minutos.
RNF 15 Manual de Usuario El sistema debe contar con un manual de usuario debidamente estructurado.
El cual podrá ser visualizado y descargado en formato PDF desde el mismo
aplicativo.
RNF 16 Interfaz del Administrador El sistema debe otorgarle total dominio sobre todas y cada una de las
interfaces al usuario con el rol de Administrador.
RNF 17 Interface intuitiva Ofrecer interfaz fácil, intuitiva, con menús sensibles al contexto, navegación.
RNF 18 Software Servidor Los componentes utilizados para la instalación del servidor de aplicaciones y
de base de datos son:
- MSSQL Server
- Windows Server 2008 R2 Estándar
RNF 19 Legales y de derecho de Los derechos de autor del sistema corresponden única y exclusivamente a
autor Divad Jair Masgo Ferreyra.

1.5. Diagrama de Casos de Uso del Negocio - DCUN
1.6. Vista Arquitectónica Funcional – Diagrama de Paquetes

1.7. Diagrama de Clases del Negocio – DCN

1.8. Diagrama General de Casos de Uso del Sistema - DCU
1.9. Diagrama de Casos de Uso del Sistema – Gestión de Alertas

1.10. Diagrama de Casos de Uso del Sistema – Análisis de Imágenes
1.11. Diagrama de Casos de Uso del Sistema – Geolocalización

1.12. Diagrama de Casos de Uso del Sistema – Gestión de Activos
1.13. Diagrama de Casos de Uso del Sistema – Gestión de Reportes

1.14. Especificaciones de Casos de Uso
ECU Análisis de Imágenes

1. Descripción
El caso de uso permite analizar imágenes con el fin de obtener información sobre vehículos
robados o delincuentes, gestionar etiquetas para el reconocimiento y gestionar el material de
video almacenado en la nube.
2. Actores
Agente, Técnico.
3. Flujo de eventos
3.1. Flujo básico
1. El usuario accede al sistema ingresando sus credenciales.
2. El caso de uso se inicia cuando el Agente selecciona la opción “Analizar Imagen”.
3. El agente identifica un objetivo que desea analizar.
4. El agente captura la imagen y la sube al sistema para ser analizado.
5. El sistema analiza la imagen y muestra el resultado del análisis.
6. El agente toma las medidas que crea correspondiente de acuerdo con el resultado recibido.
3.2. Flujos alternativos
3.2.1. Gestionar etiquetas
1. El técnico selecciona la opción “Gestionar Etiqueta”.
2. El sistema muestra una lista de etiquetas registradas.
3. El técnico tiene la posibilidad de elegir las opciones de Modificar, Nuevo y Eliminar.
3.2.2. Gestionar material de video
1. El técnico selecciona la opción “Gestionar Material de Video”.
2. El sistema muestra una lista de videos almacenados en la nube.
3. El técnico tiene la posibilidad de elegir las opciones de Visualizar y Eliminar.
4. Precondiciones
El usuario debe estar logeado en el sistema.
5. Post condiciones
Ninguna.
6. Punto de Extensión
No aplica.
7. Requerimientos Especiales
Ninguno.

ECU Gestión de Alertas

1. Descripción
El caso de uso permite gestionar las alertas generadas por el Agente, para que posteriormente
sean visualizadas por el Técnico.
2. Actores
Agente, Técnico.
3. Flujo de eventos
3.3. Flujo básico
1. El usuario accede al sistema ingresando sus credenciales.
2. El caso de uso se inicia cuando el usuario selecciona la opción “Gestionar Alertas”.
3. El sistema muestra una lista con las últimas alertas generadas en el día.
4. El agente tiene la posibilidad de generar una nueva alerta.
5. El agente completa los datos de la alerta nueva.
6. El sistema obtiene la ubicación del usuario que genera la alerta.
3.4.1. Consultar Bitácora de Alertas
1. El sistema muestra una lista con la bitácora de alertas registradas.
2. El técnico selecciona la opción “Visualizar”.
3. El sistema muestra el detalle de la alerta seleccionada.
4. Precondiciones
5. Post condiciones
Ninguna.
No aplica.
Ninguno.

ECU Gestión de Activos

1. Descripción
El caso de uso permite gestionar los activos en los cuales se encuentran vehículos, cámaras,
PARMET y usuarios.
2. Actores
Administrador.
3. Flujo de eventos
3.5. Flujo básico
1. El administrador accede al sistema ingresando sus credenciales.
2. El caso de uso se inicia cuando el usuario selecciona la opción “Gestionar Activos”.
3. El sistema muestra un resumen con la cantidad de activos registrados.
4. El administrador tiene la posibilidad de gestionar vehículos, cámaras, PARMET o usuarios.
3.6.1. Gestionar Flota Vehicular
1. El sistema muestra una lista con la flota vehicular registrada.
2. El administrador tiene la posibilidad de Visualizar, Modificar, Registrar y Eliminar vehículos.
3.6.2. Gestionar Cámaras
1. El sistema muestra una lista con las cámaras registradas.
2. El administrador tiene la posibilidad de Visualizar, Modificar, Registrar y Eliminar cámaras.
3.6.3. Gestionar PARMET
1. El sistema muestra una lista con los PARMET registrados.
2. El administrador tiene la posibilidad de Visualizar, Modificar, Registrar y Eliminar PARMET.
3.6.4. Gestionar Usuarios
1. El sistema muestra una lista con los usuarios registrados.
2. El administrador tiene la posibilidad de Visualizar, Modificar, Registrar y Eliminar usuarios.
4. Precondiciones
5. Post condiciones
Ninguna.
No aplica.
Ninguno.

2. Documentación de Usuario
2.1. Pantallas del Sistema

Lince Seguridad Automatizada (LISA)
Acceso al sistema
Vista Inicio

Vista de Geolocalización
Vista de Bitácora de Alertas – Incidencias

Vista de Registro de Alertas
Vista de Análisis de Imágenes

Tesis Masgo Ferreyra Divad Jair FINAL

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tesis Masgo Ferreyra Divad Jair FINAL

Cargado por

Copyright:

Formatos disponibles

DE LINCE, 2020.

“IMPLEMENTACIÓN DE UN SISTEMA WEB

Tesis para optar el título profesional de:

Ingeniero de Sistemas Computacionales

ACTA DE AUTORIZACIÓN PARA PRESENTACIÓN DEL TRABAJO DE

Por cuanto, CONSIDERA que el trabajo de investigación titulado: IMPLEMENTACIÓN DE UN

Masgo Ferreyra Divad Jair ii

ACTA DE EVALUACIÓN DEL TRABAJO DE INVESTIGACIÓN

Raúl Eduardo Huarote Zegarra Miguel Alfredo Lévano Stella

Edward José Flores Masías

Masgo Ferreyra Divad Jair iii

Está tesis que representa sacrificio y

Masgo Ferreyra Divad Jair iv

A los distintos maestros que

A los funcionarios de la municipalidad de

Masgo Ferreyra Divad Jair v

Masgo Ferreyra Divad Jair vi

3.2.2. Análisis descriptivo de la dimensión Modelo de Comportamiento preprueba .... 82

Masgo Ferreyra Divad Jair vii

Masgo Ferreyra Divad Jair viii

Masgo Ferreyra Divad Jair ix

Figura n.° 38. Mejores APIs de mapeo. ...................................................................................... 41

Masgo Ferreyra Divad Jair x

Masgo Ferreyra Divad Jair xi

El enfoque usado en esta investigación fue el cuantitativo de tipo aplicada, además de

La investigación concluye que la implementación de un sistema web basado en visión

Palabras clave: Vigilancia; visión artificial; geolocalización; automatización; seguridad.

Masgo Ferreyra Divad Jair xii

Figura n.° 1. Esquema básico de una aplicación web

Masgo Ferreyra Divad Jair 13

1.1.1.2. Definición de Visión Artificial

A su vez, Porras (2014) describe la función principal de la visión artificial, sosteniendo

En cuanto al control de procesos en tiempo real, es posible que mediante técnicas de

Teniendo en cuenta los conceptos expuestos en los párrafos precedentes, existe

1.1.1.3. Etapas de la Visión Artificial

Masgo Ferreyra Divad Jair 14

La primera fase, que es puramente sensorial, se refiere a la captura o adquisición

de imágenes digitales mediante cierto tipo de sensor. La segunda etapa se

enfoca en el tratamiento digital de imágenes, con la finalidad de facilitar las

etapas consecutivas; en esta etapa de procesamiento previo con ayuda de filtros

y transformaciones geométricas, se eliminan partes indeseables de una imagen

o se destacan partes interesantes de la misma. La siguiente fase se denomina

segmentación, y consiste en separar los elementos que interesan de una escena

para estudiarla. Finalmente, en la etapa de reconocimiento o clasificación se

características diferenciadoras que se establecen con antelación. (Vélez et al.,

2003, pp. 19-20)

Figura n.° 3. Esquema del sistema de visión artificial

Masgo Ferreyra Divad Jair 15

1.1.1.4. Clasificación de Visión Artificial

Clasificación según Vélez

Adquisición y representación de imágenes digitales

Masgo Ferreyra Divad Jair 16

Figura n.° 4. Relación entre dispositivos y el computador

Filtrado y realzado de imagen

Figura n.° 5. Esquema de funcionamiento de un filtro

Masgo Ferreyra Divad Jair 17

Figura n.° 6. Ejemplo de segmentación identificando un texto

Lo detallado anteriormente describe un proceso muy conveniente para la tarea de

Figura n.° 7. Esquema general de funcionamiento de un clasificador

Masgo Ferreyra Divad Jair 18

Figura n.° 8. Representación del problema de correspondencia en la visión estéreo

Esto se puede notar en el proceso de caza de un depredador aéreo, el cual obtiene

Clasificación según Szeliski