Está en la página 1de 36

ESCUELA DE SUB-OFICIALES

DE AREQUIPA
PNP/ CHARCANI

"EXCELENCIA"
ASIGNATURA: ___________________________________________________

TEMA:
“____________________________________________”

ALUMNO: ____________________________________________

DOCENTE: __________________________________________

SECCIÓN:_______ BAT.: _____ CIA: ____

AREQUIPA – PERÚ
2022
DEDICATORIA

“El presente trabajo, es dedicado a la Policía Nacional del


Perú, por permitirme ser lo que soy lo que seré a mis
Instructores, quienes con sus sabias enseñanzas
supieron encenderme una luz en el sendero del
conocimiento; y, mi familia, quienes con su paciencia
supieron imbuirme de voluntad para llegar al fin de mi
carrera.
¡¡GRACIAS A TODOS ELLOS!!

Introducción

Desde los comienzos, el hombre quiso registrar toda la información. Desde


nuestros antepasados prehistóricos que guardaban esta información en
huesos, piedras, cuevas, hasta los egipcios que documentaron todos sus
acontecimientos.

Somos seres que dejamos nuestras huellas por donde andamos. En todo
momento del día dejamos un rastro de datos. En últimos tiempos aparece el
Big Data como una opción de recolección y análisis de datos para procesar
estos datos y poder utilizarlos.

Big Data nació con el objetivo de cubrir unas necesidades no satisfechas por
las tecnologías existentes, como es el almacenamiento y tratamiento de
grandes volúmenes de datos que poseen unas características muy concretas
definidas como las tres V’s. Una característica importante acerca de los datos,
es que son considerados como la fuente de la verdad, es decir, no se alteran
durante su tratamiento. La tecnología subyacente en Big Data es Apache
Hadoop, en la actualidad cuenta con ocho años de historia.

Hadoop es un sistema operativo distribuido que permite procesar en paralelo


grandes volúmenes de datos, sobre un hardware convencional.

Al plantearnos la necesidad de llevar a cabo una implantación de big data,


debemos tener en cuenta que por un lado dispondremos de una solución para
nuestros datos estructurados (RDBMS convencional) y no estructurados o semi
(Hadoop) y que necesitaremos dar respuesta al análisis de datos, para ello el
ecosistema Big data dispone de múltiples soluciones, algunas de bajo nivel y
otras que nos abstraen de esa complejidad, pero que necesitaremos
responder.
Así termina una introducción a Big Data, en próximos artículos abordaré, el
ecosistema Big Data, para conocer las herramientas disponibles y su
aplicación.
Índice

Dedicatoria............................................................................................................2
Introducción..........................................................................................................3
Índice....................................................................................................................4
Capítulo I: Definición del problema.......................................................................5
1.1 Realidad Problemática................................................................................5
1.2 Planteamiento del Problema......................................................................5
1.2.1 Problema Principal..................................................................................5
1.2.2 Problemas Específicos............................................................................5
1.3 Objetivos.....................................................................................................6
1.3.1 Objetivo General......................................................................................6
1.3.2 Objetivos Específicos..............................................................................6
1.4 Justificación................................................................................................6
Capítulo II: Marco Teórico....................................................................................8
2.1 Antecedentes de la Investigación...............................................................8
2.2 Marco teórico..............................................................................................9
Capítulo III: Marco Metodológico........................................................................23
Capítulo IV: Conclusiones y Recomendaciones................................................30
4.1 Conclusiones............................................................................................30
4.2 Recomendaciones....................................................................................31
BIBLIOGRAFÍA...................................................................................................32
ANEXOS.............................................................................................................33
Capítulo I: Definición del problema
1.1 Realidad Problemática
En la actualidad las redes sociales se han convertido en una fuente de
información importante para las empresas, que permiten el mejoramiento
continuo en base a críticas constructivas, de igual manera en el ámbito de
la educación día a día estamos rodeados de todo tipo de opiniones
favorables y desfavorables referentes a servicios que brinda la Policía
Nacional del Perú.

En la PNP, se cuenta con la red social Facebook desde la cual se realiza


múltiples publicaciones lo que genera respuestas en un volumen alto de
información, la cual no puede ser tratado de manera manual por la
entropía de cada una de las respuestas, las mismas que muchas de las
veces no aportan para un análisis real de los servicios académicos de la
PNP.

Este enorme volumen de información para ser clasificado necesitaría de


un gran número de personas especializadas en clasificación de
información, lo que genera tiempo y costo alto, y por el volumen de
información no se realizaría de una manera confiable, lo que conllevaría a
tomar decisiones erróneas sobre los servicios académicos que brinda la
PNP.

1.2 Planteamiento del Problema


1.2.1 Problema Principal
¿Existe incidencia entre el uso del Big Data y la calidad de los servicios
de la Policía Nacional del Perú?

1.2.2 Problemas Específicos


¿Se pueden establecer las características de las opiniones en el Big Data
de la PNP?
¿Se puede determinar el nivel de calidad actual de los servicios
académicos más utilizados de la PNP, basándose en las opiniones del Big
Data?
1.3 Objetivos
1.3.1 Objetivo General
Establecer la incidencia del Big Data en la determinación de la calidad de
los servicios de la Policía Nacional del Perú.

1.3.2 Objetivos Específicos


Establecer los mecanismos para tratar la información en el Big Data de la
PNP.

Determinar el nivel de aporte de las opiniones del Big Data en la


clasificación de la calidad de los servicios académicos más utilizados de
la PNP.

Proponer una solución para utilizar el Big Data como un recurso válido
que aporte a la clasificación de la calidad de servicios académicos de la
PNP.

1.4 Justificación.
La presente investigación se justifica porque la PNP está
desaprovechando los comentarios y opiniones emitidas directamente por
los usuarios primarios de sus servicios académicos, esto se da debido a
que no existe una herramienta adecuada para el tratamiento de las
opiniones vertidas en el Big Data, derivando que la valiosa información
contenida en el Big Data no sea explotada de forma adecuada por lo difícil
de su clasificación y manipulación del gran volumen de información
existente.

El tratamiento de esta información debería realizarse por parte de


personal especializado en análisis de opiniones lo que derivaría en que la
PNP, acuda recurrentemente a éste 9 tipo de talento humano generando
altos costos para la Institución, es técnicamente factible por cuanto se
tiene la información proporcionada por la encuesta realizada en
Facebook. Es factible operativamente porque el investigador tiene los
conocimientos necesarios y suficientes para llevar a cabo la misma, y es
económicamente factible porque los gastos que genere la investigación
correrán a cargo del investigador. El poder filtrar información y trabajar
con las opiniones válidas es importante para los directivos.

De allí que este trabajo, pretende brindar información válida, a los agentes
que toman las decisiones respecto a los servicios virtuales que brinda la
universidad. De allí, que es factible ya que se cuenta con la información
en la red social, que si bien es no estructurada, se propone una
metodología para estructurar la información en el Big Data.

Y es que es eso, el Big Data la gran cantidad de información y/o opiniones


lo que disminuye la capacidad de análisis de la red social, lo cual hace
que en este trabajo investigativo, se proponga el mecanismo adecuado y
operativo para seleccionar, estructurar y manejar las opiniones aun con
criterio subjetivo. Todo esto para brindar una cercanía de lo que piensan
los usuarios sobre el servicio académico seleccionado.
Capítulo II: Marco Teórico
2.1 Antecedentes de la Investigación.
José Antonio Rojas García en el año 2016, propone un modelo de
negocios basado en Big Data que facilite la integración de los datos de las
personas naturales y de soporte a las políticas de e-government en el
Perú, apoyado en una empresa de logística integral en su tesis de
pregrado en la Universidad Peruana de Ciencias Aplicadas UPC,
LimaPerú. Presenta una “Propuesta de Negocio” para una Empresa de
Logística Ligera que busca aprovechar sus habilidades operativas a fin de
desarrollar un nuevo servicio para sus clientes basado en Big Data. La
propuesta se encuentra alienada a la prioridad y capacidad competitiva de
la Empresa de Logística Ligera considerando sus procesos operativos
actuales y su plan estratégico actual, a la vez se plantea el tratar de
aprovechar su capacidad instalada actual, minimizando su capacidad
ociosa actual que se ha generado a consecuencia de atender a sus
clientes actuales. La propuesta que se ha planteado tiene como principal
objetivo atender las necesidades de los consumidores futuros de la
Empresa de Logística Ligera, así como que esta pueda servir de soporte
para varias de las políticas implementadas en la actualidad para el
desarrollo de un e-government en el Perú. La “Propuesta de Negocio”
presentada se soporta en la construcción de un modelo de Big Data
confiable y sostenible en el tiempo acorde a la normatividad vigente para
manejo de datos personales y que pueda ser parte la misma de los
procesos que permitan mejorar la planificación de servicios que ofrece el
Estado Peruano a los ciudadanos. El principal objetivo es actualizar los
datos personales de las personas naturales en un lapso máximo de 48
horas en todas aquellas instituciones que se encuentren afiliadas al
modelo de negocio propuesto, para lograr este objetivo se proponen
procesos de validación de los datos recabados, adicionalmente como se
propone la transmisión de dicha información de forma estructurada y
enriquecida en tiempo real a fin de que esta pueda ser utilizada en un
modelo dinámico de información interconectada a lo largo del territorio
nacional. Finalmente se podrá generar beneficios adicionales que podrán
ser complemento y 19 soporte de algunas de las políticas del Estado
Peruano para los próximos años como lo es la planificación de los
servicios para la sociedad mediante la identificación real del número de
ciudadanos en cada ámbito geográfico, así como la reducción de los
costos de las organizaciones y de los ciudadanos para actualizar los
datos de contactabilidad, generando de esta manera la transformación de
la sociedad actual en una en una nueva “Sociedad Digital”.

Fabián Andrés Guerrero López y Jorge Eduardo Rodriguez Pinilla en


el año 2013 expusieron el diseño y desarrollo de una guía para la
implementación de un ambiente Big Data en la Universidad Católica de
Colombia en su tesis de pregrado para la Universidad Católica de
Colombia. En dicha investigación ambos autores concluyeron que el Big
Data es una nueva tendencia para el manejo de grandes volúmenes de
información, utilizado principalmente por grandes empresas, pero gracias
a las nuevas tecnologías y su fácil acceso podrá ser utilizado por
cualquier empresa o institución que desee vincularse al nuevo proceso
que se puede lograr en la gestión de la información. La estructura de un
ambiente Big Data ayuda a mejorar la manipulación de los datos,
optimizando la gestión de la información respecto a tiempo y costo,
logrando obtener mejores resultados en las estadísticas para una buena
toma de decisiones.

2.2 Marco teórico


2.2.1 Big Data
El Big Data es el proceso de recolección de grandes cantidades de datos
y su análisis para encontrar información, patrones recurrentes, nuevas
correlaciones etc. Los análisis de Big Data recopilan y analizan datos
constantemente en tiempo real. El objetivo de este ciclo continuo de
procesamiento es para ofrecer información instantánea a los usuarios.

Estamos hablando de un conjunto de datos que es tan grande y complejo


que los medios tradicionales de procesamiento de datos son incapaces de
analizar, capturar, recolectar, buscar, compartir. Almacenar, transferir,
visualizar entre otras actividades Por eso se comenzó a utilizar Big Data con
herramientas de software de uso común en el marco de disciplinas analíticas
avanzadas, como el análisis predictivo y la minería de datos.

Sin embargo, las fuentes de datos no estructurados utilizados para el


análisis de grandes datos tal vez no encajen en los almacenes de datos
tradicionales. Además, los almacenes de datos tradicionales pueden no ser
capaces.

2.2.2 Los datos pueden venir de:


Datos de Internet de las Cosas, Datos sectoriales recopilados por
empresas especializadas, Datos de internet y móviles, experimentales, redes
sociales, elecciones, Transacciones entre otros.

Estas fuentes de datos pueden incluir registros del servidor web y datos
de seguimiento de clics en internet, informes de actividades sociales, medios
de comunicación, teléfonos móviles registros detallados de llamadas y la
información captada por los sensores.

Para poder analizar todo esto, se precisa de técnicas potentes y


avanzadas; las clásicas medias o varianzas no son por sí solas suficientes para
extraer suficiente de toda esa cantidad de información, ni para entender los
diferentes tipos de datos.

Big Data es el avance tecnológico enfocado en el entendimiento y toma


de decisiones, además de ser una metodología para almacenar y procesar
datos, estructurados o semiestructurados, los cuales serían muy difícil de
almacenar en una base de datos y posteriormente analizarlos.

Las tecnologías relacionadas con el análisis de datos incluyen Big Data,


NoSQL, Hadoop y MapReduce. Estas tecnologías forman el núcleo de un
marco de software de código abierto que soporta el procesamiento de grandes
volúmenes de datos. Big Data es un gran banco de datos disponibles para las
empresas, con los que pueden trabajar con más dedicación en los gustos
específicos de los usuarios, de forma casi personalizada. Es un valioso recurso
de información para diseñar estrategias más válidas y reales.

Contando con información más precisa, se minimizan los riesgos en la


formulación de estrategias y políticas de mercado. La comunicación directa con
el cliente, también permitirá una serie de reformas en productos o servicios,
gracias a los aportes de los diferentes criterios y opiniones.

Antes de la irrupción de Big Data, ya existían algoritmos matemáticos que


nos facilitaban descubrir información oculta en los datos, como todos los que
engloban el

Data Mining (minería de datos): K-medias, arboles de decisión, redes


neuronales, etc., que con la llegada de la potencia de cálculo de los
ordenadores permitieron acortar el tiempo que se tardaba en obtener
resultados. Pero no lo hacían en tiempo real, sino posteriormente.

Ahora con Big Data, todo esto se consigue en tiempo real y con cada
nueva actualización de nuestro repositorio de datos es posible ver los cambios
en las estadísticas inmediatamente.

Por eso el análisis de datos siempre ha tenido un gran peso en el


marketing, un mejor conocimiento del consumidor y sus necesidades propicia
saber cómo aumentar las ventas; el análisis de datos nos permite establecer
relaciones entre variables, predecir comportamientos, realizar agrupaciones
(clustering) de grupos homogéneos, e incluso analizar textos para extraer
información.

2.2.3 Características
Se las conocían anteriormente como 3V y actualmente se ampliaron a 5V
de acuerdo a las nuevas necesidades.
Volumen: Una de las características principales volumen. Debido que
estamos hablamos de grandes cantidades de datos para captar y organizar
absolPNPmente toda la información que nos llega es esencial para tener
registros completos, y que las conclusiones que obtengamos sirvan
eficientemente a la hora de la toma de decisiones.

Velocidad: Siempre es importante el tiempo si afrontamos tanto la


necesidad de generar información (y recordemos que estamos hablando de
muchos datos) como de analizarla, pero lo es más si necesitamos reaccionar
inmediatamente; todo el proceso pide agilidad para extraer valor de negocio a
la información que se estudia y que no se pierda la oportunidad.

Variedad: Variedad: si bien toda información llega de orígenes muy


variados, la fortaleza de Big Data es poder conjugar y combinar cada tipo de
información hasta alcanzar un todo homogéneo.

Veracidad: Se refiere a la calidad del dato y su disponibilidad. Hay que


encontrar herramientas para comprobar la información recibida es fiel a la
realidad. Para nos pueda servir toda la información que surja desde ese
proceso.

Valor: Trabajar con Big Data tiene que servir para aportar valor a la
sociedad, las empresas, los gobiernos, en definitiva, a las personas; todo el
proceso tiene que ayudar a impulsar el desarrollo, la innovación y la
competitividad, pero también mejorar la calidad de vida de las personas.

2.2.4 Los datos que estudia el Big Data


Si recordamos la definición de “dato” que deriva del Latín DATUM,
significa lo que se da en el sentido de lo que acontece. Son antecedentes
necesarios para llegar a un conocimiento exacto de una cosa.

Hoy en día, toda la datos que generamos día a día sobre todos nuestros
gustos, compras, transacciones bancarias hasta los “me gusta” en redes
sociales son la materia de estudio del Big Data. Estos datos pueden ser de
diferente índole:

Datos estructurados: Aquellos que tienen longitud y formato (por


ejemplo fechas) y que pueden ser almacenados en tablas (como las bases de
datos relacionales). En esta categoría entran los que se compilan en los censos
de población, los diferentes tipos de encuestas, los datos de transacciones
bancarias, las compras en tiendas online, etc.

Datos no estructurados: Son los que carecen de un formato


determinado y no pueden ser almacenados en una tabla. Pueden ser de tipo
texto (los que generan los usuarios de foros, redes sociales, documentos de
Word), y los de tipo no-texto (cualquier fichero de imagen, audio, vídeo).

Datos semiestructurados: Que son los que no pertenecen a bases de


datos relacionales ya que no se limitan a campos determinados, aunque
poseen organización interna o marcadores que facilita el tratamiento de sus
elementos; estaríamos hablando de documentos XML, HTML o los datos
almacenados en bases de datos NoSQL

2.2.5 Usos del Big Data


El Big Data tiene un uso en diferentes áreas donde los servicios son
utilizados y se puede sacar gran provecho como es el caso de:

Turismo: Se ayuda a mantener felices a los clientes y es clave en ésta


industria, pero la satisfacción del cliente puede ser difícil de medir,
especialmente en el momento oportuno. El análisis de Big Data ofrece a estas
empresas la capacidad de recopilar datos de los clientes, aplicar análisis e
identificar inmediatamente posibles problemas antes de que sea demasiado
tarde.

Cuidado de la salud: Los registros de pacientes, planes de salud,


información de seguros y otros tipos de información pueden ser difíciles de
manejar, pero están llenos de información clave una vez que se aplican las
analíticas. Es por eso que la tecnología de análisis de datos es tan importante
para el cuidado de la salud. Al analizar grandes cantidades de información
tanto estructurada como no estructurada rápidamente, se pueden proporcionar
diagnósticos u opciones de tratamiento casi de inmediato.

En el comercio por internet (eComerce): se utiliza esta técnica para


optimizar el stock de sus almacenes a través de la información extraída de lo
que busca la gente en su web o analizando las tendencias en redes sociales y
foros; también fijar precios dinámicos en sus productos extrayendo datos de
múltiples fuentes (las acciones de los clientes, preferencias de los proveedores
o recopilación de precios de la competencia)

En las telecomunicaciones (empresas telefónicas): es una industria


privilegiada, gracias a sus redes y a la proliferación de dispositivos móviles; la
oportunidad más evidente es extraer información de la experiencia del usuario,
gracias a los datos de llamadas y datos de navegación. Esto permite ofrecer a
sus clientes un plan de contratos personalizados de acuerdo a los usos.

La Federación Alemana de Fútbol empezó a usar el análisis de grandes


volúmenes de datos para mejorar el rendimiento de sus jugadores, y con los
deberes bien hechos se presentaron en el Mundial de Brasil 2014.

El objetivo principal del análisis de datos grandes es ayudar a las


empresas a tomar mejores decisiones de negocios al permitir a los científicos y
otros usuarios de datos analizar grandes volúmenes de datos transaccionales,
así como otras fuentes de datos que puedan haber quedado sin explotar por la
inteligencia de negocio convencional.

Business Intelligence
El término ‘Business Intelligence’, o inteligencia empresarial, se refiere al
uso de datos en una empresa para facilitar la toma de decisiones. Es un
conjunto de estrategias y herramientas enfocadas al análisis de datos de una
empresa mediante el análisis de datos existentes.
Todas las empresas pueden recopilar datos, datos relativos a ventas, a
compras, a inversiones, a tiempos. Miles de datos y variables pueden ser
estudiados y utilizados para tomar nuevas estrategias, conocer las fortalezas
propias, y por supuesto, las debilidades.

En términos generales, el Business Intelligence trata de extraer los datos


de la empresa de distintas fuentes mediante las herramientas de Big Data.
Todo este análisis, debería permitir incrementar el nivel financiero,
administrativo, y con las decisiones a mejorar las acciones de la empresa.

2.2.6 Herramientas para utilizar Big Data


Uno de los objetivos del uso de las tecnologías Big Data es el de
transformar los datos en conocimiento útil para la empresa, y para ello se
necesitan herramientas Big Data que nos ayuden a analizar, procesar y
almacenar todos los datos recogidos. Un gran número de entre las mejores
herramientas usadas en Big Data son open source, lo que da fe del éxito de
este modelo de desarrollo, además de las alternativas de pago.

Hadoop

No se puede hablar de Big Data sin hablar de la veterana Apache


Hadoop. Esta herramienta Big Data open source se considera el framework
estándar para el almacenamiento de grandes volúmenes de datos; se usa
también para analizar y procesar, y es utilizado por empresas como Facebook
y Yahoo.

La biblioteca Hadoop utiliza modelos de programación simples para el


almacenamiento y procesamiento distribuido de grandes conjuntos de datos en
clusters, dando redundancia para no perder nada y, al mismo tiempo,
aprovechando muchos procesos a la vez.
Dispone de un sistema de archivos distribuido en cada nodo del cluster: el
HDFS (Hadoop Distributed File System), y se basa en el proceso de
MapReduce de dos fases.

Soporta diferentes sistemas operativos y también se usa frecuentemente


sobre cualquiera de las principales plataformas en la nube, como Amazon
EC2/S3 o Google Cloud.

MongoDB
Dentro de las bases de datos NoSQL, probablemente una de las más
famosas sea MongoDB. Con un concepto muy diferente al de las bases de
datos relacionales, se está convirtiendo en una interesante alternativa para
almacenar los datos de nuestras aplicaciones.

MongoDB es una base de datos orientada a documentos (guarda los


datos en documentos, no en registros). Estos documentos son almacenados en
BSON, que es una representación binaria de JSON.

A pesar de que las bases de datos NoSQL no tienen una extensa


variedad de uso, MongoDB tiene un ámbito de aplicación más amplio en
diferentes tipos de proyectos: es especialmente útil en entornos que requieran
escalabilidad. Con sus opciones de replicación y sharding, podemos conseguir
un sistema que escale horizontalmente sin demasiados problemas.

Apache Spark
Apache Spark es un motor de procesamiento de datos de código abierto
realmente rápido.

Creado por Matei Zaharia en la Universidad de Berkeley, se considera el


primer software open source que hace la programación distribuida
(basicamente, consiste en distribuir el trabajo entre un grupo de ordenadores,
“cluster”, que trabajan como uno) realmente accesible a los científicos de datos.
Se pueden programar aplicaciones usando diferentes lenguajes como
Java, Scala, Python o R. pudiendo ser, según el programa, hasta 100 veces
más rápido en memoria o 10 veces más en disco que Hadoop MapReduce.

Lenguaje R
R es un lenguaje de programación y entorno de software para cálculo
estadístico y gráficos. El lenguaje R es de los más usados por los estadistas y
otros profesionales interesados en la minería de datos, la investigación
bioinformática y las matemáticas financieras.

R se parece más al lenguaje de las matemáticas que a otros lenguajes de


programación, lo que puede ser un inconveniente para los programadores a la
hora de elegir programar en R para temas de Big Data. Lo que está claro es
que si eliges usar R podrás disponer de una gran cantidad de librerías creadas
por la comunidad de R y otras tantas herramientas de altísima calidad (por
ejemplo, RStudio).

Python
Python es un lenguaje avanzado de programación con la ventaja de ser
relativamente fácil de usar para usuarios que no estén familiarizados con la
informática de manera profesional, pero que necesitan trabajar con análisis de
datos (estadistas, biólogos, físicos, lingüistas…)

Es una herramienta para Big Data muy eficiente, en parte debido a la gran
comunidad existente, por lo que Python dispone de muchas librerías ya hechas
por otros usuarios.

Sin embargo, tiene en su contra que no es un lenguaje muy rápido en su


ejecución, por lo que suele ser empleado para tareas de integración o tareas
donde no haya cálculos pesados.

2.2.8 Ventajas del Big Data


Mejora en la toma de decisiones
En la denominada como “Era de los datos”, éstos son considerados ya
como el nuevo petróleo ¿Qué implica esto? Disponer de un gran volumen de
datos estructurados que se puedan interpretar ayuda a las organizaciones a
poder tomar una decisión.

Feedback a tiempo real


Incluso en los momentos en los que es necesario tomar una decisión
inmediata, el Big Data es un arma muy poderosa puesto que permite recibir y
procesar los datos a tiempo real y contar con la información necesaria
rápidamente. El Big Data es por encima de todo una tecnología ágil y veloz que
permite permite por ejemplo obtener información a tiempo real del lanzamiento
de un producto o el resultado de una estrategia.

Conocimiento del mercado


El conocimiento del mercado en el que se opera puede ayudar no solo a
la toma de decisiones, sino también a la localización de posibles oportunidades
mediante el tratamiento de estos datos estructurados y comparables. También
puede ayudar a predecir posibles escenarios e incluso a conocer mejor a los
consumidores, mediante un análisis segmentado.

Tecnología del presente y del futuro


La tecnología del Big Data está en constante evolución y todo apunta a
que jugará un papel todavía más importante en la toma de decisiones futuras.
Por ello, cada vez son más las organizaciones que afrontan el reto de la
transformación digital por lo que los profesionales de Business Intelligence se
convirtieron en uno de los perfiles más demandados en 2017 según Adecco
Professional.

Desventajas
Ataques informáticos
Dado el valor de esta información, las empresas que cuentan con un
sistema de Big Data disponen igualmente de la tecnología más puntera en
seguridad puesto que el hackeo de estos datos puede suponer una importante
crisis para su corporación. Esto significa que mucha de esa información se
puede llegar a ver alterada y violada. Estas empresas si se pierde o se altera la
información se pierde un activo importante para la empresa.

Pérdida de privacidad
Debido que constantemente toda nuestra generación de datos ésta
siendo estudiada por las empresas esto hace que se puede llegar a perder
privacidad. No obstante hasta ahora esos datos solamente les pertenecen a las
empresas.

Mucha volatilidad
Los datos cambian rápidamente y eso hace que tengan una validez muy
corta. Para solucionarlo necesitamos un poder de procesamiento muy alto.

Si no lo hacemos bien, el procesamiento y análisis basado en estos datos


puede producir conclusiones erróneas, que pueden llevar a cometer errores en
la toma de decisiones.

No existen estándares de calidad de datos unificados. En 1987 la


Organización Internacional de Normalización (ISO) publicó las normas ISO
9000 para garantizar la calidad de productos y servicios. Sin embargo, el
estudio de los estándares de calidad de los datos no comenzó hasta los años
noventa, y no fue hasta 2011 cuando ISO publicó las normas de calidad de
datos ISO 8000.

Big Data en el Gobierno


El gobierno de Argentina busca mejorar la gestión con Big Data, y para
eso creó un Observatorio Nacional de Big Data en el ámbito de la Secretaría de
Tecnologías de Ia Información y las Comunicaciones con el objeto de conocer y
analizar las demandas de la población, como insumo para el diseño y la
implementación de las políticas públicas.
Asimismo, se informó que entre sus funciones estará la de "elaborar un
plan de seguimiento de la opinión pública, recabar información sobre las
demandas de los ciudadanos, evaluar el nivel de conocimiento de las políticas
del Gobierno, y generar información cuantitativa para la implementación de
medidas", ente otras cosas.

Además por el enorme desarrollo, potencia y capacidad de interrelación


de los diversos recursos involucrados, permite anticiparse a acontecimientos
futuros y, en algunos casos, predecirlos con escaso margen de error

Los datos se han convertido en un valor añadido, convirtiéndose en un


activo clave, similar a las categorías clásicas de los recursos humanos y
financieros, dando lugar a innovaciones en la tecnología, el desarrollo de
nuevas herramientas y nuevas habilidades

El buen uso de los datos puede traer oportunidades a sectores


tradicionales de la actividad económica y social, como transporte, salud,
educación, agroindustria, seguridad, etc., transformando además las industrias
de servicios. La gestión y el análisis de datos masivos resultan en una mejor
gestión en términos de eficiencia y eficacia, principios fundamentales de la
administración pública, generando, además de un mayor y mejor servicio al
ciudadano, un ahorro sustancial en costes, derivado de un mejor
aprovechamiento de los recursos.

Las organizaciones policiales, por su actividad diaria, generan,


almacenan y procesan grandes cantidades de datos, en el ámbito de los
macrodatos (Big Data). Desgraciadamente no siempre disponen de las
tecnologías y técnicas que permiten obtener un valor añadido. Esta es una de
las conclusiones a las que llega Alexander Bab PNP en su informe Macrodatos
y trabajo policial. Una valoración de las necesidades, expectativas y
prioridades de los cuerpos de seguridad [británicos], publicado por el Instituto
de Servicios Reales Unificados para los Estudios de Defensa y Seguridad
(RUSI por sus siglas en inglés).
El autor destaca que la investigación relacionada con los macrodatos
es prolífica, pero existe una falta de estudios sobre el uso en el trabajo policial
en el Reino Unido. BabPNP intenta contribuir a llenar este vacío. Su
investigación empezó con una revisión de la documentación (tanto académica
como institucional) de las estrategias policiales y de los informes del sector
privado sobre la utilización de los datos por la policía. A continuación entrevistó
a 25 trabajadores de cuatro cuerpos policiales (entre policías y personal de
apoyo) y 5 expertos de los sectores tecnológico y académico. Finalmente,
condujo un grupo de trabajo con representantes de cinco cuerpos policiales, así
como del Ministerio del Interior, de la Academia Superior de Policía y del
ámbito universitario.

Los dos grandes problemas que identifica el investigador son la falta de


un espacio único donde guardar e ir a recuperar los datos y la ausencia de
una tecnología que dé sentido a los datos. También destaca cuatro ámbitos
prioritarios en los que la tecnología relacionada con los macrodatos se puede
aplicar al trabajo policial:
 Aprovechar los mapas de predicción de delincuencia para destinar a
las patrullas allí donde hay mayor probabilidad de que sucedan los delitos.
 Utilizar la analítica predictiva para identificar los riesgos asociados a
determinadas personas, tanto potenciales autores como potenciales
víctimas.
 Utilizar la analítica avanzada para intentar aprovechar todo el potencial
de los sistemas de grabación de imagen (circuitos de videovigilancia) y de
los datos de los sistemas de reconocimiento automático de matrículas.
 Aplicar la tecnología de los macrodatos a las fuentes de datos
abiertos, para obtener un mejor conocimiento de algunos problemas de
delincuencia.

El autor plantea 14 recomendaciones dirigidas a cuerpos policiales y


responsables de seguridad; a los organismos nacionales (Ministerio del Interior,
Academia Superior de Policía y Police ICT Company), y a desarrolladores de
software, incluyendo tres futuras líneas de investigación.

Las propuestas de Bab PNP que pueden resultar más relevantes de cara
a las ciencias sociales son:

 Priorizar la exploración de la potencialidad del software de los mapas


destinados a hacer predicción.
 Utilizar los datos nacionales, no solo los locales, cuando se quiera
predecir los riesgos asociados a individuos.
 Incluir en todas las aplicaciones de datos un registro que permita
documentar cualquier cambio realizado en el conjunto de datos.
 Profundizar en la investigación sobre el software de predicción de la
delincuencia para poder generar modelos de predicción por segmentos
de calle.
 Explorar los usos potenciales de la modelización del terreno en base al
riesgo (RTM) para identificar las áreas donde hay mayor riesgo de sufrir
delitos.
 Explorar el uso de matrices de daños para valorar los daños causados por
diferentes tipos de delitos.

Big Data (opiniones en redes sociales)

Las redes sociales se han introducido recientemente en la vida de


muchas personas que antes eran ajenas al fenómeno de Internet. No es
extraño oír hablar por la calle de Facebook y no necesariamente entre los más
jóvenes. La extraordinaria capacidad de comunicación y de poner en contacto a
las personas que tienen las redes ha provocado que un gran número de
personas las esté utilizando con fines muy distintos. Se utilizan para encontrar
y entablar diálogo con amistades perdidas tiempo atrás, para debatir sobre los
temas más variados, apoyar causas de todo tipo, organizar encuentros de
amigos, ex-compañeros de estudios o para dar a conocer congresos y
conferencias, a través de los cuales no sólo se dan detalles sobre el encuentro,
sino que las personas pueden confirmar su asistencia o ausencia al evento. El
mundo educativo no puede permanecer ajeno ante éstos fenómenos sociales
que están cambiando la forma de comunicación entre las personas. El sistema
educativo trabaja fundamentalmente con información, carecería de sentido
utilizar sistemas de transmisión y publicación de la misma basada en aquellos
que se utilizaban a principios y mediados del siglo XX sin incorporar aquello
que la sociedad ya está usando como parte de su vida cotidiana. La educación
debe formar las personas para aquello que serán y en lo que trabajarán dentro
de diez años
Capítulo III: Marco Metodológico

Las técnicas e instrumentos que se utilizaron para la recolección de la


información fueron: Encuesta / Cuestionario

Plan de Recolección de Información

Plan de Recolección de Información


Para la recolección de la información se realizaron las siguientes actividades:
 Determinar el servicio académico a ser analizado
 Diseño de la Encuesta online
 Invitación enviada usando el mail institucional
 Aplicación del instrumento vía web

Plan de Procesamiento de Información


Los datos recogidos se transforman con los siguientes procedimientos.

Análisis de los Resultados


Los datos obtenidos de la investigación fueron ordenados y procesados,
mediante el análisis, para luego ser valorados, mediante la utilización de
estadística descriptiva, con cuadros y gráficos, en las cuales constan los
respectivos análisis e interpretación tomando en consideración los objetivos de
las interrogantes y el marco teórico. A continuación se detalla los resultados
obtenidos en la encuesta.

PREGUNTA 1. ¿Cree que el big data al almacenar grandes volúmenes de


información puede generar información para toma de decisiones policiales?

Tabla 1: Pregunta 1
Alternativas Frecuencias Porcentajes
SI 255 68,00%
NO 120 32,00%
TOTAL 375 100,00%

Análisis
De un total de 375 personas que llenaron la encuesta, un 68% opina que el big
data al almacenar grandes volúmenes de información SI puede generar
información para toma de decisiones policiales, mientas que un 32% indican
que NO.

Interpretación
Conforme a los datos obtenidos se puede decir que la mayoría de los usuarios
opinan que el big data al almacenar grandes volúmenes de información SI
puede generar información para toma de decisiones policiales, sin embargo, el
número que indican que NO es bastante representativo, lo cual puede deberse
al desconocimiento técnico del tema de Big Data.
PREGUNTA 2. ¿Cree que las redes sociales son un mecanismo adecuado
para la captura masiva de comentarios que no se vean atados a un criterio de
quien publica?

Tabla 2: Pregunta 2
Alternativas Frecuencias Porcentajes
SI 227 60,50%
NO 148 39,50%
TOTAL 375 100,00%

Análisis
De las 375 personas que se les aplico la encuesta, un 60.5% opina que las
redes sociales SI son un mecanismo adecuado para la captura de información
a través de los comentarios y opiniones que hacer en la red, mientas que un
39.5% indican que NO.

Interpretación
Según los datos obtenidos se puede interpretar que la mayoría de las personas
opinan que las redes sociales son un medio adecuado para levantar
información basadas en las opiniones que dejan en un tema propuesto,
además que estas opiniones son libres y no se someten a criterios sesgados
que suelen esconderse en otros instrumentos de aplicación hacia los usuarios.
PREGUNTA 3. ¿Posee usted una cuenta en la red social Facebook?

Tabla 3: Pregunta 3

Alternativas Frecuencias Porcentajes


SI 375 100,00%
NO 0 0,00%
TOTAL 375 100,00%

Análisis
De las 375 personas que se les aplico la encuesta, todos contestan que poseen
una cuenta de Facebook. Es decir el 100% de las personas que se les aplica el
instrumento dicen que SI tienen una cuenta activa, frente a un 0% que dice que
NO.

Interpretación
A través de los datos obtenidos se puede verificar que la totalidad de las
personas a quienes se les aplico la encuesta poseen una cuenta en la red
social de Facebook, lo que se puede interpretar como una ventaja para el
presente proyecto ya que los usuarios de los servicios TI de la PNP tienen un
acceso diario a las publicaciones que se le hace acerca de los servicios en
oferta y pueden opinar libremente de los mismos.
PREGUNTA 4. ¿Cree que los servicios académicos basados en tecnologías de
la información de la PNP son suficientes?

Tabla 4: Pregunta 4

Alternativas Frecuencias Porcentajes


SI 9 2,40%
NO 366 97,60%
TOTAL 375 100,00%

Análisis
De las 375 personas que se les aplico la encuesta, un 2,4% contestan que los
servicios académicos basados en tecnologías de la información de la PNP SI
son suficientes. Mientras un 97,6% indican que no son suficientes.

Interpretación
A través de los datos obtenidos se puede indicar la mayoría de las personas
dicen que los servicios académicos basados en tecnologías que oferta la PNP
NO son suficientes para satisfacer la demanda de los usuarios, lo que hace
pensar que se debe continuar mejorando o aumentando los mismos.
PREGUNTA 5. ¿Piensa que el uso masivo de información afecta a los
sistemas informáticos?

Tabla 5: Pregunta 5

Alternativas Frecuencias Porcentajes


SI 167 44,50%
NO 208 55,50%
TOTAL 375 100,00%

Análisis
De las 375 personas que se les aplico la encuesta, un 44,5% contestan que el
uso masivo de la información SI afecta a los sistemas informáticos de la PNP.
Mientras un 55,5% indican que NO afectan.

Interpretación
A través de los datos obtenidos se puede indicar la mayoría de las personas
entienden que el uso masivo de información afecta a los sistemas informáticos,
de tal forma que a través de esta pregunta nos podemos dar cuenta el
conocimiento técnico que poseen los encuestados, con la finalidad de saber el
criterio a la hora de haberles aplicado la encuesta.
PREGUNTA 6. ¿Conoce los servicios académicos basados en tecnología que
oferta la PNP?

Tabla 6: Pregunta 6

Alternativas Frecuencias Porcentajes


SI 306 81,60%
NO 69 18,40%
TOTAL 375 100,00%

Análisis
De las 375 personas que se les aplico la encuesta, un 81,6% contestan que SI
conocen los servicios académicos ofertados por la PNP. Mientras un 18,4%
indican que NO los conocen.

Interpretación
Por medio de las respuestas obtenidas a esta pregunta se puede indicar que la
mayoría de personas encuestadas conoce los servicios académicos ofertados
por la PNP en base a tecnologías de la información y una importante minoría
no conoce de estos servicios, lo que hace pensar que se debe llevar una
campaña informativa para que los usuarios conozcan.
Capítulo IV: Conclusiones y Recomendaciones

4.1 Conclusiones
El Big Data ayuda a la recolección de datos, procesamiento y estudio de
datos que producen los usuarios en el día a día. Esto se puede hacer en
tiempo real para ayudar a la toma de decisiones. Esta información se
puede usar en diferentes áreas como la medicina, los negocios, el
turismo, la publicidad e inclusive el gobierno. Esto no solamente surgió
en los últimos tiempos sino que fue una evolución de los grandes
algoritmos matemáticos y Big Data no es solamente la única forma de
procesamiento sino en el mercado existen diferentes.

Esto, en gran medida es así: el término se comienza a utilizar de forma


generalizada a finales de los años 90 y el boom llega con los avances
experimentados en campos como internet, dispositivos móviles y
conexión y especialmente la nube.

Como sabemos la información es un activo principal de las empresas,


los gobiernos, y en todo ámbito es necesaria para brindar una
experiencia de total satisfacción Como futuros profesionales debemos
estudiar y comprender estas tecnologías que poco a poco están siendo
utilizadas en el mercado y no conocerlas puede hacer que quedemos
afuera de esta revolución de procesamiento de datos.
4.2 Recomendaciones
Tomar la gran cantidad de opiniones y estados pronunciados por los
usuarios de acuerdo a un determinado tema expuesto en la red social de
la PNP para viabilizar de manera adecuada las deficiencias y bondades
detectadas por las opiniones emitidas.

Generar por parte de los administradores del Sitio Oficial de la Red


social, paulatinamente temas o publicaciones, que permitan generar
miles de opiniones para poder seguir capturando evidencias del
pensamiento libre de los usuarios.

Automatizar el proceso de clasificación de las opiniones para cualquier


tipo de publicación que se realice en Facebook, mediante una
metodología para el análisis semántico del big data.
BIBLIOGRAFÍA

Manovich, Lev (2012). “Trending: the promises and the challenges of big social
data”. En: Gold, Matthew (Ed.). Debates in the digital humanities,
Minneapolis: U. Minnesota Press, pp. 460-475.
Mayer-Schönberger, Viktor; Cukier, Kenneth (2013). Big data. La revolución de
los datos masivos. Madrid: Turner Publications.
M. Castells: La era de la información. Economía, sociedad y cultura, 3 vols.,
Alianza, Madrid, 1997.
Daniel Hopenhayn: «Martín Hilbert, experto en redes digitales: ‘Obama y Trump
usaron el Big Data para lavar cerebros’» en The Clinic Online,
19/1/2017.
Los beneficios del Big Data vs riesgos https://sinapsis.agency/los-beneficios-
del-big-data-vs-riesgos/

Big Data: ¿En qué consiste? Su importancia, desafíos y


gobernabilidadhttps://www.powerdata.es/big-data#bigdata-3

Big Data: Ventajas y desventajas https://postparaprogramadores.com/big-data-


ventajas-desventajas/
Las ventajas y los peligros del Big Data https://medium.com/opini%C3%B3n-
con-foro/las-ventajas-y-los-peligros-de-la-bigdata-d84b1401d10a

Hechos evidencia y decisiones y si el gobierno usara Big Data


https://www.cronista.com/brandstrategy/Hechos-evidencia-y-
decisiones-y-si-elgobierno-usara-Big-Data-20180627-0085.html

Analisis de Big Data


https://searchdatacenter.techtarget.com/es/definicion/Analisis-de-big-
data
ANEXOS

También podría gustarte