Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DE AREQUIPA
PNP/ CHARCANI
"EXCELENCIA"
ASIGNATURA: ___________________________________________________
TEMA:
“____________________________________________”
ALUMNO: ____________________________________________
DOCENTE: __________________________________________
AREQUIPA – PERÚ
2022
DEDICATORIA
Introducción
Somos seres que dejamos nuestras huellas por donde andamos. En todo
momento del día dejamos un rastro de datos. En últimos tiempos aparece el
Big Data como una opción de recolección y análisis de datos para procesar
estos datos y poder utilizarlos.
Big Data nació con el objetivo de cubrir unas necesidades no satisfechas por
las tecnologías existentes, como es el almacenamiento y tratamiento de
grandes volúmenes de datos que poseen unas características muy concretas
definidas como las tres V’s. Una característica importante acerca de los datos,
es que son considerados como la fuente de la verdad, es decir, no se alteran
durante su tratamiento. La tecnología subyacente en Big Data es Apache
Hadoop, en la actualidad cuenta con ocho años de historia.
Dedicatoria............................................................................................................2
Introducción..........................................................................................................3
Índice....................................................................................................................4
Capítulo I: Definición del problema.......................................................................5
1.1 Realidad Problemática................................................................................5
1.2 Planteamiento del Problema......................................................................5
1.2.1 Problema Principal..................................................................................5
1.2.2 Problemas Específicos............................................................................5
1.3 Objetivos.....................................................................................................6
1.3.1 Objetivo General......................................................................................6
1.3.2 Objetivos Específicos..............................................................................6
1.4 Justificación................................................................................................6
Capítulo II: Marco Teórico....................................................................................8
2.1 Antecedentes de la Investigación...............................................................8
2.2 Marco teórico..............................................................................................9
Capítulo III: Marco Metodológico........................................................................23
Capítulo IV: Conclusiones y Recomendaciones................................................30
4.1 Conclusiones............................................................................................30
4.2 Recomendaciones....................................................................................31
BIBLIOGRAFÍA...................................................................................................32
ANEXOS.............................................................................................................33
Capítulo I: Definición del problema
1.1 Realidad Problemática
En la actualidad las redes sociales se han convertido en una fuente de
información importante para las empresas, que permiten el mejoramiento
continuo en base a críticas constructivas, de igual manera en el ámbito de
la educación día a día estamos rodeados de todo tipo de opiniones
favorables y desfavorables referentes a servicios que brinda la Policía
Nacional del Perú.
Proponer una solución para utilizar el Big Data como un recurso válido
que aporte a la clasificación de la calidad de servicios académicos de la
PNP.
1.4 Justificación.
La presente investigación se justifica porque la PNP está
desaprovechando los comentarios y opiniones emitidas directamente por
los usuarios primarios de sus servicios académicos, esto se da debido a
que no existe una herramienta adecuada para el tratamiento de las
opiniones vertidas en el Big Data, derivando que la valiosa información
contenida en el Big Data no sea explotada de forma adecuada por lo difícil
de su clasificación y manipulación del gran volumen de información
existente.
De allí que este trabajo, pretende brindar información válida, a los agentes
que toman las decisiones respecto a los servicios virtuales que brinda la
universidad. De allí, que es factible ya que se cuenta con la información
en la red social, que si bien es no estructurada, se propone una
metodología para estructurar la información en el Big Data.
Estas fuentes de datos pueden incluir registros del servidor web y datos
de seguimiento de clics en internet, informes de actividades sociales, medios
de comunicación, teléfonos móviles registros detallados de llamadas y la
información captada por los sensores.
Ahora con Big Data, todo esto se consigue en tiempo real y con cada
nueva actualización de nuestro repositorio de datos es posible ver los cambios
en las estadísticas inmediatamente.
2.2.3 Características
Se las conocían anteriormente como 3V y actualmente se ampliaron a 5V
de acuerdo a las nuevas necesidades.
Volumen: Una de las características principales volumen. Debido que
estamos hablamos de grandes cantidades de datos para captar y organizar
absolPNPmente toda la información que nos llega es esencial para tener
registros completos, y que las conclusiones que obtengamos sirvan
eficientemente a la hora de la toma de decisiones.
Valor: Trabajar con Big Data tiene que servir para aportar valor a la
sociedad, las empresas, los gobiernos, en definitiva, a las personas; todo el
proceso tiene que ayudar a impulsar el desarrollo, la innovación y la
competitividad, pero también mejorar la calidad de vida de las personas.
Hoy en día, toda la datos que generamos día a día sobre todos nuestros
gustos, compras, transacciones bancarias hasta los “me gusta” en redes
sociales son la materia de estudio del Big Data. Estos datos pueden ser de
diferente índole:
Business Intelligence
El término ‘Business Intelligence’, o inteligencia empresarial, se refiere al
uso de datos en una empresa para facilitar la toma de decisiones. Es un
conjunto de estrategias y herramientas enfocadas al análisis de datos de una
empresa mediante el análisis de datos existentes.
Todas las empresas pueden recopilar datos, datos relativos a ventas, a
compras, a inversiones, a tiempos. Miles de datos y variables pueden ser
estudiados y utilizados para tomar nuevas estrategias, conocer las fortalezas
propias, y por supuesto, las debilidades.
Hadoop
MongoDB
Dentro de las bases de datos NoSQL, probablemente una de las más
famosas sea MongoDB. Con un concepto muy diferente al de las bases de
datos relacionales, se está convirtiendo en una interesante alternativa para
almacenar los datos de nuestras aplicaciones.
Apache Spark
Apache Spark es un motor de procesamiento de datos de código abierto
realmente rápido.
Lenguaje R
R es un lenguaje de programación y entorno de software para cálculo
estadístico y gráficos. El lenguaje R es de los más usados por los estadistas y
otros profesionales interesados en la minería de datos, la investigación
bioinformática y las matemáticas financieras.
Python
Python es un lenguaje avanzado de programación con la ventaja de ser
relativamente fácil de usar para usuarios que no estén familiarizados con la
informática de manera profesional, pero que necesitan trabajar con análisis de
datos (estadistas, biólogos, físicos, lingüistas…)
Es una herramienta para Big Data muy eficiente, en parte debido a la gran
comunidad existente, por lo que Python dispone de muchas librerías ya hechas
por otros usuarios.
Desventajas
Ataques informáticos
Dado el valor de esta información, las empresas que cuentan con un
sistema de Big Data disponen igualmente de la tecnología más puntera en
seguridad puesto que el hackeo de estos datos puede suponer una importante
crisis para su corporación. Esto significa que mucha de esa información se
puede llegar a ver alterada y violada. Estas empresas si se pierde o se altera la
información se pierde un activo importante para la empresa.
Pérdida de privacidad
Debido que constantemente toda nuestra generación de datos ésta
siendo estudiada por las empresas esto hace que se puede llegar a perder
privacidad. No obstante hasta ahora esos datos solamente les pertenecen a las
empresas.
Mucha volatilidad
Los datos cambian rápidamente y eso hace que tengan una validez muy
corta. Para solucionarlo necesitamos un poder de procesamiento muy alto.
Las propuestas de Bab PNP que pueden resultar más relevantes de cara
a las ciencias sociales son:
Tabla 1: Pregunta 1
Alternativas Frecuencias Porcentajes
SI 255 68,00%
NO 120 32,00%
TOTAL 375 100,00%
Análisis
De un total de 375 personas que llenaron la encuesta, un 68% opina que el big
data al almacenar grandes volúmenes de información SI puede generar
información para toma de decisiones policiales, mientas que un 32% indican
que NO.
Interpretación
Conforme a los datos obtenidos se puede decir que la mayoría de los usuarios
opinan que el big data al almacenar grandes volúmenes de información SI
puede generar información para toma de decisiones policiales, sin embargo, el
número que indican que NO es bastante representativo, lo cual puede deberse
al desconocimiento técnico del tema de Big Data.
PREGUNTA 2. ¿Cree que las redes sociales son un mecanismo adecuado
para la captura masiva de comentarios que no se vean atados a un criterio de
quien publica?
Tabla 2: Pregunta 2
Alternativas Frecuencias Porcentajes
SI 227 60,50%
NO 148 39,50%
TOTAL 375 100,00%
Análisis
De las 375 personas que se les aplico la encuesta, un 60.5% opina que las
redes sociales SI son un mecanismo adecuado para la captura de información
a través de los comentarios y opiniones que hacer en la red, mientas que un
39.5% indican que NO.
Interpretación
Según los datos obtenidos se puede interpretar que la mayoría de las personas
opinan que las redes sociales son un medio adecuado para levantar
información basadas en las opiniones que dejan en un tema propuesto,
además que estas opiniones son libres y no se someten a criterios sesgados
que suelen esconderse en otros instrumentos de aplicación hacia los usuarios.
PREGUNTA 3. ¿Posee usted una cuenta en la red social Facebook?
Tabla 3: Pregunta 3
Análisis
De las 375 personas que se les aplico la encuesta, todos contestan que poseen
una cuenta de Facebook. Es decir el 100% de las personas que se les aplica el
instrumento dicen que SI tienen una cuenta activa, frente a un 0% que dice que
NO.
Interpretación
A través de los datos obtenidos se puede verificar que la totalidad de las
personas a quienes se les aplico la encuesta poseen una cuenta en la red
social de Facebook, lo que se puede interpretar como una ventaja para el
presente proyecto ya que los usuarios de los servicios TI de la PNP tienen un
acceso diario a las publicaciones que se le hace acerca de los servicios en
oferta y pueden opinar libremente de los mismos.
PREGUNTA 4. ¿Cree que los servicios académicos basados en tecnologías de
la información de la PNP son suficientes?
Tabla 4: Pregunta 4
Análisis
De las 375 personas que se les aplico la encuesta, un 2,4% contestan que los
servicios académicos basados en tecnologías de la información de la PNP SI
son suficientes. Mientras un 97,6% indican que no son suficientes.
Interpretación
A través de los datos obtenidos se puede indicar la mayoría de las personas
dicen que los servicios académicos basados en tecnologías que oferta la PNP
NO son suficientes para satisfacer la demanda de los usuarios, lo que hace
pensar que se debe continuar mejorando o aumentando los mismos.
PREGUNTA 5. ¿Piensa que el uso masivo de información afecta a los
sistemas informáticos?
Tabla 5: Pregunta 5
Análisis
De las 375 personas que se les aplico la encuesta, un 44,5% contestan que el
uso masivo de la información SI afecta a los sistemas informáticos de la PNP.
Mientras un 55,5% indican que NO afectan.
Interpretación
A través de los datos obtenidos se puede indicar la mayoría de las personas
entienden que el uso masivo de información afecta a los sistemas informáticos,
de tal forma que a través de esta pregunta nos podemos dar cuenta el
conocimiento técnico que poseen los encuestados, con la finalidad de saber el
criterio a la hora de haberles aplicado la encuesta.
PREGUNTA 6. ¿Conoce los servicios académicos basados en tecnología que
oferta la PNP?
Tabla 6: Pregunta 6
Análisis
De las 375 personas que se les aplico la encuesta, un 81,6% contestan que SI
conocen los servicios académicos ofertados por la PNP. Mientras un 18,4%
indican que NO los conocen.
Interpretación
Por medio de las respuestas obtenidas a esta pregunta se puede indicar que la
mayoría de personas encuestadas conoce los servicios académicos ofertados
por la PNP en base a tecnologías de la información y una importante minoría
no conoce de estos servicios, lo que hace pensar que se debe llevar una
campaña informativa para que los usuarios conozcan.
Capítulo IV: Conclusiones y Recomendaciones
4.1 Conclusiones
El Big Data ayuda a la recolección de datos, procesamiento y estudio de
datos que producen los usuarios en el día a día. Esto se puede hacer en
tiempo real para ayudar a la toma de decisiones. Esta información se
puede usar en diferentes áreas como la medicina, los negocios, el
turismo, la publicidad e inclusive el gobierno. Esto no solamente surgió
en los últimos tiempos sino que fue una evolución de los grandes
algoritmos matemáticos y Big Data no es solamente la única forma de
procesamiento sino en el mercado existen diferentes.
Manovich, Lev (2012). “Trending: the promises and the challenges of big social
data”. En: Gold, Matthew (Ed.). Debates in the digital humanities,
Minneapolis: U. Minnesota Press, pp. 460-475.
Mayer-Schönberger, Viktor; Cukier, Kenneth (2013). Big data. La revolución de
los datos masivos. Madrid: Turner Publications.
M. Castells: La era de la información. Economía, sociedad y cultura, 3 vols.,
Alianza, Madrid, 1997.
Daniel Hopenhayn: «Martín Hilbert, experto en redes digitales: ‘Obama y Trump
usaron el Big Data para lavar cerebros’» en The Clinic Online,
19/1/2017.
Los beneficios del Big Data vs riesgos https://sinapsis.agency/los-beneficios-
del-big-data-vs-riesgos/