Documentos de Académico
Documentos de Profesional
Documentos de Cultura
N°4
BUSINESS AND
❑ Alvinagorta Huanquis, Joel
CORPORATE
❑ Norabuena Asparrin, Smith
❑ Livia Fernández, Pool Temístocles
❑ Castillo Berrospi, Renzo Jose
❑ Gonzales Quinquilla, Cesar Jean Pierre
3.1¿Qué es Big Data ?
➔ importancia:
➔ Veracidad ➔ Valor
Almacenar y procesar grandes cantidades de datos Antes del Big Data, la calidad de los datos era un
requería inversiones significativas en infraestructura, problema común. Los datos a menudo estaban
como servidores y sistemas de almacenamiento. incompletos, desorganizados o contenían errores.
3.4 ¿Cuáles son las fases/pasos de una solución Big Data?
Aplicar técnicas de procesamiento y análisis de datos, Interpretar los resultados del análisis de datos y Implementar las acciones correspondientes basadas
como minería de datos, aprendizaje automático y extraer conocimientos relevantes para tomar en los resultados obtenidos y realizar un seguimiento
análisis estadístico, para descubrir patrones, decisiones informadas y responder a los objetivos continuo para evaluar y mejorar la solución de Big
tendencias y relaciones significativas en los datos. comerciales establecidos. Data en curso.
3.5¿Cuáles son los beneficios del Big Data ? 3.6¿Dónde se utiliza Big Data ?
Almacenar y procesar grandes cantidades de datos Antes del Big Data, la calidad de los datos era un El Big Data ha mejorado significativamente la
requería inversiones significativas en infraestructura, problema común. Los datos a menudo estaban capacidad de detectar fraudes y problemas de
como servidores y sistemas de almacenamiento. incompletos, desorganizados o contenían errores. seguridad
3.8 Explique cada una de las capas y el funcionamiento de los diferentes software existentes para cada capa, incluir la capa de Seguridad (y los software como Ranger,
otros), capas de Gobernanza (y los software como Atlas, otros) y cada Cloud de Big Data (y los software como Cloudera CDP, otros y como trabaja con entornos cloud
como Azure, AWS, Google, otros).
D
E
D
A
T
O
S
3.8 Explique cada una de las capas y el funcionamiento de los diferentes software existentes para cada capa, incluir la capa de Seguridad (y los software como Ranger,
otros), capas de Gobernanza (y los software como Atlas, otros) y cada Cloud de Big Data (y los software como Cloudera CDP, otros y como trabaja con entornos cloud
como Azure, AWS, Google, otros).
Visualización y
Reporting
Proveedor GCP
Proveedor AWS
Google Cloud
Almacenamiento
Storage
Amazon S3, Amazon
Almacenamiento
EBS, Amazon Glacier
Google Cloud
Procesamiento Dataproc, Google
BigQuery Amazon EMR, Amazon
Procesamiento
Redshift
Google Cloud
Análisis
Dataflow Amazon Athena,
Análisis
Amazon QuickSight
USO DEL BIG DATA PARA EL ANÁLISIS DE CDR CDR (Call Detail Record), es un registro que contiene información detallada
sobre las llamadas telefónicas realizadas en una red de
➔ Problema telecomunicaciones.
Es necesario analizar los CDR para extraer su gran valor. Pero los CDR
tienen un gran volumen, variedad de datos y alta velocidad de datos, ➔ Metodologia
mientras que los sistemas de telecomunicaciones actuales están diseñados
sin tener en cuenta estos problemas.
❏ IMSI
❏ SUBNO
❏ B-SUBNO
❏ CALL DURATION
➔ Resultados y conclusiones
El sistema gestor de base de datos que manejan actualmente se encuentra Herramienta de desarrollo Java SE Development Kit 8u121
en SQL SERVER 2008. Al recibir los respaldos de base de datos mes a mes
Primer sistema gestor de base Apache Cassandra 2.2
presentan problemas para la integración de dicha información. de datos
● Componentes de Hardware
Procesador CPU Intel i5 6gen 3.6 ghz Procesador CPU Intel i3 6gen 2.5 ghz
Almacenamiento Disco duro 1TB 7200 Almacenamiento Disco duro 320GB 7200
➔ Objetivo rpm rpm
Desarrollar e implementar un Sistema de Base de datos NoSQL que permita
optimizar la generación de reportes de servicios en la Dirección Regional
de Salud Ancash.
3.9 Describa una solución de Big Data en el sector telecomunicaciones y
otra en otro sector.
➔ Resultados
➔ Herramientas de desarrollo de software
❏ Herramientas CASE
3.10 Muestre la ejecución de la solución, real o demo.
➔ Creación de la base de datos
https://guide.couchdb.org/editions/1/es/ind
ex.html
Existe una escasez de profesionales con las El uso de Big Data plantea cuestiones éticas y de El manejo de grandes cantidades de datos
habilidades necesarias para trabajar con Big Data, gobernanza en relación con la privacidad, la personales plantea preocupaciones sobre la
como conocimientos en análisis de datos, transparencia y la equidad. privacidad y la seguridad.
programación, estadísticas y visualización de datos.