Documentos de Académico
Documentos de Profesional
Documentos de Cultura
NOMBRE SECCIÓN
RUT FECHA
INSTRUCCIONES GENERALES:
Hadoop es un entorno de trabajo de código abierto que nos ofrece múltiples facilidades al mundo del Big Data,
como almacenar una gran cantidad de datos de cualquier tipo, además, posee un gran poder de procesamiento,
lo cual nos permite poder manejar multiples tareas simultaneamente.
2. Nombre y explique 3 características que deben tener los datos para ser considerados Big Data (5 ptos.)
Volumen: El volumen hace referencia a la cantidad de datos generados, para ser considerados como big data, la
cantidad de datos debe ser aproximadamente de 30TB en adelante
Velocidad: La velocidad hace referencia a la frecuencia a la que los datos son generados, en el caso del big data,
los datos son generados de manera constante.
Variedad: En big data el tipo de dato es mucho mas que solo filas y columnas. Este puede abarcar distintos tipos
de datos tales como: video, audio, texto, imagenes, etc.
Apache Flume es un software que permite la colección, agregar y mover grandes cantidades de datos de manera
eficiente
1. Computación Monolítica
2. Computación Distribuida
3. Apache Impala