Está en la página 1de 2

EVALUACION N°1 UNIDAD I FORMA

EVALUACIÓN (TIPO : ESCRITA ) A

SIGLA : BDY7101 NOMBRE ASIGNATURA: Big Data PROFESOR:

NOMBRE SECCIÓN
RUT FECHA

PUNTAJES Y NOTA / ESCALA DE EXIGENCIA (60%)

PUNTAJE TOTAL: 40 ptos. NOTA: 7.0 PUNTAJE OBTENIDO


PUNTAJE: 24 ptos. NOTA: 4.0 NOTA
APRENDIZAJES

INSTRUCCIONES GENERALES:

- Responda las preguntas de desarrollo en base al contenido visto en clases.


- Puede utilizar internet para complementar sus respuestas
- No se permite copiado y pegado desde ninguna de las fuentes desde donde se extrae la información, esto
será causal de puntaje 0.

PARTE 1 (40 Puntos)

INSTRUCCIÓN: Conteste cada pregunta, justificando su planteamiento.

1. ¿Qué es Hadoop y qué utilidad tiene en el mundo Big Data? (5 ptos.)

Hadoop es un entorno de trabajo de código abierto que nos ofrece múltiples facilidades al mundo del Big Data,
como almacenar una gran cantidad de datos de cualquier tipo, además, posee un gran poder de procesamiento,
lo cual nos permite poder manejar multiples tareas simultaneamente.

2. Nombre y explique 3 características que deben tener los datos para ser considerados Big Data (5 ptos.)

Volumen: El volumen hace referencia a la cantidad de datos generados, para ser considerados como big data, la
cantidad de datos debe ser aproximadamente de 30TB en adelante

Velocidad: La velocidad hace referencia a la frecuencia a la que los datos son generados, en el caso del big data,
los datos son generados de manera constante.

Variedad: En big data el tipo de dato es mucho mas que solo filas y columnas. Este puede abarcar distintos tipos
de datos tales como: video, audio, texto, imagenes, etc.

Escuela de Informática y telecomunicaciones - Carrera de ingeniería en informática.- Duoc UC sede Maipú


3. ¿Qué es y para qué sirve Apache Flume?(5 ptos.)

Apache Flume es un software que permite la colección, agregar y mover grandes cantidades de datos de manera
eficiente

4. ¿Qué es y para que sirve YARN?(5 ptos.)

5. ¿Cómo almacena los datos HDFS? Explique el flujo en detalle(10 ptos.)

6. Explique en que consisten los siguientes términos:(10 ptos.)

1. Computación Monolítica

2. Computación Distribuida

3. Apache Impala

Escuela de Informática y telecomunicaciones - Carrera de ingeniería en informática.- Duoc UC sede Maipú

También podría gustarte