Base de Datos

UNIVERSIDAD AGRARIA DEL ECUADOR
FACULTAD DE CIENCIAS AGRARIAS DR. JACOBO BUCARAM ORTIZ

PROGRAMA REGIONAL DE ENSEÑAMZAS DR. JACOBO BUCARAM ORTIZ
TALLER HERRAMIENTAS DE BIG DATA - GESTIÓN DE DATOS
NOMBRE:_____________________________________________________
1. ¿Qué es Apache Hadoop en el contexto de Big Data?

 Respuesta correcta: b) Un marco de trabajo para el
procesamiento distribuido de grandes conjuntos de datos
2. ¿Cuál es el propósito principal de Apache Spark en el ecosistema de Big
Data?
 Respuesta correcta: b) Procesar y analizar datos de manera
distribuida en memoria
3. En el contexto de bases de datos NoSQL, ¿cuál es la característica
principal de MongoDB?
 Respuesta correcta: c) Almacena datos en documentos flexibles
basados en JSON
4. ¿Qué función cumple Apache Kafka en la gestión de datos en tiempo
real?
 Respuesta correcta: b) Facilita la transmisión de datos en tiempo
real entre aplicaciones
5. ¿Cuál es el propósito de Apache Flink en el procesamiento de datos en
tiempo real?
 Respuesta correcta: b) Procesar datos de manera distribuida en
memoria
6. ¿Qué es Apache Cassandra en el contexto de bases de datos NoSQL?
 Respuesta correcta: c) Una base de datos distribuida altamente
escalable y tolerante a fallos
7. ¿Cuál es la función principal de Apache Sqoop en un entorno de Big
Data?
 Respuesta correcta: b) Transferir datos entre sistemas de
almacenamiento relacionales y Hadoop
8. En la gestión de datos en tiempo real, ¿qué es Apache Storm?
 Respuesta correcta: c) Un marco de trabajo para procesar datos
en tiempo real
9. ¿Cuál es el propósito de Apache Hive en un entorno de Big Data?
 Respuesta correcta: c) Facilitar el procesamiento de datos
mediante consultas SQL
10. En el procesamiento de datos en tiempo real, ¿qué función cumple
Apache Samza?
 Respuesta correcta: c) Procesar datos en memoria de manera
distribuida
11. ¿Qué es Apache NiFi en la gestión de datos en Big Data?
 Respuesta correcta: c) Una herramienta para la ingesta,
procesamiento y distribución de datos
12. En la gestión de datos en tiempo real, ¿qué es Apache Beam?
 Respuesta correcta: c) Un sistema de procesamiento de datos
unificado para lotes y transmisiones
13. ¿Qué caracteriza a un sistema de bases de datos distribuidas como
Amazon DynamoDB?
 Respuesta correcta: b) Escalabilidad horizontal y alta
disponibilidad
14. En la gestión de datos en tiempo real, ¿qué es Apache Flume?
 Respuesta correcta: b) Una herramienta para la ingesta y
distribución de datos de registro
15. ¿Cuál es el papel de Apache Zeppelin en el análisis de datos en Big
Data?
 Respuesta correcta: d) Proporcionar un entorno de análisis
interactivo y colaborativo

TALLER HERRAMIENTAS DE BIG DATA - ANÁLISIS
NOMBRE:_____________________________________________________
1. ¿Cuál es el propósito principal de Apache Spark en el análisis de Big

Data?
 Respuesta correcta: b) Procesar y analizar datos de manera
distribuida en memoria
2. En el ámbito del análisis de datos, ¿qué caracteriza a Apache Hive?
 Respuesta correcta: a) Una base de datos relacional de código
abierto
3. ¿Qué función cumple Apache Hadoop MapReduce en el análisis de Big
Data?
 Respuesta correcta: c) Procesar grandes conjuntos de datos de
manera distribuida
4. En el análisis de datos, ¿qué caracteriza a Apache Flink?
 Respuesta correcta: a) Procesar datos en memoria de manera
distribuida
5. ¿Cuál es el propósito de Apache Drill en el análisis de Big Data?
 Respuesta correcta: b) Realizar análisis ad-hoc de datos sin
importar el formato
6. En el análisis de datos, ¿qué caracteriza a Apache Kylin?
 Respuesta correcta: c) Proporcionar un motor de análisis OLAP
para consultas rápidas en grandes conjuntos de datos
7. ¿Cuál es el papel de Apache Zeppelin en el análisis de datos en Big
Data?
 Respuesta correcta: d) Proporcionar un entorno de análisis
8. En el análisis de datos, ¿qué caracteriza a Apache Mahout?
 Respuesta correcta: c) Un framework de aprendizaje automático
para el análisis de datos
9. ¿Cuál es la función principal de Apache Pig en el análisis de datos en
entornos de Big Data?
 Respuesta correcta: c) Procesar grandes conjuntos de datos
utilizando un lenguaje de secuencias
10. ¿Qué caracteriza a Apache Ambari en el contexto del análisis de Big
Data?
 Respuesta correcta: b) Gestionar y monitorear clústeres de Big
Data
11. En el análisis de datos, ¿qué caracteriza a Apache Atlas?
 Respuesta correcta: d) Proporcionar metadatos y gobernanza en
entornos de Big Data
12. ¿Cuál es la función principal de Apache Impala en el análisis de datos en
tiempo real?
 Respuesta correcta: b) Realizar análisis ad-hoc de datos basado
en SQL
13. ¿Qué caracteriza a Apache Phoenix en el análisis de Big Data?
 Respuesta correcta: d) Proporcionar una capa SQL sobre bases de
datos NoSQL en HBase
14. En el análisis de datos, ¿qué es Apache Drill?
 Respuesta correcta: b) Realizar análisis ad-hoc de datos sin
importar el formato
15. ¿Cuál es el propósito de Apache Piggybank en el análisis de Big Data
con Apache Pig?
 Respuesta correcta: c) Extender las funcionalidades de Apache
Pig con un conjunto de funciones predefinidas
TALLER HERRAMIENTAS DE BIG DATA - ENTREGA DE DATOS
NOMBRE:_____________________________________________________
1. ¿Cuál es el propósito principal de Apache NiFi en el contexto de entrega

de datos en Big Data?
 Respuesta correcta: c) Gestionar la ingesta, procesamiento y
distribución de datos
2. En el ámbito de entrega de datos, ¿qué caracteriza a Apache Kafka?
 Respuesta correcta: c) Una plataforma para transmitir datos en
tiempo real entre sistemas
3. ¿Qué función cumple Apache Flume en la entrega de datos en entornos
de Big Data?
 Respuesta correcta: b) Ingerir y transportar datos de manera
eficiente hacia sistemas de almacenamiento
4. En la entrega de datos, ¿qué es Apache Sqoop?
 Respuesta correcta: d) Una herramienta para transferir datos
entre sistemas de almacenamiento relacionales y Hadoop
5. ¿Cuál es la función principal de Apache Storm en la entrega de datos en
tiempo real?
 Respuesta correcta: b) Facilitar la transmisión de datos en tiempo
6. En la entrega de datos, ¿qué caracteriza a Apache Beam?
 Respuesta correcta: a) Un sistema de procesamiento de datos
unificado para lotes y transmisiones
7. ¿Cuál es el propósito de Apache Flink en la entrega de datos en tiempo
real?
 Respuesta correcta: d) Procesar datos de manera distribuida en
memoria
8. En la entrega de datos, ¿qué caracteriza a Apache Zeppelin?
 Respuesta correcta: a) Proporcionar un entorno de análisis
9. ¿Qué función cumple Apache Samza en la entrega de datos en tiempo
real?
 Respuesta correcta: c) Facilitar la transmisión de datos en tiempo
10. En la entrega de datos, ¿qué es Apache NiFi Registry?
 Respuesta correcta: d) Un registro centralizado para la gestión de
flujos de datos en Apache NiFi
11. ¿Cuál es la función principal de Apache Kafka Connect en la entrega de
datos en tiempo real?
 Respuesta correcta: a) Ingerir y transportar datos de manera
eficiente hacia sistemas de almacenamiento
12. En la entrega de datos, ¿qué caracteriza a Apache Camel?
 Respuesta correcta: d) Un framework de integración para la ruta
y procesamiento de mensajes
13. ¿Cuál es la función de Apache Kylin en la entrega de datos en Big Data?
 Respuesta correcta: d) Proporcionar un motor de análisis OLAP
para consultas rápidas en grandes conjuntos de datos
14. En la entrega de datos, ¿qué caracteriza a Apache Avro?
 Respuesta correcta: b) Un formato de datos serializado y
compacto
15. ¿Cuál es el propósito de Apache Ranger en la entrega de datos en
entornos de Big Data?
 Respuesta correcta: d) Proporcionar seguridad y políticas de
acceso en entornos de Big Data
TALLER PROCESAMIENTO HÍBRIDO
NOMBRE:_____________________________________________________
1. ¿Qué caracteriza al procesamiento híbrido en términos de arquitectura

de sistemas?
 Respuesta correcta: b) Combina el uso de procesadores
centralizados y distribuidos
2. En procesamiento híbrido, ¿cuál es la ventaja principal de combinar
CPU y GPU?
 Respuesta correcta: b) Mejora la eficiencia energética
3. ¿Cuál es la función principal de una Unidad de Procesamiento Central
(CPU) en un sistema híbrido?
 Respuesta correcta: b) Ejecutar instrucciones de propósito
general y controlar el sistema
4. En un sistema híbrido, ¿para qué se utiliza comúnmente una Unidad de
Procesamiento Gráfico (GPU)?
 Respuesta correcta: c) Procesar cálculos paralelos y gráficos
5. ¿Qué beneficios puede ofrecer el uso de procesadores acelerados por
hardware en un sistema híbrido?
 Respuesta correcta: b) Reducción del consumo de energía y
aumento del rendimiento
6. En términos de sistemas distribuidos, ¿cómo puede contribuir el
procesamiento híbrido a la eficiencia del sistema?
 Respuesta correcta: d) Distribuyendo tareas entre CPU y GPU
para un rendimiento óptimo
7. En procesamiento híbrido, ¿cómo se denomina comúnmente al uso de
unidades de procesamiento especializadas junto con la CPU y GPU?
 Respuesta correcta: c) Heterogeneidad de cómputo
8. ¿Qué significa el término "coherencia de caché" en el contexto de
sistemas híbridos?
 Respuesta correcta: c) Asegurar la consistencia de los datos entre
la memoria principal y la caché
9. En un sistema híbrido, ¿qué es un "coprocesador"?
 Respuesta correcta: c) Una unidad de procesamiento
independiente que colabora con la CPU principal
10. ¿Cuál es el objetivo principal de la "computación heterogénea" en
sistemas híbridos?
 Respuesta correcta: c) Aprovechar diferentes tipos de unidades
de procesamiento para tareas específicas
11. En sistemas híbridos, ¿por qué puede ser beneficioso utilizar FPGAs
(Field-Programmable Gate Arrays)?
 Respuesta correcta: c) Para realizar cálculos paralelos y
personalizar la lógica de procesamiento
12. En términos de procesamiento híbrido, ¿qué es la "migración de
tareas"?
 Respuesta correcta: b) El cambio de tareas entre diferentes
unidades de procesamiento para optimizar el rendimiento
13. ¿Qué es un "procesador asimétrico" en el contexto de sistemas
híbridos?
 Respuesta correcta: b) Un procesador que tiene núcleos con
capacidades diferentes
14. ¿Cuál es la función de un "controlador de tareas" en sistemas híbridos?
 Respuesta correcta: b) Sincronizar la comunicación entre la CPU y
GPU
15. En procesamiento híbrido, ¿por qué es importante la "escalabilidad"?
 Respuesta correcta: b) Para adaptarse al aumento o disminución
de la carga de trabajo de manera eficiente

Base de Datos

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Base de Datos

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD AGRARIA DEL ECUADOR

FACULTAD DE CIENCIAS AGRARIAS DR. JACOBO BUCARAM ORTIZ

1. ¿Qué es Apache Hadoop en el contexto de Big Data?

UNIVERSIDAD AGRARIA DEL ECUADOR

1. ¿Cuál es el propósito principal de Apache Spark en el análisis de Big

1. ¿Cuál es el propósito principal de Apache NiFi en el contexto de entrega

1. ¿Qué caracteriza al procesamiento híbrido en términos de arquitectura

También podría gustarte