0 calificaciones0% encontró este documento útil (0 votos)
7 vistas6 páginas
Este documento contiene tres talleres sobre herramientas de Big Data impartidos en la Universidad Agraria del Ecuador. Los talleres cubren temas como gestión de datos, análisis de datos, entrega de datos y procesamiento híbrido. En cada taller, los estudiantes deben responder preguntas de opción múltiple sobre diferentes herramientas y tecnologías de Big Data como Apache Hadoop, Spark, Kafka y más.
Este documento contiene tres talleres sobre herramientas de Big Data impartidos en la Universidad Agraria del Ecuador. Los talleres cubren temas como gestión de datos, análisis de datos, entrega de datos y procesamiento híbrido. En cada taller, los estudiantes deben responder preguntas de opción múltiple sobre diferentes herramientas y tecnologías de Big Data como Apache Hadoop, Spark, Kafka y más.
Este documento contiene tres talleres sobre herramientas de Big Data impartidos en la Universidad Agraria del Ecuador. Los talleres cubren temas como gestión de datos, análisis de datos, entrega de datos y procesamiento híbrido. En cada taller, los estudiantes deben responder preguntas de opción múltiple sobre diferentes herramientas y tecnologías de Big Data como Apache Hadoop, Spark, Kafka y más.
FACULTAD DE CIENCIAS AGRARIAS DR. JACOBO BUCARAM ORTIZ
PROGRAMA REGIONAL DE ENSEÑAMZAS DR. JACOBO BUCARAM ORTIZ TALLER HERRAMIENTAS DE BIG DATA - GESTIÓN DE DATOS NOMBRE:_____________________________________________________
1. ¿Qué es Apache Hadoop en el contexto de Big Data?
Respuesta correcta: b) Un marco de trabajo para el procesamiento distribuido de grandes conjuntos de datos 2. ¿Cuál es el propósito principal de Apache Spark en el ecosistema de Big Data? Respuesta correcta: b) Procesar y analizar datos de manera distribuida en memoria 3. En el contexto de bases de datos NoSQL, ¿cuál es la característica principal de MongoDB? Respuesta correcta: c) Almacena datos en documentos flexibles basados en JSON 4. ¿Qué función cumple Apache Kafka en la gestión de datos en tiempo real? Respuesta correcta: b) Facilita la transmisión de datos en tiempo real entre aplicaciones 5. ¿Cuál es el propósito de Apache Flink en el procesamiento de datos en tiempo real? Respuesta correcta: b) Procesar datos de manera distribuida en memoria 6. ¿Qué es Apache Cassandra en el contexto de bases de datos NoSQL? Respuesta correcta: c) Una base de datos distribuida altamente escalable y tolerante a fallos 7. ¿Cuál es la función principal de Apache Sqoop en un entorno de Big Data? Respuesta correcta: b) Transferir datos entre sistemas de almacenamiento relacionales y Hadoop 8. En la gestión de datos en tiempo real, ¿qué es Apache Storm? Respuesta correcta: c) Un marco de trabajo para procesar datos en tiempo real 9. ¿Cuál es el propósito de Apache Hive en un entorno de Big Data? Respuesta correcta: c) Facilitar el procesamiento de datos mediante consultas SQL 10. En el procesamiento de datos en tiempo real, ¿qué función cumple Apache Samza? Respuesta correcta: c) Procesar datos en memoria de manera distribuida 11. ¿Qué es Apache NiFi en la gestión de datos en Big Data? Respuesta correcta: c) Una herramienta para la ingesta, procesamiento y distribución de datos 12. En la gestión de datos en tiempo real, ¿qué es Apache Beam? Respuesta correcta: c) Un sistema de procesamiento de datos unificado para lotes y transmisiones 13. ¿Qué caracteriza a un sistema de bases de datos distribuidas como Amazon DynamoDB? Respuesta correcta: b) Escalabilidad horizontal y alta disponibilidad 14. En la gestión de datos en tiempo real, ¿qué es Apache Flume? Respuesta correcta: b) Una herramienta para la ingesta y distribución de datos de registro 15. ¿Cuál es el papel de Apache Zeppelin en el análisis de datos en Big Data? Respuesta correcta: d) Proporcionar un entorno de análisis interactivo y colaborativo
UNIVERSIDAD AGRARIA DEL ECUADOR
FACULTAD DE CIENCIAS AGRARIAS DR. JACOBO BUCARAM ORTIZ PROGRAMA REGIONAL DE ENSEÑAMZAS DR. JACOBO BUCARAM ORTIZ TALLER HERRAMIENTAS DE BIG DATA - ANÁLISIS NOMBRE:_____________________________________________________
1. ¿Cuál es el propósito principal de Apache Spark en el análisis de Big
Data? Respuesta correcta: b) Procesar y analizar datos de manera distribuida en memoria 2. En el ámbito del análisis de datos, ¿qué caracteriza a Apache Hive? Respuesta correcta: a) Una base de datos relacional de código abierto 3. ¿Qué función cumple Apache Hadoop MapReduce en el análisis de Big Data? Respuesta correcta: c) Procesar grandes conjuntos de datos de manera distribuida 4. En el análisis de datos, ¿qué caracteriza a Apache Flink? Respuesta correcta: a) Procesar datos en memoria de manera distribuida 5. ¿Cuál es el propósito de Apache Drill en el análisis de Big Data? Respuesta correcta: b) Realizar análisis ad-hoc de datos sin importar el formato 6. En el análisis de datos, ¿qué caracteriza a Apache Kylin? Respuesta correcta: c) Proporcionar un motor de análisis OLAP para consultas rápidas en grandes conjuntos de datos 7. ¿Cuál es el papel de Apache Zeppelin en el análisis de datos en Big Data? Respuesta correcta: d) Proporcionar un entorno de análisis interactivo y colaborativo 8. En el análisis de datos, ¿qué caracteriza a Apache Mahout? Respuesta correcta: c) Un framework de aprendizaje automático para el análisis de datos 9. ¿Cuál es la función principal de Apache Pig en el análisis de datos en entornos de Big Data? Respuesta correcta: c) Procesar grandes conjuntos de datos utilizando un lenguaje de secuencias 10. ¿Qué caracteriza a Apache Ambari en el contexto del análisis de Big Data? Respuesta correcta: b) Gestionar y monitorear clústeres de Big Data 11. En el análisis de datos, ¿qué caracteriza a Apache Atlas? Respuesta correcta: d) Proporcionar metadatos y gobernanza en entornos de Big Data 12. ¿Cuál es la función principal de Apache Impala en el análisis de datos en tiempo real? Respuesta correcta: b) Realizar análisis ad-hoc de datos basado en SQL 13. ¿Qué caracteriza a Apache Phoenix en el análisis de Big Data? Respuesta correcta: d) Proporcionar una capa SQL sobre bases de datos NoSQL en HBase 14. En el análisis de datos, ¿qué es Apache Drill? Respuesta correcta: b) Realizar análisis ad-hoc de datos sin importar el formato 15. ¿Cuál es el propósito de Apache Piggybank en el análisis de Big Data con Apache Pig? Respuesta correcta: c) Extender las funcionalidades de Apache Pig con un conjunto de funciones predefinidas UNIVERSIDAD AGRARIA DEL ECUADOR FACULTAD DE CIENCIAS AGRARIAS DR. JACOBO BUCARAM ORTIZ PROGRAMA REGIONAL DE ENSEÑAMZAS DR. JACOBO BUCARAM ORTIZ TALLER HERRAMIENTAS DE BIG DATA - ENTREGA DE DATOS NOMBRE:_____________________________________________________
1. ¿Cuál es el propósito principal de Apache NiFi en el contexto de entrega
de datos en Big Data? Respuesta correcta: c) Gestionar la ingesta, procesamiento y distribución de datos 2. En el ámbito de entrega de datos, ¿qué caracteriza a Apache Kafka? Respuesta correcta: c) Una plataforma para transmitir datos en tiempo real entre sistemas 3. ¿Qué función cumple Apache Flume en la entrega de datos en entornos de Big Data? Respuesta correcta: b) Ingerir y transportar datos de manera eficiente hacia sistemas de almacenamiento 4. En la entrega de datos, ¿qué es Apache Sqoop? Respuesta correcta: d) Una herramienta para transferir datos entre sistemas de almacenamiento relacionales y Hadoop 5. ¿Cuál es la función principal de Apache Storm en la entrega de datos en tiempo real? Respuesta correcta: b) Facilitar la transmisión de datos en tiempo real entre aplicaciones 6. En la entrega de datos, ¿qué caracteriza a Apache Beam? Respuesta correcta: a) Un sistema de procesamiento de datos unificado para lotes y transmisiones 7. ¿Cuál es el propósito de Apache Flink en la entrega de datos en tiempo real? Respuesta correcta: d) Procesar datos de manera distribuida en memoria 8. En la entrega de datos, ¿qué caracteriza a Apache Zeppelin? Respuesta correcta: a) Proporcionar un entorno de análisis interactivo y colaborativo 9. ¿Qué función cumple Apache Samza en la entrega de datos en tiempo real? Respuesta correcta: c) Facilitar la transmisión de datos en tiempo real entre aplicaciones 10. En la entrega de datos, ¿qué es Apache NiFi Registry? Respuesta correcta: d) Un registro centralizado para la gestión de flujos de datos en Apache NiFi 11. ¿Cuál es la función principal de Apache Kafka Connect en la entrega de datos en tiempo real? Respuesta correcta: a) Ingerir y transportar datos de manera eficiente hacia sistemas de almacenamiento 12. En la entrega de datos, ¿qué caracteriza a Apache Camel? Respuesta correcta: d) Un framework de integración para la ruta y procesamiento de mensajes 13. ¿Cuál es la función de Apache Kylin en la entrega de datos en Big Data? Respuesta correcta: d) Proporcionar un motor de análisis OLAP para consultas rápidas en grandes conjuntos de datos 14. En la entrega de datos, ¿qué caracteriza a Apache Avro? Respuesta correcta: b) Un formato de datos serializado y compacto 15. ¿Cuál es el propósito de Apache Ranger en la entrega de datos en entornos de Big Data? Respuesta correcta: d) Proporcionar seguridad y políticas de acceso en entornos de Big Data UNIVERSIDAD AGRARIA DEL ECUADOR FACULTAD DE CIENCIAS AGRARIAS DR. JACOBO BUCARAM ORTIZ PROGRAMA REGIONAL DE ENSEÑAMZAS DR. JACOBO BUCARAM ORTIZ TALLER PROCESAMIENTO HÍBRIDO NOMBRE:_____________________________________________________
1. ¿Qué caracteriza al procesamiento híbrido en términos de arquitectura
de sistemas? Respuesta correcta: b) Combina el uso de procesadores centralizados y distribuidos 2. En procesamiento híbrido, ¿cuál es la ventaja principal de combinar CPU y GPU? Respuesta correcta: b) Mejora la eficiencia energética 3. ¿Cuál es la función principal de una Unidad de Procesamiento Central (CPU) en un sistema híbrido? Respuesta correcta: b) Ejecutar instrucciones de propósito general y controlar el sistema 4. En un sistema híbrido, ¿para qué se utiliza comúnmente una Unidad de Procesamiento Gráfico (GPU)? Respuesta correcta: c) Procesar cálculos paralelos y gráficos 5. ¿Qué beneficios puede ofrecer el uso de procesadores acelerados por hardware en un sistema híbrido? Respuesta correcta: b) Reducción del consumo de energía y aumento del rendimiento 6. En términos de sistemas distribuidos, ¿cómo puede contribuir el procesamiento híbrido a la eficiencia del sistema? Respuesta correcta: d) Distribuyendo tareas entre CPU y GPU para un rendimiento óptimo 7. En procesamiento híbrido, ¿cómo se denomina comúnmente al uso de unidades de procesamiento especializadas junto con la CPU y GPU? Respuesta correcta: c) Heterogeneidad de cómputo 8. ¿Qué significa el término "coherencia de caché" en el contexto de sistemas híbridos? Respuesta correcta: c) Asegurar la consistencia de los datos entre la memoria principal y la caché 9. En un sistema híbrido, ¿qué es un "coprocesador"? Respuesta correcta: c) Una unidad de procesamiento independiente que colabora con la CPU principal 10. ¿Cuál es el objetivo principal de la "computación heterogénea" en sistemas híbridos? Respuesta correcta: c) Aprovechar diferentes tipos de unidades de procesamiento para tareas específicas 11. En sistemas híbridos, ¿por qué puede ser beneficioso utilizar FPGAs (Field-Programmable Gate Arrays)? Respuesta correcta: c) Para realizar cálculos paralelos y personalizar la lógica de procesamiento 12. En términos de procesamiento híbrido, ¿qué es la "migración de tareas"? Respuesta correcta: b) El cambio de tareas entre diferentes unidades de procesamiento para optimizar el rendimiento 13. ¿Qué es un "procesador asimétrico" en el contexto de sistemas híbridos? Respuesta correcta: b) Un procesador que tiene núcleos con capacidades diferentes 14. ¿Cuál es la función de un "controlador de tareas" en sistemas híbridos? Respuesta correcta: b) Sincronizar la comunicación entre la CPU y GPU 15. En procesamiento híbrido, ¿por qué es importante la "escalabilidad"? Respuesta correcta: b) Para adaptarse al aumento o disminución de la carga de trabajo de manera eficiente