0 calificaciones0% encontró este documento útil (0 votos)
8 vistas5 páginas
El documento describe un desafío de big data que es procesar grandes cantidades de datos, y la solución de mover el procesamiento a la ubicación donde se almacenan los datos usando procesamiento paralelo y tecnologías como MapReduce. Distribuye la lógica de la tarea entre máquinas de almacenamiento para procesar datos en paralelo y consolidar resultados.
El documento describe un desafío de big data que es procesar grandes cantidades de datos, y la solución de mover el procesamiento a la ubicación donde se almacenan los datos usando procesamiento paralelo y tecnologías como MapReduce. Distribuye la lógica de la tarea entre máquinas de almacenamiento para procesar datos en paralelo y consolidar resultados.
El documento describe un desafío de big data que es procesar grandes cantidades de datos, y la solución de mover el procesamiento a la ubicación donde se almacenan los datos usando procesamiento paralelo y tecnologías como MapReduce. Distribuye la lógica de la tarea entre máquinas de almacenamiento para procesar datos en paralelo y consolidar resultados.
de datos. Mover grandes cantidades de datos desde el almacenamiento al procesador consumiría una enorme capacidad de red y ahogaría la red. Solución: Mueva el procesamiento al lugar donde se almacenan los datos. Distribuya la lógica de la tarea en todoel conjunto de máquinas donde se almacenan los datos. Las máquinas trabajan en paralelo en los datos que se les asignan. Un proceso de seguimiento consolidalos resultados intermedios y entrega los resultados finales. MapReduce, inventado por Google, es la tecnología más conocidaparael procesamiento paralelo. Desafíos y Soluciones de Big Data Roles y “Skills” en Big Data Hadoop Workshop Tools