Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTEGRANTES:
Cotrado Montalico Juan Joel
Ticona Gutierrez Jean Carlos
Frores Teves Jim Meru
Herrera Villanueva Walker Alexander
Chipana Ramos Carlos Enrique
DOCENTE:
Ing. Donia Alizandra Ruelas Acero
SEMESTRE:
VIII
PUNO – PERÚ
2021
CASO DE ESTUDIO
1. ACERCA DE NETFLIX
1.3. Volumen
Lo que hace Spark Streaming almacena los datos utilizando una gran variedad de
algoritmos y funciones como reduce, join, window o map y los procesa como una
secuencia de RDDs, que es la unidad de información que consume el Spark Core.
De esta forma, el core procesa los datos de una forma normal y liviana, liberando
así al Spark Streaming para que sólo tenga que encargarse de crear y coordinar los
RDDs. De esta forma consigue que el procesamiento del streaming sea casi en
tiempo real.
Pinterest
A través de una ETL similar, Pinterest puede aprovechar Spark Streaming
para obtener una visión inmediata de cómo los usuarios de todo el mundo
están interactuando con los Pines, en tiempo real. Como resultado, Pinterest
puede hacer recomendaciones más relevantes a medida que las personas
navegan por el sitio y ven Pines relacionados para ayudarlos a seleccionar
recetas, determinar qué productos comprar o planificar viajes a varios
destinos.
1.5. Velocidad
Para ser una plataforma de código abierto, tiene una gran velocidad la cual permite
a los programadores realizar operaciones sobre un gran volumen de datos en
clústeres de forma rápida, con tolerancia a fallos y en tiempo real. El
almacenamiento de datos en memoria caché hace que la iteración de los algoritmos
de machine learning con los datos sea más eficiente, trabajar en memoria y no en
disco mejora el rendimiento (BBVA, 2015).
Referencias
BBVA. (25 de Septiembre de 2015). BBVA Api_Market. Obtenido de
https://www.bbvaapimarket.com/es/mundo-api/apache-spark-las-ventajas-de-usar-al-
nuevo-rey-de-big-data/