Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Alumno: [Beatriz Campos Flores]
Semestre: [Séptimo]
Grupo: [6751]
APACHE SPARK
Introducción
La catapulta de Leonardo, una herramienta genial. Permite con
poco esfuerzo enviar un objeto pesado a gran distancia.
2
PLATAFORMA SPARK:
3
¿Cuándo surge?
4
¿Cuándo surge Spark? (cont.)
5
¿Cómo surge?
En una entrevista, el Profesor Ion Stoica nos cuenta la historia:
(
https://soundcloud.com/oreilly-radar/apache-sparks-journey
)-
6
from-academia-to-industry
PLATAFORMA SPARK:
Este proyecto escolar inicial, derivó en la construcción del sistema Mesos como un
sistema de manejo de un cluster, en el que colaboran Benjamin Hindman, Andy
Konwinski, y Matei Zaharia.
7
PLATAFORMA SPARK:
Uno de los tesistas era Benjamin Hindman, quien fue contratado por Twitter
y donde fue uno de los promotores de BigData en Twitter.
8
PLATAFORMA SPARK:
9
10 PLATAFORMA SPARK:
https://medium.com/s-c-a-l-e/amplab-s-co-creator-on-where-big-data-is-he
aded-and-why-spark-is-so-big-f0c0da2f7c0f
Antecedentes de Spark
Antes del mundo Spark surgieron una gran diversidad de contribuciones y sistemas del
cómo manejar datos para su búsqueda y análisis
Bibliotecas Spark
http://spark.apache.org/docs/latest/mllib-guide.html
28
Resumen
Hoy la plataforma Spark y los algoritmos de Aprendizaje
Automatizado incluidos en sus bibliotecas ofrecen a la
Ciencia de Datos (Data Science) una Catapulta para
promover la generación de aplicaciones de Analíticos de
Grandes Volúmenes de Datos
(BigData Analytics),
en particular en la rama de Aprendizaje Automatizado en Tiempo Real
utilizando la componente Spark Streaming y SQL Spark
para la extracción de información con enunciados SQL.