¡Te damos la bienvenida a Scribd!

RDDs

Cargado por

0% encontró este documento útil (0 votos)

10 vistas8 páginas

Un RDD es una colección de datos tolerante a fallos que puede operar en paralelo. Los RDDs son la principal abstracción de datos en Spark y se suelen crear a partir de archivos HDFS. Usan evaluación perezosa, manteniendo transformaciones en un DAG que se resuelve cuando se lanza una acción. SparkContext especifica el acceso al cluster y SparkConf contiene información sobre la aplicación.

Descripción original:

Derechos de autor

Formatos disponibles

PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

10 vistas8 páginas

RDDs

Cargado por

Daniel Vera

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 8

Buscar dentro del documento

RDD

Resilient Distributed Datasets

1.
¿Qué es un RDD?
“
Es una colección de elementos
tolerante a fallos que es capaz
de operar en paralelo.
Características principales:

▸ Es la principal abstracción de datos en

Spark.
▸ Los RDDs están particionados en los
nodos del cluster.
▸ Se suelen crear a partir de un fichero del
HDFS.
▸ Usan la evaluación perezosa.
Evaluación perezosa

▸ Los RDDs usan evaluación perezosa en

sus transformaciones.
▸ Mantiene todas las transformaciones en
un DAG.
▸ Cuando se lanza una acción, se resuelve
el grafo.
2.
SparkConf y
SparkContext
SparkConf y SparkContext

▸ El objeto SparkContext especifica como

vamos a acceder a nuestro cluster.
▸ El objeto SparkConf contiene la
información sobre nuestra aplicación.
¡GRACIAS!
¿Preguntas?
@AbrahamReqMes

También podría gustarte

Diseño de arquitecturas .NET orientadas a microservicios
De Everand
Diseño de arquitecturas .NET orientadas a microservicios
Ramón Serrano Valero
Calificación: 3 de 5 estrellas
3/5 (1)
Java 2: Manual de Usuario y Tutorial. 5ª Edición
De Everand
Java 2: Manual de Usuario y Tutorial. 5ª Edición
Agustín Froufe Quintas
Aún no hay calificaciones
Actividad Sumativa - Control 2 - Attempt Review
Documento5 páginas
Actividad Sumativa - Control 2 - Attempt Review
Camila Vidal Jara
Aún no hay calificaciones
Actividad 2
Documento16 páginas
Actividad 2
Daniel Villafañe
100% (1)
Introducción A Spark
Documento14 páginas
Introducción A Spark
Güendi Tejerina
Aún no hay calificaciones
2020 - Clase Virtual 11 - Hadoop Vs Spark
Documento17 páginas
2020 - Clase Virtual 11 - Hadoop Vs Spark
Flavio Tridico
Aún no hay calificaciones
Hadoop y Su Ecosistema
Documento9 páginas
Hadoop y Su Ecosistema
200300611
Aún no hay calificaciones
1 - Introducción Spark Curso BIT (Medio)
Documento25 páginas
1 - Introducción Spark Curso BIT (Medio)
Deogracias Plaud
Aún no hay calificaciones
Análisis de Datos Con Apache Spark
Documento66 páginas
Análisis de Datos Con Apache Spark
sil
Aún no hay calificaciones
Clase 4 - Herramientas Big Data Nov 15
Documento31 páginas
Clase 4 - Herramientas Big Data Nov 15
anamar.prilop
Aún no hay calificaciones
3 - Spark DS y Topología Spark Curso BIT
Documento36 páginas
3 - Spark DS y Topología Spark Curso BIT
Deogracias Plaud
Aún no hay calificaciones
Spark Cluster Computing With Working Sets
Documento6 páginas
Spark Cluster Computing With Working Sets
Anibal Ignacio Ventura
Aún no hay calificaciones
Zaharia en Es
Documento7 páginas
Zaharia en Es
Alex gugol
Aún no hay calificaciones
Resumen TASD - 2do Parcial
Documento17 páginas
Resumen TASD - 2do Parcial
German Jugo
Aún no hay calificaciones
Ponentes Core
Documento21 páginas
Ponentes Core
Guillermo Rambla
Aún no hay calificaciones
PDF Definido
Documento25 páginas
PDF Definido
Alejandro Correal
Aún no hay calificaciones
2 - Trabajando Con RDDs Spark Curso BIT (CasiFin)
Documento27 páginas
2 - Trabajando Con RDDs Spark Curso BIT (CasiFin)
Deogracias Plaud
Aún no hay calificaciones
Ecosistema Spark Intro
Documento87 páginas
Ecosistema Spark Intro
sil
Aún no hay calificaciones
Resumen Spark
Documento2 páginas
Resumen Spark
Jair Francesco Hc
Aún no hay calificaciones
Requisitos Hardware Big Data
Documento4 páginas
Requisitos Hardware Big Data
oscar calsina laura
Aún no hay calificaciones
SMR SI UT3.02 - RAIDs NAS SAN SMART CABINAS 33pags
Documento33 páginas
SMR SI UT3.02 - RAIDs NAS SAN SMART CABINAS 33pags
julioluengo05
Aún no hay calificaciones
1.1 Introducción A Spark
Documento23 páginas
1.1 Introducción A Spark
abel
0% (1)
Estudio de Spark, Pig, Kafka y Hive para Hadoop
Documento21 páginas
Estudio de Spark, Pig, Kafka y Hive para Hadoop
jesus alamilla
Aún no hay calificaciones
Spark
Documento20 páginas
Spark
Fredy Johel Peña Alvarez
Aún no hay calificaciones
Teoria M4
Documento41 páginas
Teoria M4
Luis Molina Reinoso
Aún no hay calificaciones
Clase 2
Documento12 páginas
Clase 2
maximiliano espinoza
Aún no hay calificaciones
Presentacion Curso Databricks
Documento27 páginas
Presentacion Curso Databricks
Leonardo Chavez
Aún no hay calificaciones
Taller de Aplicaciones Web
Documento61 páginas
Taller de Aplicaciones Web
caroarias911492
Aún no hay calificaciones
Spark y DAG - 075005
Documento6 páginas
Spark y DAG - 075005
toloka5654
Aún no hay calificaciones
4 (P3) - Pair RDDs Spark Curso BIT
Documento35 páginas
4 (P3) - Pair RDDs Spark Curso BIT
Deogracias Plaud
Aún no hay calificaciones
Tema 1
Documento27 páginas
Tema 1
Gustavo Ortega
Aún no hay calificaciones
PDF Cluster DRBD
Documento6 páginas
PDF Cluster DRBD
Francisco Lopez
Aún no hay calificaciones
Taller Big Data
Documento6 páginas
Taller Big Data
rocky alberto
Aún no hay calificaciones
S201. Hadoop
Documento30 páginas
S201. Hadoop
Luis Cruz
Aún no hay calificaciones
Tema Discos Raid-2021
Documento18 páginas
Tema Discos Raid-2021
Adrian Laime
Aún no hay calificaciones
04 Arquitecturas Big Data
Documento23 páginas
04 Arquitecturas Big Data
Esteban
100% (1)
Arreglos de Discos (RAID)
Documento6 páginas
Arreglos de Discos (RAID)
Samantha Ortega
Aún no hay calificaciones
Arreglo de Discos
Documento6 páginas
Arreglo de Discos
Yvelit Ore Rojas
Aún no hay calificaciones
Introduccion A Hadoop UV ES
Documento61 páginas
Introduccion A Hadoop UV ES
cristivenvargas
Aún no hay calificaciones
TD0803 Gestion RAID
Documento5 páginas
TD0803 Gestion RAID
Rodrigo Lopez
Aún no hay calificaciones
Sesion3 HDFS
Documento18 páginas
Sesion3 HDFS
Aaron Olivera Torres
Aún no hay calificaciones
Spark Definicion
Documento44 páginas
Spark Definicion
Jota Cartes
Aún no hay calificaciones
Implementando Azureredis Cache Netcore 2.2
Documento12 páginas
Implementando Azureredis Cache Netcore 2.2
Frank Daniel Illanes Guillen
Aún no hay calificaciones
Conocimientos Previos Aplicaciones Web
Documento39 páginas
Conocimientos Previos Aplicaciones Web
Anderson Sh
Aún no hay calificaciones
Workshop Cassandra
Documento19 páginas
Workshop Cassandra
Ignacio
Aún no hay calificaciones
4 - HDFS
Documento8 páginas
4 - HDFS
kinyo12
Aún no hay calificaciones
RAID App Web
Documento43 páginas
RAID App Web
Sadidmonsalve
100% (2)
Alta Disponibilidad-Drbd PDF
Documento35 páginas
Alta Disponibilidad-Drbd PDF
unpcarlos
Aún no hay calificaciones
Grid y Cluster
Documento3 páginas
Grid y Cluster
Jorge Sanchez
Aún no hay calificaciones
BI&BD - Cap6 MapReduce
Documento15 páginas
BI&BD - Cap6 MapReduce
Adrian Arias
Aún no hay calificaciones
04 Lab1 - Ejercicios de Prolog
Documento58 páginas
04 Lab1 - Ejercicios de Prolog
Gol D Roger
Aún no hay calificaciones
Arreglos de Discos
Documento5 páginas
Arreglos de Discos
rayli enmanuel castro brito
Aún no hay calificaciones
Bases de Datos en Aws
Documento96 páginas
Bases de Datos en Aws
Brian Bolivar
Aún no hay calificaciones
Apache Spark
Documento11 páginas
Apache Spark
lquichim
Aún no hay calificaciones
WP RAID Es
Documento14 páginas
WP RAID Es
MM Cv
Aún no hay calificaciones
Sistemas Raid
Documento44 páginas
Sistemas Raid
Milene Megumi PORTAL CARHUAZ
Aún no hay calificaciones
Trabajo de Investigacion RAID
Documento18 páginas
Trabajo de Investigacion RAID
jorgeamigo2
Aún no hay calificaciones
Arreglos de Discos
Documento11 páginas
Arreglos de Discos
almamartinez27
Aún no hay calificaciones
Sistemas Gestores de Bases de Datos
Documento11 páginas
Sistemas Gestores de Bases de Datos
Michel Onofre Cortez
Aún no hay calificaciones
Aprende a Programar con Java
De Everand
Aprende a Programar con Java
Ángel Arias
Calificación: 3.5 de 5 estrellas
3.5/5 (3)