ApacheSpark-Virtualbox Ubuntu Docker

Este documento describe los pasos para configurar un clúster de Apache Spark usando contenedores Docker en Ubuntu. Explica cómo instalar Ubuntu, Docker y Apache Spark, y cómo crear nodos maestro y esclavos para formar un clúster distribuido de Spark capaz de ejecutar código Python.

Cargado por

jefersson padilla

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

86 vistas79 páginas

ApacheSpark-Virtualbox Ubuntu Docker

Cargado por

jefersson padilla

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Apache Spark

[VirtualBox+Ubuntu+Docker]
Guillermo Pizarro, gpizarro@ieee.org
Contenido
• Configuración de la máquina virtual VirtualBox.
• Instalación de Ubuntu Desktop 22.04.
• Instalación y configuración de Docker.
• Instalación y configuración del Apache Spark – Clúster.
• Ejercicio práctico.
Configuración de la
Máquina Virtual VirtualBox
Apache Spark
https://ubuntu.com/download/desktop
Configuración de la
Máquina Virtual
Apache Spark
Instalación y configuración de
Docker
Apache Spark
Instalación y configuración de
Apache Spark - Clúster
Apache Spark
Se crea el contenedor en Docker con el S.O. en
GNU/Linux en la distribución de Ubuntu, con
los siguientes parámetros:
-it → modo interactivo para trabajar con la
consola directamente.
--rm → para que se elimine el contenedor una
vez que se pare.
--memory → la memoria RAM máxima
asignada.
--cpus → número de procesadores a trabajar
con el contenedor.
Se crea una variable de entorno para que no
permita interacción; es decir, no pregunte a
cada momento al usuario que utilice el S.O. por
cada acción a realizar.
Se actualizan los paquetes del S.O.
Se instala el JDK de Java.
Se instala Python.
Se instala el editor de texto en consola nano.
Se crea otro contenedor con el S.O. GNU/Linux
en su distribución de Ubuntu.
Luego, se debe instalar los
siguientes paquetes (como en el
anterior contenedor):

apt install -y openjdk-8-jre

apt install -y python3
apt install -y nano
Desde el S.O. principal, donde se están
creando los contenedores se deben descargar
los archivos listenings.csv y genre.csv.
Descargar los archivos desde el Google Drive,
proporcionado en clases.
https://spark.apache.org/downloads.html
Copiar los archivos genre.csv, listenings.csv y
el directorio spark-3.3.0-bin-hadoop3 en los
contenedores recientemente creados, en la
carpeta /opt
Se verifica en el contenedor los archivos
copiados.
Se verifica en el contenedor los archivos
copiados.
Se levanta un servicio de Apache Spark como
Nodo maestro, en uno de los contenedores.
Se puede acceder http://172.17.0.3:8080/ para
verificar que el servicio se encuentra
levantado.
Se levanta un servicio de Apache Spark como
nodo esclavo, en uno de los contenedores,
direccionándolo hacia el nodo maestro.
Se puede visualizar el nodo esclavo que tiene
trabajando el nodo maestro.
Apache Spark – Clúster
Ejercicio
Apache Spark
Se puede ejecutar código en Python desde un
nodo esclavo.
Desde consola
• Se puede trabajar
desde consola, pero
en el nodo esclavo;
como ya se ha
hecho en otras
ocasiones (en una
instalación tipo
standalone).
Referencias Bibliográficas
• https://www.albertcoronado.com/2021/05/19/formacion-apache-
spark-como-montar-un-cluster-de-apache-spark/
• https://cloudcone.com/docs/article/how-to-install-docker-on-
ubuntu-22-04-20-04/
• https://www.youtube.com/watch?v=zm_bNxATuH0&t=270s

También podría gustarte

Ejecutar Apache Spark con Docker
Aún no hay calificaciones
Ejecutar Apache Spark con Docker
15 páginas
Configuración de Hadoop en AWS
Aún no hay calificaciones
Configuración de Hadoop en AWS
13 páginas
Instalación y Configuración de Big Data
Aún no hay calificaciones
Instalación y Configuración de Big Data
39 páginas
Instalación de Apache Spark
Aún no hay calificaciones
Instalación de Apache Spark
5 páginas
Crear clúster de servidores con Spark
100% (1)
Crear clúster de servidores con Spark
15 páginas
Laboratorio Docker 10 Octubre
Aún no hay calificaciones
Laboratorio Docker 10 Octubre
10 páginas
HDFS en Docker: Guía de Instalación
Aún no hay calificaciones
HDFS en Docker: Guía de Instalación
44 páginas
Realiza La Configuración de Servicios, Bases de Datos y Software en El Equipo Del Cliente GA10-220501097-AA5-EV01
Aún no hay calificaciones
Realiza La Configuración de Servicios, Bases de Datos y Software en El Equipo Del Cliente GA10-220501097-AA5-EV01
19 páginas
Realiza La Configuración de Servicios, Bases de Datos y Software en El Equipo Del Cliente Ga10-220501097-Aa5-Ev01
Aún no hay calificaciones
Realiza La Configuración de Servicios, Bases de Datos y Software en El Equipo Del Cliente Ga10-220501097-Aa5-Ev01
5 páginas
Configuración de Servicios en Ubuntu
Aún no hay calificaciones
Configuración de Servicios en Ubuntu
5 páginas
GA10-220501097-AA5-EV01 Realiza La Configuración de Servicios, Bases de Datos y Software en El Equipo Del Cliente
Aún no hay calificaciones
GA10-220501097-AA5-EV01 Realiza La Configuración de Servicios, Bases de Datos y Software en El Equipo Del Cliente
8 páginas
Modulo 3 Actividad de Proyecto Spark en Docker
Aún no hay calificaciones
Modulo 3 Actividad de Proyecto Spark en Docker
6 páginas
Taller - Vagrant - Docker Fabian Miño
Aún no hay calificaciones
Taller - Vagrant - Docker Fabian Miño
16 páginas
Realiza La Configuración de Servicios, Bases de Datos y Software en El Equipo Del Cliente GA10-220501097-AA5-EV01 (ADSO)
Aún no hay calificaciones
Realiza La Configuración de Servicios, Bases de Datos y Software en El Equipo Del Cliente GA10-220501097-AA5-EV01 (ADSO)
5 páginas
Instructivo Clúster Hadoop
Aún no hay calificaciones
Instructivo Clúster Hadoop
55 páginas
Despliegue Docker en AWS: Guía Práctica
Aún no hay calificaciones
Despliegue Docker en AWS: Guía Práctica
13 páginas
Configuración de Apache y MySQL en Docker
Aún no hay calificaciones
Configuración de Apache y MySQL en Docker
10 páginas
Prácticas de Big Data en VirtualBox
Aún no hay calificaciones
Prácticas de Big Data en VirtualBox
68 páginas
Guía de Docker para Sistemas Operativos
Aún no hay calificaciones
Guía de Docker para Sistemas Operativos
20 páginas
Comparativa: Docker vs Máquinas Virtuales
Aún no hay calificaciones
Comparativa: Docker vs Máquinas Virtuales
22 páginas
Introducción a Docker y Kubernetes
0% (1)
Introducción a Docker y Kubernetes
51 páginas
Introducción a Docker: Guía Completa
Aún no hay calificaciones
Introducción a Docker: Guía Completa
32 páginas
Guía de Instalación de Hadoop en Debian
Aún no hay calificaciones
Guía de Instalación de Hadoop en Debian
4 páginas
Guía de Kubernetes y Docker
Aún no hay calificaciones
Guía de Kubernetes y Docker
8 páginas
Manual de Docker Con Microservicios
Aún no hay calificaciones
Manual de Docker Con Microservicios
12 páginas
Manual Ambientes Docker y Laravel
Aún no hay calificaciones
Manual Ambientes Docker y Laravel
10 páginas
Configuración de Servicios TI
Aún no hay calificaciones
Configuración de Servicios TI
10 páginas
Instalar Docker en Debian: Guía Rápida
Aún no hay calificaciones
Instalar Docker en Debian: Guía Rápida
4 páginas
Despliegue Local de Docker en Laravel
Aún no hay calificaciones
Despliegue Local de Docker en Laravel
16 páginas
Instalación de Docker y Apache en Ubuntu
Aún no hay calificaciones
Instalación de Docker y Apache en Ubuntu
4 páginas
Ejercicios (1) - Docker. Aplicaciones Web. Bartolomé Sintes Marco.
Aún no hay calificaciones
Ejercicios (1) - Docker. Aplicaciones Web. Bartolomé Sintes Marco.
16 páginas
INSTALACIÓN
Aún no hay calificaciones
INSTALACIÓN
16 páginas
Introducción a Docker para Web Apps
Aún no hay calificaciones
Introducción a Docker para Web Apps
4 páginas
2 Despliegue de Una Aplicación - Docker
Aún no hay calificaciones
2 Despliegue de Una Aplicación - Docker
31 páginas
Laboratorio Cloud con Docker y VirtualBox
Aún no hay calificaciones
Laboratorio Cloud con Docker y VirtualBox
27 páginas
Guía Práctica de Docker: Contenedores y Más
100% (1)
Guía Práctica de Docker: Contenedores y Más
254 páginas
Configuración de Servicios en Ubuntu
Aún no hay calificaciones
Configuración de Servicios en Ubuntu
10 páginas
Seminario Avanzado en Ciencia de Datos
Aún no hay calificaciones
Seminario Avanzado en Ciencia de Datos
29 páginas
Instalación y Configuración de Docker en Linux
67% (3)
Instalación y Configuración de Docker en Linux
136 páginas
Unidad 5.1
Aún no hay calificaciones
Unidad 5.1
5 páginas
Unificación de Historias Clínicas con Blockchain
Aún no hay calificaciones
Unificación de Historias Clínicas con Blockchain
33 páginas
Docker: Solución a Incompatibilidades
100% (1)
Docker: Solución a Incompatibilidades
13 páginas
Instalación de Anaconda en Ubuntu 16.04
Aún no hay calificaciones
Instalación de Anaconda en Ubuntu 16.04
6 páginas
Guía SEO para Implementar Clúster Beowulf
100% (1)
Guía SEO para Implementar Clúster Beowulf
39 páginas
Guía de Docker para Principiantes
Aún no hay calificaciones
Guía de Docker para Principiantes
32 páginas
Guía de Instalación de Registro Cliente
Aún no hay calificaciones
Guía de Instalación de Registro Cliente
22 páginas
Requisitos para Desarrollo en Ubuntu 20.04
Aún no hay calificaciones
Requisitos para Desarrollo en Ubuntu 20.04
8 páginas
Preparar Un Ambiente de Desarrollo Python Docker - by Adamo Jordan Figueroa - Medium
Aún no hay calificaciones
Preparar Un Ambiente de Desarrollo Python Docker - by Adamo Jordan Figueroa - Medium
5 páginas
Clúster, Cloud y DevOps: Guía Básica
Aún no hay calificaciones
Clúster, Cloud y DevOps: Guía Básica
80 páginas
Guía para Crear y Usar Contenedores Docker
Aún no hay calificaciones
Guía para Crear y Usar Contenedores Docker
16 páginas
Singleton - Conexión A La BD
Aún no hay calificaciones
Singleton - Conexión A La BD
7 páginas
Virtualización y Contenedores Docker
Aún no hay calificaciones
Virtualización y Contenedores Docker
135 páginas
Introducción a Docker y Microservicios
Aún no hay calificaciones
Introducción a Docker y Microservicios
104 páginas
Guía de Ubuntu para Devs en Linux Mint
Aún no hay calificaciones
Guía de Ubuntu para Devs en Linux Mint
7 páginas
Guía Completa sobre Docker y Contenedores
Aún no hay calificaciones
Guía Completa sobre Docker y Contenedores
51 páginas
Docker Es
100% (3)
Docker Es
154 páginas
Configuración de Servidor Web en Ubuntu
Aún no hay calificaciones
Configuración de Servidor Web en Ubuntu
31 páginas
ATT SGH-I917 Cetus Focus Spanish User Manual
Aún no hay calificaciones
ATT SGH-I917 Cetus Focus Spanish User Manual
148 páginas
Material Formacion 3
Aún no hay calificaciones
Material Formacion 3
17 páginas
4.2.6 Laboratorio - Trabajando Con Archivos de Texto en La CLI
Aún no hay calificaciones
4.2.6 Laboratorio - Trabajando Con Archivos de Texto en La CLI
10 páginas
Guía SEACE para Contrataciones Públicas
100% (1)
Guía SEACE para Contrataciones Públicas
129 páginas
Informe Taller Inserción Laboral Informática
Aún no hay calificaciones
Informe Taller Inserción Laboral Informática
23 páginas
Manual Tornamesa
Aún no hay calificaciones
Manual Tornamesa
45 páginas
Adobe XD
Aún no hay calificaciones
Adobe XD
45 páginas
Instructivo Pagos Sifere Vep
Aún no hay calificaciones
Instructivo Pagos Sifere Vep
10 páginas
Normas y Evaluación del PAC en Computación
Aún no hay calificaciones
Normas y Evaluación del PAC en Computación
51 páginas
04-Procedimiento MINJUS-SGSI-PR-04 Respaldo y Restauración de La Informacion
Aún no hay calificaciones
04-Procedimiento MINJUS-SGSI-PR-04 Respaldo y Restauración de La Informacion
23 páginas
Mejora de Calidad en Laboratorios Clínicos
100% (1)
Mejora de Calidad en Laboratorios Clínicos
56 páginas
Escaneando Desde VFP
Aún no hay calificaciones
Escaneando Desde VFP
4 páginas
Excel - Hipervínculos
Aún no hay calificaciones
Excel - Hipervínculos
10 páginas
ENCUESTA
Aún no hay calificaciones
ENCUESTA
7 páginas
Reglamento del Laboratorio de Cómputo
Aún no hay calificaciones
Reglamento del Laboratorio de Cómputo
2 páginas
Software de Auditoría Interna
Aún no hay calificaciones
Software de Auditoría Interna
12 páginas
Instalación y Uso de Cup
Aún no hay calificaciones
Instalación y Uso de Cup
40 páginas
Inkling Manual ES
Aún no hay calificaciones
Inkling Manual ES
48 páginas
Taller de Nivelación T&I Grado 3F
Aún no hay calificaciones
Taller de Nivelación T&I Grado 3F
3 páginas
Guía de Mantenimiento de Computadoras
Aún no hay calificaciones
Guía de Mantenimiento de Computadoras
13 páginas
FAQs Exámenes
Aún no hay calificaciones
FAQs Exámenes
11 páginas
Técnicas de Hash y Seguridad en Redes
Aún no hay calificaciones
Técnicas de Hash y Seguridad en Redes
21 páginas
Manual de Usuario Tasven POS
Aún no hay calificaciones
Manual de Usuario Tasven POS
65 páginas
IW38
Aún no hay calificaciones
IW38
68 páginas
Manual de Usuario: Integración DRAGO AP
Aún no hay calificaciones
Manual de Usuario: Integración DRAGO AP
12 páginas
Google Dork
Aún no hay calificaciones
Google Dork
5 páginas
Activación sin conexión de CorelDraw X7
Aún no hay calificaciones
Activación sin conexión de CorelDraw X7
3 páginas
Organización de Archivos Documentales
Aún no hay calificaciones
Organización de Archivos Documentales
22 páginas
Manual de Usuario Agility Studio PDF
100% (2)
Manual de Usuario Agility Studio PDF
115 páginas
Tipos de Datos y Validación en Access
Aún no hay calificaciones
Tipos de Datos y Validación en Access
2 páginas