Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Macros:
1. error de timeout: Estos errores se deben a una falta de recursos de memoria
durante el procesamiento de datos. Si se inicia el proceso de recolección de
elementos no utilizados de Java, la aplicación Spark podría dejar de responder.
Las consultas comenzarán a agotar el tiempo de espera y el procesamiento se
detendrá.
2. dateutil.relativedelta: El tipo relativedelta está diseñado para ser aplicado a una fecha-
hora existente y puede reemplazar componentes específicos de esa fecha-hora, o
representa un intervalo de tiempo.
3. Agg: Va antes de una función de agregación; En Spark tenemos muchas funciones de
agregación, quizás las más comunes sean estas:
sum -> Devuelve la suma de todos los valores agregados por cada clave de agregación de una
columna
min -> Devuelve el valor más pequeño por cada clave de agregación de una columna
max -> Devuelve el valor más grande por cada clave de agregación de una columna
avg -> Devuelve el valor medio por cada clave de agregación de una columna
count -> Devuelve la cantidad de elementos por cada clave de agregación de una column
4. select() vs selectExp():