Documentos de Académico
Documentos de Profesional
Documentos de Cultura
$ dataproc = DatioPysparkSession().get_or_create()
3. Realiza la lectura de la(s) tabla(s) teniendo en cuenta la ruta base y las particiones por consultar.
$ DF = dataproc.read().parquet(PATH_READ_MASTER).where(
$ (col(PARTITION_NAME_1)==PARTITION_VALUE_1) &
$ (col(PARTITION_NAME_2)==PARTITION_VALUE_2) &
$ (col(PARTITION_NAME_3)==PARTITION_VALUE_3)
$ )
Atención
En algunos casos, pueden existir conflictos durante la lectura de ficheros parquet en rutas no gobernadas (Zona
Sandbox). Estos conflictos pueden estar relacionados con esquemas diferentes en las particiones del objeto, otro
tipo de datos en las rutas, entre otros. Dado lo anterior, se requiere el uso de la opción BasePath para la lectura
del objeto.
$ dataproc = DatioPysparkSession().get_or_create()
3. Realiza la lectura de la(s) tabla(s) teniendo en cuenta la ruta base y la ruta completa por consultar.
$ DF = dataproc.read().option("basePath", BASE_PATH).parquet(FULL_PATH)
Ejemplos