Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Documento de Diseño y Desarrollo Etl Paq - STG - TBL - Ps - RSF - Lead
Documento de Diseño y Desarrollo Etl Paq - STG - TBL - Ps - RSF - Lead
Control de Versiones
Aprobado por
Fecha de
Nombre y Apellido Cargo y área aprobación
Banco de Occidente
USO INTERNO
Diseño Proceso ETL Pág. 2
Validación Dominios 09/10/2018
TABLA DE CONTENIDO
INTRODUCCIÓN.............................................................................................................................................3
DISEÑO TECNICO DE LA SOLUCION............................................................................................................ 4
1. DIAGRAMA DE FLUJO DE INFORMACIÓN.........................................................................................................4
2. DIAGRAMA DE PROCESOS DE LA SOLUCIÓN.....................................................................................................4
SIEBEL (AWS REDSHIFT)............................................................................................................................. 6
3. OBJETOS DE INFORMACIÓN DE FUENTES-AWS REDSHIFT..................................................................................6
3.1 Descripción de los Campos.............................................................................................................6
ESPECIFICACIONES DEL PROCESO DE INTEGRACIÓN CON AWS GLUE..........................................................6
4. CREACIÓN DEL JOB-AWS GLUE...................................................................................................................7
5. GOANYWHERE..........................................................................................................................................7
6. MONITOREO Y MANEJO DE ERRORES............................................................................................................7
ESPECIFICACIÓN DEL PROCESO DE INTEGRACIÓN DATASTAGE...................................................................7
7. SEQUENCE PRINCIPAL...........................................................................................................................8
7.1 SEQ_STG_TBL_PS_RSF_LEAD.........................................................................................................8
8. EXTRACCIÓN.........................................................................................................................................9
8.1 JOB_EXT_STG_TBL_PS_RSF_LEAD.................................................................................................9
9. TRANSFORMACIÓN...............................................................................................................................9
9.1 JOB_TRF_STG_TBL_PS_RSF_LEAD..................................................................................................9
10. CARGA............................................................................................................................................10
10.1 JOB_LOD_STG_TBL_PS_RSF_LEAD...............................................................................................10
OBJETOS DE INFORMACIÓN DESTINO...................................................................................................... 11
11. ORA_STG_TBL_PS_RSF_LEAD.........................................................................................................11
Banco de Occidente
INTRODUCCIÓN
PROCESO DE INTEGRACIÓN
S_CONTACT
S_PARTY
S_EMP_PER
Redshift S_CONTACT
_FNXM
S_CONTACT
_X
S_EMPLOYE
E_X
S3
ADM
STR_DESCR50
STR_BUSINESS_UNIT
STR_LEAD_STATUS
NUM_EST_REVENUE
STR_LEAD_RATING
STR_LEAD_ID
STR_PERSON_ID
DTM_FECHA_REGISTRO
DTM_PERIODO
NUM_CASE_ID
STR_CUST_ID
NUM_BO_ID_PERSON
Origen de los Datos: Para esta solución el origen de los datos se establecerá en
las tablas mencionadas anteriormente.
Destino de los Datos: Para esta solución el destino de los datos es Amazon
Simple Storage Service. El archivo estará disponible en el bucket de S3 con URI
s3://dirección_del_bucket en formato CSV.
Método de transformación (Transform SQL Query): Será vía SQL el cual toma
las fuentes de Redshift mencionadas anteriormente y se crean las relaciones entre
estas, para poder procesar la información de ellas como si fueran tablas de una
base de datos relacional, generando una única salida de datos en formato CSV. El
query usado en esta fase del Proceso puede ser consultado en el siguiente enlace
PAQ_STG_TBL_PS_RSF_LEAD.sql (Cuando este listo la Consulta AWS-
Pendiente)
Schedule Job: Se programa el scheduler a las 19:00 de manera diaria de lunes a
viernes.
5. GoAnywhere
El archivo generado y que es almacenado en S3 se transfiere de manera segura para que sea
procesado por Datastage.
7. SEQUENCE PRINCIPAL
7.1 SEQ_STG_TBL_PS_RSF_LEAD
PARAMETROS DE ENTRADA:
o VAP_NOMBRE_ARCHIVO: Nombre del archivo a tomar desde Go
AnyWhere que su valor será STG_TBL_PS_RSF_LEAD.csv.
UVA: Contiene las variables de VAP_NOMBRE_ARCHIVO y
VAP_RUTA_ORIGEN_GAW.
ECM_BORRA_ARCHIVO: Valida en la ruta de GAW si se encuentra el archivo
VAP_NOMBRE_ARCHIVO para eliminarlo con la siguiente regla (rm -f
#PSET_RUTAS.VAG_RUTA_ENTRADA##VAP_NOMBRE_ARCHIVO#).
ECM_EXTRAE_ARCHIVO_GAW: Consulta en la ruta de GAW y extrae el archivo
VAP_NOMBRE_ARCHIVO y lo lleva al repositorio de DataStage conla siguiente
regla (cd #PSET_RUTAS.VAG_RUTA_ENTRADA# && lftp -c "set ftp:ssl-allow off;
set ftp:use-feat false;lftp
sftp://#$VAG_GAW_FTP_USER#:#$VAG_GAW_FTP_PASS#@#$VAG_GAW_FT
P_SERVER#; mget
#UVA.VAP_RUTA_ORIGEN_GAW##UVA.VAP_NOMBRE_ARCHIVO#").
8. EXTRACCIÓN
8.1 JOB_EXT_STG_TBL_PS_RSF_LEAD
o STR_DESCR50
o STR_BUSINESS_UNIT
o STR_LEAD_STATUS
o NUM_EST_REVENUE
o STR_LEAD_RATING
o STR_LEAD_ID
o STR_PERSON_ID
o DTM_FECHA_REGISTRO
o DTM_PERIODO
o NUM_CASE_ID
o STR_CUST_ID
o NUM_BO_ID_PERSON
9. TRANSFORMACIÓN
9.1 JOB_TRF_STG_TBL_PS_RSF_LEAD
DS_STG_TBL_PS_RSF_LEAD: Este DataSet es tomado del job
JOB_EXT_STG_TBL_PS_RSF_LEAD correspondiente a la extracción del archivo.
TRF_STG_TBL_PS_RSF_LEAD: En este Transformers se cambian los formatos
de los siguientes campos:
10.1 JOB_LOD_STG_TBL_PS_RSF_LEAD
STR_DESCR50 VARCHAR(50) NO
STR_BUSINESS_UNIT VARCHAR(5) NO
STR_LEAD_STATUS VARCHAR(2) NO
NUM_EST_REVENUE NUMERIC NO
STR_LEAD_RATING VARCHAR(2) NO
STR_LEAD_ID VARCHAR(15) NO
STR_PERSON_ID VARCHAR(15) NO
DTM_FECHA_REGISTRO DATE NO
DTM_PERIODO DATE NO
NO
NUM_CASE_ID NUMERIC
VARCHAR(15) NO
STR_CUST_ID
NO
NUM_BO_ID_PERSON NUMERIC
Filtros aplicados
NA
Homologaciones
NA
Observaciones
NA