Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DataStage
Equivida 2016
Agenda
• Introducción a Infosphere Data Stage
• Creación de Un Job
• Revisión Ejecución de un Job
• Tipos de Joins
• Creación de un Job más Complejo
• Creación de una Malla de Procesos
Agenda
• Introducción a Infosphere Data Stage
• Creación de Un Job
• Revisión Ejecución de un Job
• Tipos de Joins
• Creación de un Job más Complejo
• Creación de una Malla de Procesos
Introducción a Infosphere DataStage
• Que es?
• Herramienta de ETL (Extraer, Transformar, Cargar)
• Extrae datos desde fuentes variadas: relacional, secuencial
• Transforma los datos: Lógica de negocio, ordenamiento, filtrado, uniones
• Carga los datos a destinos variados: secuencial, relacional
• Como lo hace?
• Provee de capacidades de integración con alta performance
por medio de tecnologías de procesamiento paralelo
• Administración de ambientes de desarrollo y producción
• Importa, exporta, crea y administra metadata utilizada en Jobs
• Calendariza, ejecuta y monitorea la ejecución de Jobs
• Creación de mallas de procesos
Introducción a Infosphere DataStage
• Quién lo usa?
• Desarrolladores técnicos
• Herramienta para proyectos de integración
• Data Warehouse
• Data Marts
• CDI
• Migración de Sistemas
• Import/Export de Fuentes externas: Entes Regulatorios
Introducción a Infosphere DataStage
• Ejemplo de un Job
Agenda
• Introducción a Infosphere Data Stage
• Creación de Un Job
• Revisión Ejecución de un Job
• Tipos de Joins
• Creación de un Job más Complejo
• Creación de una Malla de Procesos
Creación de Un Job
• Ingresando a DataStage Designer
Creación de Un Job
• Selección del Tipo de Job
• La metadata de campos se
hereda
Creación de Un Job
• Compilando el Job
• Si solicita grabar, indique SI y dele un nombre
Compilar
Creación de un Job
• Ejecutando el Job
Ejecutar
Creación de Un Job
• Revisando Resultado en Designer
Status
Schedule
Log
Revisión Ejecución de Un Job
• Revisando Resultado en Director
Revisión Ejecución de Un Job
• Tipo de Información en Director
Revisión Ejecución de Un Job
• Abriendo el Monitor
Agenda
• Introducción a Infosphere Data Stage
• Creación de Un Job
• Revisión Ejecución de un Job
• Tipos de Joins
• Creación de un Job más Complejo
• Creación de una Malla de Procesos
Tipos de Joins
•Join, Lookup y Merge combinan dos o mas entradas
de acuerdo a valores de campos “llaves” definidas por el
usuario.
• Difieren en:
• Uso de memoria
• Tratamiento de registros sin matching
• Requerimientos de entrada (sort, desduplicación)
Tip:
Chequee el tab de "Input Ordering" para asegurarse que
el link Primario sea el primero en la lista
Tipos de Joins
• Trasfondo
• Usemos un simple caso, entrada óptima:
• dos links: “izquierdo" primario, “derecho" secundario
• ordenado por llave (“Account"),
• sin duplicados en la llave
0 1
Lookup
Output Reject
Tipos de Joins
• Si no se encuentra la referencia
• Si una llave de un registro primario no se encuentra
disponible en la LUT, se puede hacer lo siguiente:
– fail: se reporta el error y la Stage genera un fallo para abortar el job.
Este es el default.
– drop: el registro que no hizo match es eliminado
– continue: El registro de entrada es transferido y los valores dependientes
de la LUT son enviados en Nulos. OJO CON NULOS.
– output: el registro de entrada que falla el lookup es transferido a un
segundo link de salida llamado de “rechazo”
Opción "Output" :
Salida Rechazo
CustNumber Account Fees CustNumber Account
1776 Brokerage Yes 1789 Checking
Igual a join/inner y merge/drop No Encontrados
Tipos de Joins
• Stage de Merge
Maestro 1 o mas updates
• Permite llaves compuestas
• Multiples links de update
• Updates no encontrados
1 2
pueden ser capturados
0
• Liviana
0 1 2
Merge
Salida Rechazo
Tipos de Joins
• Stage de Merge
• Combina
• 1 link maestro ordenado y sin duplicados
• 1 o mas links ordenados de update.
• Pre ordenar hace a la stage más liviana, dado que menos
registros necesitan permanecer en memoria.
• Modelo Maestro Update:
• El registro maestro y uno o mas updates son unidos si poseen el
mismo valor de llave.
• Registros maestros no encontrados pueden:
• transferirse (default)
• eliminarse
• Registros de update no encontrados pueden ser capturados en
links de rechazos.
Tipos de Joins
• Editor Stage Merge
No encontrados maestros
Dos opciones:
– Keep [default]
– Drop
(no se puede capturar en
rechazo)
Tipos de Joins
• Stage Merge
Maestros no Encontrados = Keep
Aparecerá advertencia,
Indique que Si
Creación de un Job mas Complejo
• Configure la Salida
Creación de un Job mas Complejo
• Configure la Salida
Modifique el formato
si desea
Creación de un Job mas Complejo
• Compile, ejecute y revise resultados como hizo en el job
anterior.
• Fallo? Que Paso?
Creación de un Job mas Complejo
• Recuerde las propiedades del LookUp
Run: Ejecuta
Reset then Run: Si se ha caído, lo deja en estado
ejecutable y vuelve a ejecutarlo
Validate Only: Ejecuta una revisión de acceso
solamente
Reset Only: Solo ejecuta un reseteo para dejarlo
en estado ejecutable en caso que se hubiese
caído previamente
Creación de una Malla de Procesos
• Revise los Triggers
Incondicional
Si termina Bien
Si termina Mal
Si Tiene Warnings
Un estado definido por usuario
Una rutina que evalua cualquier cosa
En otro caso (OtherWise)
Creación de una Malla de Procesos
• Compile, Ejecute y Vea Resultado