Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PENTAHO: DEFINICIN
DE UN PROCESO ETL
CON SPOON
Miguel Velasco Gmez-Pantoja (jvel)
Contenido
Lista de ilustraciones..................................................................................3
Introduccin................................................................................................ 4
Descarga e instalacin de la herramienta...................................................4
Definicin del proceso................................................................................. 4
Trabajo con Spoon....................................................................................... 6
Lectura de datos (Extract).......................................................................6
Transformacin de datos (Transform).....................................................13
Carga de datos (Load)............................................................................16
Lista de ilustraciones
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
Ilustracin
1 Fichero de personas.............................................................5
2 Fichero de poblacin............................................................5
3 Paleta de entrada.................................................................7
4 Seleccin del fichero de entrada..........................................8
5 Definicin del contenido del fichero de entrada...................9
6 Delimitacin de los campos del fichero de personas...........9
7 Nombres de los campos de personas.................................10
8 Previsualizacin de los datos de personas.........................10
9 Seleccin del fichero CSV de entrada.................................11
10 Definicin del contenido del fichero CSV de entrada.......12
11 Definicin de campos del fichero CSV de entrada............13
12 Envo de informacin entre pasos....................................14
13 Divisin de los campos cdigo y nombre.........................14
14 Envo de informacin al paso de bsqueda......................15
15 Configuracin de la bsqueda en flujo.............................16
16 Definicin de la tabla de personas...................................16
17 Envo de informacin para la escritura en base de datos.17
18 Configuracin de la conexin a base de datos.................18
19 Mapeo de los datos a insertar..........................................19
20 Configuracin del paso de salida a tabla..........................19
21 Opciones de ejecucin.....................................................20
22 Resultados de la ejecucin...............................................20
23 Contenido de la base de datos.........................................21
Introduccin
Es muy habitual en el trabajo de un informtico tener que desarrollar
cargas de datos entre distintas fuentes. Por ejemplo cuando se requiere una
migracin entre bases de datos de distintas tecnologas, o cuando se quieren
cargar los datos de un Sistema que slo permite su exportacin en ficheros
de texto, CSV, o Excel. En estos casos se suele recurrir al desarrollo de
programas, ya sean en lenguaje Java, PL/SQL...
En este tutorial veremos las posibilidades que ofrecen las herramientas de
Bussines Intelligence (BI) para realizar este tipo de cargas sin necesidad de
programar cdigo especfico.
Dentro del BI, la fase de integracin de datos se orienta a obtener
informacin de distintas fuentes de datos, independientemente de su
tecnologa, y a realizar transformaciones sobre esa informacin para cargarla
en un almacn desde el que se pueda explotar, en los procesos conocidos
como ETL (Extraer, Transformar, Cargar).
El objetivo de este tutorial es mostrar cmo utilizar la fase de integracin
de datos para realizar cargas haciendo uso de la suite de BI Pentaho, y en
concreto, dentro su mdulo de integracin de datos, de la herramienta
Spoon.
Ilustracin 3 Paleta de
entrada