Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manual de Pentaho Shirley Villan
Manual de Pentaho Shirley Villan
Materia: DATAWAREHOUSE
Manual de Usuario
PENTAHO
(Integracin de Datos)
Grupo:
Miriam Vega
Shiley Villn
Freddy Pilligua
Ronald Ponguillo
11 ava. Promocin
2009 - 2010
Qu es PENTAHO ?
Es la plataforma Open Source Business Intelligence. cubre muy amplias necesidades de Anlisis de los
Datos y de los Informes empresariales. Las soluciones de Pentaho estn escritas en Java y tienen un
ambiente de implementacin tambin basado en Java. Eso hace que Pentaho es una solucin muy
flexible para cubrir una amplia gama de necesidades empresariales tanto las tpicas como las
sofisticadas y especificas al negocio.
Los mdulos de la plataforma Pentaho BI son:
Reporting - un modulo de los informes ofrece la solucin adecuada a las necesidades de los
usuarios. Pentaho Reporting es una solucin basada en el proyecto JFreeReport y permite generar
informes gil y de gran capacidad. Pentaho Reporting permite la distribucin de los resultados del
anlisis en mltiples formatos - todos los informes incluyen la opcin de imprimir o exportar a formato
PDF, XLS, HTML y texto. Los reportes Pentaho permiten tambin programacin de tareas y ejecucin
automtica de informes con una determinada periodicidad.
Pentaho ofrece integracin de datos de gran alcance de Extraccin, Transformacin y Carga (ETL)
utilizando la capacidad de un innovador enfoque impulsado por los metadatos.
INICIANDO EL MODULO:
Seleccionamos:
Inicio Pentaho Interprise Edition Design Tools Data Integration (Spoon o Kettle)
Spoon
es el diseador grfico de transformaciones y trabajos asociados con el sistema de ETL
Pentaho Data Integration, tambin conocido como Kettle.
Previamente se debe crear la base de datos en MySql, con la misma estructura de la base de Access.
INPUT
Una vez agregado el elemento, debemos configurar tanto su conexin a la base de datos, tabla asociada
y la sentencia SQL a ejecutarse para la extraccin de la informacin requerida.
Para la asignacin de datos de configuracin debemos seleccionar el elemento INPUT con click derecho
en la opcin edit step del elemento de la tabla de entrada, debemos definir la informacin requerida:
Adems debemos asignar un nombre de la tabla de extraccin de datos, el tipo de conexin y las
sentencia select que se desea ejecutar para obtener los datos de la base Access. Esto es de la siguiente
forma:
Con la opcin de Get SQL select statement se puede obtener una prueba de la informacin que esta por
obtenerse, as:
De la misma forma que se hizo en la definicin de tablas de extraccin, debemos agregar un elemento
de salida (output), que se encontrar en el grupo de OUTPUT.
OUTPUT
Creacin previa de la tabla en MySql, para ser visualizada en la definicin de los elementos de salida.
TRANSFORMACIN
Una vez definidos los elementos de extraccin (input), los elementos de carga (output) y la asociacin
entra tablas para la transformacin; solo es necesario ejecutar la Transformacin para concluir con el
procedimiento.
Previo a la ejecucin es necesario configurar la siguiente informacin para el proceso de extraccin de
Estudiantes, mediante la seleccin de VIEW TRANSFORMATIONS EXTRACCION ESTUDIANTE (es el
nombre que hemos definido a la extraccin de datos) SETTINGS. Luego se mostrar la siguiente
pantalla donde se
EJECUCIN DE LA TRANSFORMACIN:
Para la ejecucin de de la transformacin de datos se debe seleccionar el botn Run this transformation
or Job.
Luego procedemos a ejecutar la transformacin mediante el botn Launch como se muestra en la
siguiente pantalla: