Está en la página 1de 20

Lic.

Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin


disponible)

1
INTRODUCCIN A PENTAHO BI SUITE 3.5
P
PPe
een
nnt
tta
aah
hho
oo (
((B
BBI
II O
OOp
ppe
een
nn S
SSo
oou
uur
rrc
cce
ee)
))

OSBI Concepto
(extrado de http://www.corebi.com)

En el rea de Business Intelligence, se ha producido recientemente un despegue espectacular en el
desarrollo de soluciones e implementacin de herramientas Open Source.
La cantidad de proyectos libres de licencias en este segmento y el nmero de personas implicadas
demuestran que existe capacidad para que se desarrolle de formas muy diferentes y complementarias a la vez.

Por qu OSBI?

Adaptabilidad a todos los entornos.
Sin costos de licencias.
Independencia del proveedor.
Seguridad.
Garantas de permanencia. Upgrades y mejoras frecuentes.
Tendencia a la calidad y utilizacin de estndares
Dedicacin full a los servicios y a la solucin de negocios.
Gran aprovechamiento de Web Services y tecnologa SOA. (Arquitectura Orientada a Servicios)
La comunidad del Software Libre.

Los proyectos BI deberan ser proyectos a largo plazo, porque de ellos depende no slo el presente de
nuestras decisiones, sino el futuro.

OSBI existentes
(extrado de: http://redcloverbi.wordpress.com/2009/06/20/bi-open-source-%C2%BFcual/ - 20/06/2009)

Hoy por hoy, Pentaho es la suite ms completa y fuerte del mercado OSBI. Pero han surgido otras
interesantes, aunque les falta para llegar a competir con Pentaho, por ejemplo, algunas son:
SapgoBI
Vanilla
OpenI
Todas parten de mondrian (motor OLAP) + jpivot (interfase para OLAP) + kettle (ETL), por lo que
siempre nos conviene partir de Pentaho. An teniendo en cuenta los cambios frecuentes de Licencias de
Pentaho.

(extrado de http://todobi.blogspot.com/2009/04/novedades-en-spagobi.html)
Una funcionalidad muy interesante es que admite el uso de diferentes motores OLAP que dan respuesta a la
necesidad sin diferenciar si en dicho mbito usamos una solucin open source o propietaria. Por ejemplo,
podemos usar Mondrian que es ROLAP y PALO que es MOLAP. De manera que ambos motores se
complementan.
OLAP: soporta los motores Mondrian, PALO y Microsoft Analysis Services.
Informes: soporta los motores de JasperReports, BIRT y Cristal Reports.
ETL: soporta los motores de Talend, Oracle Warehouse Builder y Data Stage.
Dashboard: soporta los motores de Lazlo y Tibco.
Anlisis geogrfico: soporta mapserver y sbigeo.
Data Mining: soporta weka,

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

2
INTRODUCCIN A PENTAHO BI SUITE 3.5
A parte de soporta KPIs, charts (uso de jfreechart), integracin con office, dashboards interactivos y QbE
(Query By Example). Mdulos de la suite:

SpagoBI Server: nucleo central de SpagoBI que integra la funcionalidad de los diferentes motores,
gestin de usuarios, etc.
SpagoBI Studio: entorno de desarrollo nico e integrado.
SpagoBI Meta: entorno enfocado a la capa de metadatos.
SpagoBI SDK: un nuevo nivel de integracin para utilizar SpagoBI con aplicaciones externas
SpagoBI Applications: para mantener los modelos verticales de anlisis desarrollados con SpagoBI.
Esta es una solucin enteramente Open Source. En la pgina oficial puede verse una demo en lnea de la suite
(http://spagobi.ow2.org)

Basado en Java EE con la aplicacin por defecto para correr en tomcat, OpenI es una solucin para la
construccin y publicacin de informes de XMLA compatible con fuentes de datos OLAP, como Microsoft
Analysis Services o Mondrian. Su objetivo es proporcionar anlisis consolidado de los principales componentes
de datos de una aplicacin inteligente, incluyendo:
Fuentes de datos OLAP
Bases de datos relacionales
Los datos estadsticos modelos
Los modelos de minera de datos
Pgina:http://openi.org/. Demo en lnea : http://demo.openi.org/openi/ (usuario/pass= openi2/openi2)

Cuenta con:
reports (Ireport & BIRT engines)

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

3
INTRODUCCIN A PENTAHO BI SUITE 3.5
Web reports (Web interface for creation and data exploration)
Olap views (FreeAnalysis engine)
Dashboard (FreeDashboard engine)
Key Performance Indicateors (FreeMetrics engine)
Maps (Googlemap integration & Map engines)
Obtener demo de: http://forge.bpm-conseil.com/
Documento de presentacin de la versin 2.2:
http://www.bpm-conseil.org/vanilla22/documentation/BPM_Vanilla_Presentation_200_FR.pdf

Rpida adopcin del mercado de BI open source (Chile)
(extrado de http://www.cognus.cl/content/view/598217)

El software open source representa la tendencia ms significativa, global y de ms largo plazo que la
industria del software ha visto desde los comienzos de los 80s.

El software de BI open source estar probablemente en tu futuro: el tema real no es si estar, si no
cuando

El BI open source est aqu para quedarse.
El inters en la tecnologa de BI open source es tan alto como la bsqueda de las compaas por alternativas
de productos comerciales disponibles de menor precio.

La plataforma Pentaho Open Source Business Intelligence
(extrado de Todo BI - http://www.gravitar.biz - http://www.cognus.cl)

(extrado de: MySQL V5 Ready for Prime Time Business Intelligence - Seth Grimes)
La plataforma Open Source Pentaho Business Intelligence cubre muy amplias necesidades de Anlisis de
los Datos y de Informes empresariales. Cuenta con:
Administracin y distribucin de reportes, anlisis y dashboards
Fcil integracin de fuentes de datos, portales y aplicaciones usando estndares abiertos
Programacin de tareas y autentificacin integradas
Funcionalidades de customizacin a travs de APIs, Web Services o modificacin a plantillas,
reglas de negocio o incluso el cdigo fuente
Registro de auditora integrado para seguimiento de actividades de usuarios, performance y
acceso a contenido
Procesos basados en workflow que permiten implementar lgica de negocios nica

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

4
INTRODUCCIN A PENTAHO BI SUITE 3.5
Estado actual en que se encuentra la solucin y con que componentes cuenta.

Plataforma 100% J2EE, asegurando la escalabilidad, integracin y portabilidad.
Servidor: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat,
WebLogic y Oracle AS.
Base de datos: va JDBC, IBM DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, NCR
Teradata, Firebird.
Sistema operativo: no hay dependencia. Lenguaje interpretado.
Lenguaje de programacin: Java, Javascript, JSP, XSL (XSLT/XPath/XSL-FO).
Interfaz de desarrollo: Java SWT, Eclipse, Web-based.
Repositorio de datos basado en XML.
Todos los componentes estn expuestos va Web Services para facilitar la integracin con
Arquitecturas Orientadas a Servicios (SOA).
(extrado de Todo BI)

Pentaho se define a si mismo como una plataforma de BI orientada a la solucin y centrada en
procesos que incluye todos los principales componentes requeridos para implementar soluciones basados
en procesos y ha sido concebido desde el principio para estar basada en procesos.
Las soluciones que Pentaho pretende ofrecer se componen fundamentalmente de una infraestructura
de herramientas de anlisis e informes integrado con un motor de workflow de procesos de negocio, una
de las capacidades BI claves de la plataforma. Es decir, la plataforma ser capaz de ejecutar las reglas
de negocio necesarias, expresadas en forma de procesos y actividades y de presentar y entregar la
informacin adecuada en el momento adecuado.

Informe tcnico

Pentaho est construdo en torno al servidor de aplicaciones J2EE JBoss y Jboss Portal (la versin 3.5
de la community edition viene con Tomcat), habilitando que toda la informacin sea accesible mediante un
browser en la intranet de la empresa.
Pentaho presenta informes en los formatos habituales (html, excel, pdf...) mediante JfreeReport, u
otras plataformas como BIRT o JasperReports. Para la generacin de PDFs utilizan, como podra ser
previsible, el conocidsimo Apache FOP.
Asimismo incorpora la librera JPivot, gracias a la cual podemos ver tablas OLAP a travs de un
browser y realizar las aplicaciones tpicas de anlisis OLAP (drill down, slice and dice...). Existe una
alternativa para reemplazar jpivot que es PAT (Pentaho Analysis Tools
(http://code.google.com/p/pentahoanalysistool/)
Tambin Pentaho Report Design Wizard, una herramienta de diseo de informes, que facilita el
trabajo con JfreeReport y supera sus limitaciones.

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

5
INTRODUCCIN A PENTAHO BI SUITE 3.5
Los dashboards son un desarrollo propio de Pentaho. Recogen informacin de todos los
componentes de la plataforma incluyendo aplicaciones externas, feeds RSS y pginas web. Incluyen gestin
y filtrado del contenido, seguridad basada en roles y drill down. Pueden ser integrados en terceras
aplicaciones, en portales o dentro de la plataforma Pentaho.
Para generar grficos se apoyan en JFreeChart, una librera para generar los grficos ms comunes
(2D, 3D, barras, lneas series temporales, Gantt...), interfaces para acceder a diferentes fuentes de datos,
exportacin a PNG, JPEG y PDF y soporte para servlets, JSPs, applets y aplicaciones clientes.
Los WebServices son una caracterstica fundamental de Pentaho. Las acciones, que son las tareas
ms sencillas que constituyen una solucin de Pentaho, pueden publicarse como WebServices. Pentaho utiliza
como motor de WebServices Apache Axis, quedando los servicios descritos en el lenguaje de definicin de
servicios web WSDL.
Para entregar la informacin Pentaho se apoya en una infraestructura JMS para enviar correos
electrnicos y Quartz, un scheduler opensource integrable en aplicaciones J2EE.

La corporacion Pentaho es el patrocinador primario y propietario del projecto Pentaho BI. El Pentaho BI
es una iniciativa en curso por la comunidad de Open Source.

El proyecto Pentaho BI abarca los siguientes componentes:

Componentes de la plataforma Pentaho BI son:
(extrado de Todo Bi - http://www.cognus.cl - http://www.gravitar.biz)
La siguiente imagen muestra como interactuan los diferentes componentes de pentaho:


Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

6
INTRODUCCIN A PENTAHO BI SUITE 3.5
http://kettle.pentaho.org
Integracin de Datos:

Se realiza con una herramienta Kettle ETL (Pentaho Data Integration) que permite implementar
los procesos de limpieza, transformacin y poblacin del DW. La versin - PDI 3.0 marc un gran
paso adelante en OSBI ETL y hizo de Pentaho Data Integration una alternativa interesante para las
herramientas comerciales. (SUM es aliado de negocios de Pentaho http://www.sun.com/third-
party/global/pentaho/)
o Se compone de 4 herramientas:
- SPOON: permite disear de forma grfica la transformacin ETL.
- PAN ejecuta la transformaciones diseadas con SPOON.
- CHEF permite, mediante una interfaz grfica, disear la carga de datos incluyendo
un control de estado de los trabajos.
- KITCHEN permite ejecutar los trabajos batch diseados con Chef.


o Amplio soporte a fuentes de datos, ms de 30 bases de datos (open source y propietarias),
archivos planos, Excel, y ms.
o Arquitectura extensible permite desarrollar conectores y plug ins fcilmente.
o Basado en repositorio facilita re uso de componentes de transformacin, colaboracin y
administracin de modelos, conexiones, logs, etc.
o Performance y escalabilidad de clase Enterprise con soporte a procesamiento masivo paralelo
(MPP) a travs de ejecucin en cluster
o Debugger integrado
o Poblacin de Data warehouses con soporte built-in para dimensiones que cambian lentamente y
dimensiones basura

Pentaho Anlisis:
Suministra a los usuarios un sistema avanzado de anlisis de informacin. Con uso de las
tablas dinmicas (pivot tables, crosstabs), generadas por Mondrian y JPivot, el usuario puede
navegar por los datos, ajustando la visin de los datos, los filtros de visualizacin, aadiendo o
quitando los campos de agregacin. Los datos pueden ser representados en una forma de SVG o
Flash, los dashboard widgets, o tambin integrados con los sistemas de mineria de datos y los
portales web (portlets). Adems, con el Microsoft Excel Analysis Services, se puede analizar los datos
dinmicos en Microsoft Excel (usando la conexin a OLAP server Mondrian).
Cuenta con:
Despliegue grfico interactivo, con grillas de datos
Resultados explorables y navegables incluso en los grficos
Sofisticadas capacidades OLAP, arquitectura ROLAP
Tcnicas de optimizacin para mejoras de tiempos de respuesta

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

7
INTRODUCCIN A PENTAHO BI SUITE 3.5

http://mondrian.pentaho.org
o El servidor OLAP : Para obtener la funcionalidad de procesamiento analtico en lnea (OLAP)
se utilizan dos aplicaciones: el servidor OLAP Mondrian, que combinado con Jpivot, permiten
realizar querys a Datamarts, y que los resultados sean presentados mediante un browser y que el
usuario pueda realizar drill down y el resto de las navegaciones tpicas. Algunas cuestiones
interesantes sobre Mondrian:
- Mondrian utiliza MDX como lenguaje de consulta, que no tendra nada de raro si no
fuera porque fue un lenguaje propuesto por Microsoft.
- En noviembre de 2005 Mondrian se incorpor al proyecto Pentaho.
- Mondrian funciona sobre las bases de datos estndar del mercado: Oracle, DB2,
SQL-Server, MySQL,PostgreSQL... lo cual habilita y facilita el desarrollo de negocio basado en
la plataforma Pentaho.
- JPivot est considerado con un proyecto hermano de Mondrian. Al incorporarse
Mondrian tambin lo ha hecho JPivot



Pentaho Dashboards:
Todos los componentes del modulo Pentaho Reporting y Pentaho Anlisis pueden
formar parte de un Dashboard. En Pentaho Dashboards es muy fcil incorporar una gran variedad
en tipos de grficos, tablas y velocmetros (dashboard widgets) e integrarlos con los Portlets JSP, en
donde podr visualizar informes, grficos y anlisis OLAP.
Identificacin de Indicadores (KPIs, Key Performance Indicators)
o Monitoreo/Mtricas
Investigar detalles subyacentes
o Drill a reportes de soporte
Seguimiento de excepciones
o Alertas basadas en reglas del negocio


Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

8
INTRODUCCIN A PENTAHO BI SUITE 3.5



Pentaho Datamining: (http://www.sourceforge.net/projects/weka)

Para tal fin, Pentaho est incorporando la tecnologa WeKa. Decimos est incorporando, porque al
da de hoy el roadmap de Pentaho indica que estn en ello.
o Poderoso motor de minera de datos provee de un set de algoritmos de aprendizaje del proyecto
Weka incluyendo clustering, segmentacin, rboles de decisin, random forests, redes neuronales
y anlisis de componentes principales, entre otros.
o Integracin de Pentaho Data Integration, automatizacin de procesos de transformacin de datos
al formato que requiere el motor de data mining.
o Los algoritmos pueden ser aplicados directamente a un set de datos o invocados desde cdigo
Java.
o Provee filtros para discretizacin, normalizacin, re-muestreo, seleccin de atributos,
transformacin y combinacin de atributos.
o Modelos para prediccin de variables nominales o numricas.
o Herramientas grficas de diseo para preprocesamiento de datos, regresin, clustering, reglas de
asociacin.





Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

9
INTRODUCCIN A PENTAHO BI SUITE 3.5
http://reporting.pentaho.org

Reporting:
Pentaho Reporting es una solucin basada en el proyecto JFreeReport (hay quienes usan BIRT)
y permite generar informes gil y de gran capacidad. Permite la distribucin de los resultados del
anlisis en mltiples formatos - todos los informes incluyen la opcin de imprimir o exportar a
formato PDF, XLS, HTML y texto- y permiten tambin la programacin de tareas y ejecucin
automtica de informes con una determinada periodicidad.
Cuenta con:
Implementacin flexible, desde solucin standalone de escritorio, a reportes interactivos
basados en Inteligencia de Negocios
Amplio soporte a fuentes de datos incluyendo datos relacionales, OLAP o basados en
XML
Solucin proporcionada por pentaho e integrada en su suite para el desarrollo de
informes
Existen tres productos con diferentes enfoques y dirigidos a diferentes tipos de usuarios.
Pentaho Report Designer: Editor basado en eclipse con prestaciones profesionales y de
calidad y con capacidad de personalizacin de informes a las necesidades de negocio
destinado a desarrolladores.
Incluye Asistentes para facilitar la configuracin de propiedades.
Est estructurado de forma que los desarrolladores pueden acceder a sus prestaciones de
forma rpida: Incluye un editor de consultas para facilitar la confeccin de los datos que
sern utilizados en un informe.
Pentaho Report Design Wizard: Herramienta de diseo de informes, que facilita el trabajo
y permite a los usuarios obtener resultados de forma inmediata. Est destinada a usuarios con
menos conocimientos tcnicos.
A travs de pasos sencillos permite:
Conectarse a todo tipo de bases relacionales
Integrar el resultado dentro del portal pentaho
Web ad-hoc reporting: Es el similar a la herramienta anterior pero via web. Extiende la
capacidad de los usuarios finales para la creacin de informes a partir de plantillas
preconfiguradas y siguiendo un asistente de creacin.
Las caractersticas generales son:
Proporciona funcionalidad crtica para usuarios finales como:
o Acceso va web
o Informes parametrizados
o Scheduling
o Suscripciones
o Distribucon (bursting)
Proporciona claras ventajas a especialistas en informes:
o Acceso a fuentes de datos heterogeneos: relacional (va jdbc), OLAP, XML, transformaciones
de pentaho data integration.
o Capacidad de integracin en aplicaciones o portales: jsp, portlet, web service.
o Definicin modular de informes (distincin entre presentacin y consulta)
Diseo de informes flexible
o Entorno de diseo grfico
o Capacidad de uso de templates
o Acceso a datos relacionales, OLAP y XML
Desarrollado para:
o Ser embebible
o Ser fcil de extender
o No consumir muchos recursos
o 100% Java: portabilidad, escalabilidad e integracin
Multiplataforma (tanto a nivel de cliente como servidor): mac, linux/unix y Windows

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

10
INTRODUCCIN A PENTAHO BI SUITE 3.5

El workflow de procesos de negocio: Dos son los fundamentos del workflow de procesos de
negocio: el motor de workflow Enhydra Shark y el estndar WPDL, auspiciado por la WorkFlow
Management Coalition (WFMC), organismo que declara tener ms de 300 empresas asociadas,
incluyendo a las desconocidas IBM, Oracle, BEA, Adobe, SAP, TIBCO o SUN, por citar algunas de
ellas.

COMMUNITY ENTERPRISE?

En el contexto Open Source, nos encontramos que la gran mayora de proveedores tienen una
versin para la comunidad y otra profesional (por ejemplo Pentaho, JasperSoft,Talend, MySQL). En qu
consiste? Existe una versin open source comunitaria con un conjunto de funcionalidades bien definidas,
acotadas y plenamente operativas. Y una versin profesional que presenta o bien ms funcionalidades que la
otra versin o bien una versin mejorada de las mismas funcionalidades.
Pentaho soporta la creacin de Dashboards, pero slo la versin profesional presenta un Dashboard
Designer Ad-hoc. Dichas funcional slo pueden ser accedida mediante la adquisicin de una subscripcin o de
soporte.
Versiones disponibles de Pentaho:
1. Pentaho Community Edition: Versin comunitaria, sin costos de licencia, sin
servicios de soporte asociados. Es una suite completa con todas las funcionalidades
necesarias para el correcto desarrollo de proyectos de Business Intelligence. Aunque
Pentaho sol la recomienda para:
Aficionados al BI
Acadmicos
Programadores de Software Abierto
Pentaho recomienda la versin EE para entornos empresariales, especialmente cuando el
tiempo de inactividad dedicado averiguar cmo instalar, configurar y mantener una
solucin de inteligencia de negocios son prohibitivamente caro.
Es totalmente software de cdigo abierto, la licencia en su mayora bajo la versin GNU
General Public License versin 2, con partes bajo el LGPLv2, la Common Public License, y
la Licencia Pblica de Mozilla.

2. Pentaho Enterprise Edition: Versin empresarial, sin costos de licencia, tiene
asociados servicios de soporte y mantenimiento que se pagan a travs de una suscripcin
anual. Es una versin certificada que adems posee algunas funcionalidades mejoradas
para la consola de administracin, y para la construccin de tableros de control.

Comparativa:
(extrado de Pentaho BI Suite Enterprise Edition)

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

11
INTRODUCCIN A PENTAHO BI SUITE 3.5



Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

12
INTRODUCCIN A PENTAHO BI SUITE 3.5
Dnde conseguir ayuda?

Community Wiki Home
http://wiki.pentaho.com/display/COM/Community+Wiki+Home

Este wiki contiene la documentacin y la informacin para el Open Source de Pentaho BI Suite
Community Edition (CE). La suite incluye ETL, anlisis OLAP, los metadatos, la minera de datos, informes,
cuadros de mando y una plataforma que le permite crear soluciones complejas a problemas de negocios.
La comunidad Pentaho es un grupo extraordinario de personas con muchos talentos diferentes que se
dedica a ofrecer una completa y bien integrada, de alta calidad y una suite de software de Business
Intelligence.

Pentaho Community Forums
http://forums.pentaho.org/



Por qu Pentaho?
(extrado de Todo Bi - http://www.cognus.cl)

Mejores productos
Cobertura completa de punta a punta de las necesidades de BI
Calidad sin igual, comunidad extensa y adopcin empresarial
Arquitectura moderna, construida sobre estndares y en base a componentes
Servicios de administracin
Mejor servicio
Soporte a produccin disponible 24x7x365
Atencin a soporte por los verdaderos expertos Pentaho desde la primera llamada
Capacitacin y consultora profesional
Mejor valor
Licencia open source sin costo
Servicio de subscripcin y soporte a una fraccin de proveedores propietarios

Mejor relacin
Completa transparencia
Relacin basada 100% en la calidad del soporte al cliente

Herramientas Cliente
(extrado de: Introducing the Pentaho BI Suite 3.5 Community Edition)

Las herramientas de cliente de Pentaho son:

Report Designer: una herramienta avanzada de creacin de informes. Ofrece mucho ms
flexibilidad y funcionalidad que las capacidades de informes ad hoc de la consola de usuario
Pentaho.
(http://reporting.pentaho.org)

Designer Studio: Una herramienta basada en Eclipse que le permite editar a mano un informe o
una view de anlisis xaction file. En general, la gente lo utiliza para hacer modificaciones a un
informe existente que no se puede aadir con el Diseador de informes.


Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

13
INTRODUCCIN A PENTAHO BI SUITE 3.5
Aggregation Designer: una herramienta grfica que ayuda a mejorar la eficiencia del cubo
Mondrian.

Metadata Editor: Le permite agregar un capa de metadatos a una fuente de datos existentes.
Normalmente se podra hacer esto de una fuente de datos que desea utilizar para el anlisis o la
presentacin de informes. No es necesario, pero hace ms fcil para los usuarios construir consultas
para analizar la base de datos.

Pentaho Data Integration: Herramientas de extraccin, transformacin y carga (ETL), que
permite a acceder a fuentes de datos y prepararlas para el anlisis, la minera de datos, o la
presentacin de informes.

Schema Workbench: una herramienta grfica que le ayuda a crear esquemas ROLAP para el
anlisis.

INSTALACION

Qu necesitamos descargar?
(http://sourceforge.net/projects/pentaho/files/)

Lo primero que debemos obtener es el BI-Server de Pentaho, su distribucin CE (Community
Edition).
Si buscamos en www.google.com.ar sourceforge pentaho el primer link devuelto no d la pgina de
dnde bajar el Server. Desde la carpeta Business Intelligence Server, bajaremos biserver-ce-
3.5.2.stable.zip . Descomprimimos sobre un directorio PENTAHO y tendremos las siguiente estructura de
directorio:

Pentaho/
administrationconsole/
biserver-ce/

El primero es la consola de administracin y el segundo es el servidor BI de Pentaho y contiene la consola de
usuario.

Crear un directorio /pentaho/design-tools
Descargaremos tambin la ltima versin estable de las herramientas cliente, no vamos a utilizar
todas pero igual las bajaremos:
o Schema Workbench (http://sourceforge.net/projects/mondrian/files/)
o Report Designer (http://sourceforge.net/projects/pentaho/files/)
o Report Wizard (http://sourceforge.net/projects/pentaho/files/)
o Pentaho Design Studio (http://sourceforge.net/projects/pentaho/files/)
o Pentaho Metadata (http://sourceforge.net/projects/pentaho/files/)
o Data Integration (http://sourceforge.net/projects/pentaho/files/)
Tendremos entonces la siguiente estructura de directories:
Pentaho/
administrationconsole/
biserver-ce/
design-tools/
schema-workbench/
report-design/
report-wizard/
design-studio/
pentaho-metada/
data-integration/

Descargaremos el motor Postgresql 8.4 que usaremos como repositorio de datos.
o PostreSQL 8.4.3-1 for windows incluye PGADMIN III
(http://www.enterprisedb.com/products/pgdownload.do)
o JDBC de PostgreSQL (http://jdbc.postgresql.org/download/postgresql-8.4-701.jdbc3.jar)


Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

14
INTRODUCCIN A PENTAHO BI SUITE 3.5
Para mayor informacin de download ver:
http://wiki.pentaho.com/display/COM/Community+Edition+Downloads

Repositorio de la solucin

Viene por default en un RDBMS, HyperSQL. Para este curso introductorio no lo cambiaremos, pero
puede migrase a:
MySQL 5.x
PostgreSQL 8.x.x
Oracle 10g & 11g

Prashant Raju nos d un buen aporte con esto: http://www.prashantraju.com/projects/pentaho/
En est pgina encontramos cmo migrar el repositorio a con los correspondientes script de migracin.

Qu deberamos conocer?
(por Prashant Raju)
sto son algunos paquetes que son tiles en Pentaho BI Server:
Apache Tomcat (el server que bajamos ahora viene con un tomcat incorporado, pero puede
compilarse para JBoss)
o Descripcin: El servidor web que provee la plataforma para ser la parte front end de
Pentaho BI Server.
o Puerto: 8080 (predeterminado)
o URL de acceso: http://localhost:8080/
o Sitio Web: http://www.apache-tomcat.com/
Hibernate
o Descripcin: Un paquete Java que ayuda a la base de datos relacional trabajar con
Pentaho.
o Sitio Web: http://www.hibernate.org/
Jetty
o Descripcin: El servidor web que provee una plataforma para la Consola del
Administrador
o Puerto: 8099 (predeterminado)
o URL de accesos: http://localhost:8099/
o Sitio Web : http://www.jetty-server.com/
PostgreSQL
o Descripcin: El servidor de base de datos que usaremos para trabajar con Pentaho
o Puerto: 5432 (predeterminado)
o URL de acceso Java: jdbc:postgresql://localhost:5432/pentaho
Quartz
o Descripcin: El sistema de calendario de reportes que Pentaho usa.
o Sitio Web: http://www.opensymphony.com/quartz/
Hypersonic:
o Descripcin:
o Sitio Web:
Ver terminologa usada en el proyecto Pentaho en
http://wiki.pentaho.com/display/PEOpen/Pentaho+Terminology+Project

Configuracin
Correo: La plataforma enva mensajes a travs del correo usando el SMTP Server. En la mayora de
los casos requiere el ID del usuario, contrasea y una direccin de correo vlida.
Para modificar estas configuraciones la ruta de omisin es:
/pentaho/biserver-ce/pentaho-solutions/system/smtp-email/email_config.xml
Puertos: El servidor tratar de usar el puerto 8080. En la siguiente ruta se ubica el archivo de
configuracin de puerto:
/pentaho/biserverp-ce/tomcatt/conf/server.xml
Publicaciones: Herramientas del Cliente Pentaho publicadas en el servidor. Para disponer de las
herramientas del cliente (Report Design Wizard, Cube Design Wizard, etc) y publicarlas al servidor
se requiere de una contrasea.
Para configurar la contrasea edite el siguiente archivo:
/pentaho/biserver-ce/pentaho-solutions/system/publisher_config.xml
Despliegue: La instalacin de PENTAHO est diseada para trabajar localmente en
http://localhost:8080/pentaho como la URL de base.

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

15
INTRODUCCIN A PENTAHO BI SUITE 3.5
Para accederlo a travs de otra terminal, se requiere configurar el web.xml, ubicado en:
/pentaho/biserver-ce/tomcat/webapps/pentaho/WEB-INF
<context-param>
<param-name>base-url</param-name>
<param-value>http://myserver.pentaho.org:8080/pentaho</param-value>
</context-param>
JAVA_HOME : con esta distribucin de Pentaho viene una JRE. Setear la variable de entorno:

SET JAVA_HOME= /pentaho/biserver-ce/tomcat/jre

Start el Business Intelligence Server

Debemos correr el archivo startup.bat localizado en el directorio pentaho/biserver-ce, sinembargo si
se quiere correr cmo un servicio de Windows:
Primero hay que registrar el Tomcat como un servicio.
/pentaho/biserver-ce/tomcat/bin> service.bat install tomcat5

Ver la siguiente salida:
Installing the service 'tomcat5' ...
Using CATALINA_HOME: D:\pentaho352\biserver-ce\tomcat
Using CATALINA_BASE: D:\pentaho352\biserver-ce\tomcat
Using JAVA_HOME:
Using JVM: auto
The service 'tomcat5' has been installed
.
El servicio sera instalado pero no ha sido iniciado, por lo que debemos iniciar el servicio, desde la
consola de servicios de windows.

En este curso, estamos usando como repositorio de la solucin la base por defecto en HyperSonic, por
lo que antes de levantar el servicio debemos poner disponible la base corriendo /pentaho/biserver-
ce/data/Stara_hypersonic.bat (este se para con stop-hypersonic.bat en el mismo directorio); o bien
ponerla tambin como un servicio.

Ahora tenemos podemos entrar a la Consola de Usuario ya que tenemos el servidor BI corriendo.
http://localhost:8080/pentaho o si lo configur para el acceso desde la red http://[nombre o ip del
servidor BI]:8080/

Podremos ver la siguiente pantalla de Bienvenida:

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

16
INTRODUCCIN A PENTAHO BI SUITE 3.5

Podemos ingresar seleccionar el usuario joe del combo con los usuarios para demo, que es el
usuario con rol de administrador. La password es password.
Veremos:

Si elegimos la vista ventana haciendo clic en el cono indicado, tendremos acceso a los dos directorios de
soluciones ejemplos que vienen con Pentaho:

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

17
INTRODUCCIN A PENTAHO BI SUITE 3.5

Podemos darle un vistazo a los ejemplos y ver que se puede hacer con el producto

En este curso iniciaremos el servidor con /pentaho/biserver-ce/start-pentaho.bat y lo pararemos con
stop-pentaho.bat

Start de la Consola de Administracin

Tener en cuenta que siempre debe estar corriendo primero el servidor BI.
Ejecutar /pentaho/administration-console/start-pac.bat. Se abrir una ventana de commandos con la
siguiente salida:
Puede ingresar a la interfase en http://localhost:8099/ o la direccin que especifique en la ventana
anterior. Ver una ventana de login que pedir usuario y clave; estas son "admin" y "password". Si
ingresa ver la siguiente pginaI siguiente:

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

18
INTRODUCCIN A PENTAHO BI SUITE 3.5

Tomar unos segundos que identifique que el Server est disponible. Podremos ver entonces
haciendo click en Administration, distintas solapas que nos permitirn definir Usuario y Roles, Datasource,
ejecutar algunos servicios de mantenimiento y programar estas tarea:




Creamos un nuevo Datasource para la soluciones que vamos a implementar

1. Agregar JDBC para PostgreSQL a /pentaho/administration-console/jdbc/, ya que nuestro
repositorio de datos est en la base pentaho, en el servidor de PostgreSQL.
2. En la solapa Database Connections agregamos otro DataSource:
Name: SIU
Driver Class: elegimos en el combo, org.postgresql.Driver
Usuario: dba
Password: dba
URL: jdbc:postgresql://localhost:5432/pentaho

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

19
INTRODUCCIN A PENTAHO BI SUITE 3.5


Antes de hacer el Test de la coneccin, completar la solapa Advanced:


3. La solapa de Services, nos servir para refrescar el repositorio (la cache) y la configuracin
del sistema.

Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)

20
INTRODUCCIN A PENTAHO BI SUITE 3.5

También podría gustarte