Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin
disponible)
1 INTRODUCCIN A PENTAHO BI SUITE 3.5 P PPe een nnt tta aah hho oo ( ((B BBI II O OOp ppe een nn S SSo oou uur rrc cce ee) ))
OSBI Concepto (extrado de http://www.corebi.com)
En el rea de Business Intelligence, se ha producido recientemente un despegue espectacular en el desarrollo de soluciones e implementacin de herramientas Open Source. La cantidad de proyectos libres de licencias en este segmento y el nmero de personas implicadas demuestran que existe capacidad para que se desarrolle de formas muy diferentes y complementarias a la vez.
Por qu OSBI?
Adaptabilidad a todos los entornos. Sin costos de licencias. Independencia del proveedor. Seguridad. Garantas de permanencia. Upgrades y mejoras frecuentes. Tendencia a la calidad y utilizacin de estndares Dedicacin full a los servicios y a la solucin de negocios. Gran aprovechamiento de Web Services y tecnologa SOA. (Arquitectura Orientada a Servicios) La comunidad del Software Libre.
Los proyectos BI deberan ser proyectos a largo plazo, porque de ellos depende no slo el presente de nuestras decisiones, sino el futuro.
OSBI existentes (extrado de: http://redcloverbi.wordpress.com/2009/06/20/bi-open-source-%C2%BFcual/ - 20/06/2009)
Hoy por hoy, Pentaho es la suite ms completa y fuerte del mercado OSBI. Pero han surgido otras interesantes, aunque les falta para llegar a competir con Pentaho, por ejemplo, algunas son: SapgoBI Vanilla OpenI Todas parten de mondrian (motor OLAP) + jpivot (interfase para OLAP) + kettle (ETL), por lo que siempre nos conviene partir de Pentaho. An teniendo en cuenta los cambios frecuentes de Licencias de Pentaho.
(extrado de http://todobi.blogspot.com/2009/04/novedades-en-spagobi.html) Una funcionalidad muy interesante es que admite el uso de diferentes motores OLAP que dan respuesta a la necesidad sin diferenciar si en dicho mbito usamos una solucin open source o propietaria. Por ejemplo, podemos usar Mondrian que es ROLAP y PALO que es MOLAP. De manera que ambos motores se complementan. OLAP: soporta los motores Mondrian, PALO y Microsoft Analysis Services. Informes: soporta los motores de JasperReports, BIRT y Cristal Reports. ETL: soporta los motores de Talend, Oracle Warehouse Builder y Data Stage. Dashboard: soporta los motores de Lazlo y Tibco. Anlisis geogrfico: soporta mapserver y sbigeo. Data Mining: soporta weka,
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
2 INTRODUCCIN A PENTAHO BI SUITE 3.5 A parte de soporta KPIs, charts (uso de jfreechart), integracin con office, dashboards interactivos y QbE (Query By Example). Mdulos de la suite:
SpagoBI Server: nucleo central de SpagoBI que integra la funcionalidad de los diferentes motores, gestin de usuarios, etc. SpagoBI Studio: entorno de desarrollo nico e integrado. SpagoBI Meta: entorno enfocado a la capa de metadatos. SpagoBI SDK: un nuevo nivel de integracin para utilizar SpagoBI con aplicaciones externas SpagoBI Applications: para mantener los modelos verticales de anlisis desarrollados con SpagoBI. Esta es una solucin enteramente Open Source. En la pgina oficial puede verse una demo en lnea de la suite (http://spagobi.ow2.org)
Basado en Java EE con la aplicacin por defecto para correr en tomcat, OpenI es una solucin para la construccin y publicacin de informes de XMLA compatible con fuentes de datos OLAP, como Microsoft Analysis Services o Mondrian. Su objetivo es proporcionar anlisis consolidado de los principales componentes de datos de una aplicacin inteligente, incluyendo: Fuentes de datos OLAP Bases de datos relacionales Los datos estadsticos modelos Los modelos de minera de datos Pgina:http://openi.org/. Demo en lnea : http://demo.openi.org/openi/ (usuario/pass= openi2/openi2)
Cuenta con: reports (Ireport & BIRT engines)
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
3 INTRODUCCIN A PENTAHO BI SUITE 3.5 Web reports (Web interface for creation and data exploration) Olap views (FreeAnalysis engine) Dashboard (FreeDashboard engine) Key Performance Indicateors (FreeMetrics engine) Maps (Googlemap integration & Map engines) Obtener demo de: http://forge.bpm-conseil.com/ Documento de presentacin de la versin 2.2: http://www.bpm-conseil.org/vanilla22/documentation/BPM_Vanilla_Presentation_200_FR.pdf
Rpida adopcin del mercado de BI open source (Chile) (extrado de http://www.cognus.cl/content/view/598217)
El software open source representa la tendencia ms significativa, global y de ms largo plazo que la industria del software ha visto desde los comienzos de los 80s.
El software de BI open source estar probablemente en tu futuro: el tema real no es si estar, si no cuando
El BI open source est aqu para quedarse. El inters en la tecnologa de BI open source es tan alto como la bsqueda de las compaas por alternativas de productos comerciales disponibles de menor precio.
La plataforma Pentaho Open Source Business Intelligence (extrado de Todo BI - http://www.gravitar.biz - http://www.cognus.cl)
(extrado de: MySQL V5 Ready for Prime Time Business Intelligence - Seth Grimes) La plataforma Open Source Pentaho Business Intelligence cubre muy amplias necesidades de Anlisis de los Datos y de Informes empresariales. Cuenta con: Administracin y distribucin de reportes, anlisis y dashboards Fcil integracin de fuentes de datos, portales y aplicaciones usando estndares abiertos Programacin de tareas y autentificacin integradas Funcionalidades de customizacin a travs de APIs, Web Services o modificacin a plantillas, reglas de negocio o incluso el cdigo fuente Registro de auditora integrado para seguimiento de actividades de usuarios, performance y acceso a contenido Procesos basados en workflow que permiten implementar lgica de negocios nica
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
4 INTRODUCCIN A PENTAHO BI SUITE 3.5 Estado actual en que se encuentra la solucin y con que componentes cuenta.
Plataforma 100% J2EE, asegurando la escalabilidad, integracin y portabilidad. Servidor: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS. Base de datos: va JDBC, IBM DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, NCR Teradata, Firebird. Sistema operativo: no hay dependencia. Lenguaje interpretado. Lenguaje de programacin: Java, Javascript, JSP, XSL (XSLT/XPath/XSL-FO). Interfaz de desarrollo: Java SWT, Eclipse, Web-based. Repositorio de datos basado en XML. Todos los componentes estn expuestos va Web Services para facilitar la integracin con Arquitecturas Orientadas a Servicios (SOA). (extrado de Todo BI)
Pentaho se define a si mismo como una plataforma de BI orientada a la solucin y centrada en procesos que incluye todos los principales componentes requeridos para implementar soluciones basados en procesos y ha sido concebido desde el principio para estar basada en procesos. Las soluciones que Pentaho pretende ofrecer se componen fundamentalmente de una infraestructura de herramientas de anlisis e informes integrado con un motor de workflow de procesos de negocio, una de las capacidades BI claves de la plataforma. Es decir, la plataforma ser capaz de ejecutar las reglas de negocio necesarias, expresadas en forma de procesos y actividades y de presentar y entregar la informacin adecuada en el momento adecuado.
Informe tcnico
Pentaho est construdo en torno al servidor de aplicaciones J2EE JBoss y Jboss Portal (la versin 3.5 de la community edition viene con Tomcat), habilitando que toda la informacin sea accesible mediante un browser en la intranet de la empresa. Pentaho presenta informes en los formatos habituales (html, excel, pdf...) mediante JfreeReport, u otras plataformas como BIRT o JasperReports. Para la generacin de PDFs utilizan, como podra ser previsible, el conocidsimo Apache FOP. Asimismo incorpora la librera JPivot, gracias a la cual podemos ver tablas OLAP a travs de un browser y realizar las aplicaciones tpicas de anlisis OLAP (drill down, slice and dice...). Existe una alternativa para reemplazar jpivot que es PAT (Pentaho Analysis Tools (http://code.google.com/p/pentahoanalysistool/) Tambin Pentaho Report Design Wizard, una herramienta de diseo de informes, que facilita el trabajo con JfreeReport y supera sus limitaciones.
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
5 INTRODUCCIN A PENTAHO BI SUITE 3.5 Los dashboards son un desarrollo propio de Pentaho. Recogen informacin de todos los componentes de la plataforma incluyendo aplicaciones externas, feeds RSS y pginas web. Incluyen gestin y filtrado del contenido, seguridad basada en roles y drill down. Pueden ser integrados en terceras aplicaciones, en portales o dentro de la plataforma Pentaho. Para generar grficos se apoyan en JFreeChart, una librera para generar los grficos ms comunes (2D, 3D, barras, lneas series temporales, Gantt...), interfaces para acceder a diferentes fuentes de datos, exportacin a PNG, JPEG y PDF y soporte para servlets, JSPs, applets y aplicaciones clientes. Los WebServices son una caracterstica fundamental de Pentaho. Las acciones, que son las tareas ms sencillas que constituyen una solucin de Pentaho, pueden publicarse como WebServices. Pentaho utiliza como motor de WebServices Apache Axis, quedando los servicios descritos en el lenguaje de definicin de servicios web WSDL. Para entregar la informacin Pentaho se apoya en una infraestructura JMS para enviar correos electrnicos y Quartz, un scheduler opensource integrable en aplicaciones J2EE.
La corporacion Pentaho es el patrocinador primario y propietario del projecto Pentaho BI. El Pentaho BI es una iniciativa en curso por la comunidad de Open Source.
El proyecto Pentaho BI abarca los siguientes componentes:
Componentes de la plataforma Pentaho BI son: (extrado de Todo Bi - http://www.cognus.cl - http://www.gravitar.biz) La siguiente imagen muestra como interactuan los diferentes componentes de pentaho:
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
6 INTRODUCCIN A PENTAHO BI SUITE 3.5 http://kettle.pentaho.org Integracin de Datos:
Se realiza con una herramienta Kettle ETL (Pentaho Data Integration) que permite implementar los procesos de limpieza, transformacin y poblacin del DW. La versin - PDI 3.0 marc un gran paso adelante en OSBI ETL y hizo de Pentaho Data Integration una alternativa interesante para las herramientas comerciales. (SUM es aliado de negocios de Pentaho http://www.sun.com/third- party/global/pentaho/) o Se compone de 4 herramientas: - SPOON: permite disear de forma grfica la transformacin ETL. - PAN ejecuta la transformaciones diseadas con SPOON. - CHEF permite, mediante una interfaz grfica, disear la carga de datos incluyendo un control de estado de los trabajos. - KITCHEN permite ejecutar los trabajos batch diseados con Chef.
o Amplio soporte a fuentes de datos, ms de 30 bases de datos (open source y propietarias), archivos planos, Excel, y ms. o Arquitectura extensible permite desarrollar conectores y plug ins fcilmente. o Basado en repositorio facilita re uso de componentes de transformacin, colaboracin y administracin de modelos, conexiones, logs, etc. o Performance y escalabilidad de clase Enterprise con soporte a procesamiento masivo paralelo (MPP) a travs de ejecucin en cluster o Debugger integrado o Poblacin de Data warehouses con soporte built-in para dimensiones que cambian lentamente y dimensiones basura
Pentaho Anlisis: Suministra a los usuarios un sistema avanzado de anlisis de informacin. Con uso de las tablas dinmicas (pivot tables, crosstabs), generadas por Mondrian y JPivot, el usuario puede navegar por los datos, ajustando la visin de los datos, los filtros de visualizacin, aadiendo o quitando los campos de agregacin. Los datos pueden ser representados en una forma de SVG o Flash, los dashboard widgets, o tambin integrados con los sistemas de mineria de datos y los portales web (portlets). Adems, con el Microsoft Excel Analysis Services, se puede analizar los datos dinmicos en Microsoft Excel (usando la conexin a OLAP server Mondrian). Cuenta con: Despliegue grfico interactivo, con grillas de datos Resultados explorables y navegables incluso en los grficos Sofisticadas capacidades OLAP, arquitectura ROLAP Tcnicas de optimizacin para mejoras de tiempos de respuesta
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
7 INTRODUCCIN A PENTAHO BI SUITE 3.5
http://mondrian.pentaho.org o El servidor OLAP : Para obtener la funcionalidad de procesamiento analtico en lnea (OLAP) se utilizan dos aplicaciones: el servidor OLAP Mondrian, que combinado con Jpivot, permiten realizar querys a Datamarts, y que los resultados sean presentados mediante un browser y que el usuario pueda realizar drill down y el resto de las navegaciones tpicas. Algunas cuestiones interesantes sobre Mondrian: - Mondrian utiliza MDX como lenguaje de consulta, que no tendra nada de raro si no fuera porque fue un lenguaje propuesto por Microsoft. - En noviembre de 2005 Mondrian se incorpor al proyecto Pentaho. - Mondrian funciona sobre las bases de datos estndar del mercado: Oracle, DB2, SQL-Server, MySQL,PostgreSQL... lo cual habilita y facilita el desarrollo de negocio basado en la plataforma Pentaho. - JPivot est considerado con un proyecto hermano de Mondrian. Al incorporarse Mondrian tambin lo ha hecho JPivot
Pentaho Dashboards: Todos los componentes del modulo Pentaho Reporting y Pentaho Anlisis pueden formar parte de un Dashboard. En Pentaho Dashboards es muy fcil incorporar una gran variedad en tipos de grficos, tablas y velocmetros (dashboard widgets) e integrarlos con los Portlets JSP, en donde podr visualizar informes, grficos y anlisis OLAP. Identificacin de Indicadores (KPIs, Key Performance Indicators) o Monitoreo/Mtricas Investigar detalles subyacentes o Drill a reportes de soporte Seguimiento de excepciones o Alertas basadas en reglas del negocio
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
Para tal fin, Pentaho est incorporando la tecnologa WeKa. Decimos est incorporando, porque al da de hoy el roadmap de Pentaho indica que estn en ello. o Poderoso motor de minera de datos provee de un set de algoritmos de aprendizaje del proyecto Weka incluyendo clustering, segmentacin, rboles de decisin, random forests, redes neuronales y anlisis de componentes principales, entre otros. o Integracin de Pentaho Data Integration, automatizacin de procesos de transformacin de datos al formato que requiere el motor de data mining. o Los algoritmos pueden ser aplicados directamente a un set de datos o invocados desde cdigo Java. o Provee filtros para discretizacin, normalizacin, re-muestreo, seleccin de atributos, transformacin y combinacin de atributos. o Modelos para prediccin de variables nominales o numricas. o Herramientas grficas de diseo para preprocesamiento de datos, regresin, clustering, reglas de asociacin.
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
9 INTRODUCCIN A PENTAHO BI SUITE 3.5 http://reporting.pentaho.org
Reporting: Pentaho Reporting es una solucin basada en el proyecto JFreeReport (hay quienes usan BIRT) y permite generar informes gil y de gran capacidad. Permite la distribucin de los resultados del anlisis en mltiples formatos - todos los informes incluyen la opcin de imprimir o exportar a formato PDF, XLS, HTML y texto- y permiten tambin la programacin de tareas y ejecucin automtica de informes con una determinada periodicidad. Cuenta con: Implementacin flexible, desde solucin standalone de escritorio, a reportes interactivos basados en Inteligencia de Negocios Amplio soporte a fuentes de datos incluyendo datos relacionales, OLAP o basados en XML Solucin proporcionada por pentaho e integrada en su suite para el desarrollo de informes Existen tres productos con diferentes enfoques y dirigidos a diferentes tipos de usuarios. Pentaho Report Designer: Editor basado en eclipse con prestaciones profesionales y de calidad y con capacidad de personalizacin de informes a las necesidades de negocio destinado a desarrolladores. Incluye Asistentes para facilitar la configuracin de propiedades. Est estructurado de forma que los desarrolladores pueden acceder a sus prestaciones de forma rpida: Incluye un editor de consultas para facilitar la confeccin de los datos que sern utilizados en un informe. Pentaho Report Design Wizard: Herramienta de diseo de informes, que facilita el trabajo y permite a los usuarios obtener resultados de forma inmediata. Est destinada a usuarios con menos conocimientos tcnicos. A travs de pasos sencillos permite: Conectarse a todo tipo de bases relacionales Integrar el resultado dentro del portal pentaho Web ad-hoc reporting: Es el similar a la herramienta anterior pero via web. Extiende la capacidad de los usuarios finales para la creacin de informes a partir de plantillas preconfiguradas y siguiendo un asistente de creacin. Las caractersticas generales son: Proporciona funcionalidad crtica para usuarios finales como: o Acceso va web o Informes parametrizados o Scheduling o Suscripciones o Distribucon (bursting) Proporciona claras ventajas a especialistas en informes: o Acceso a fuentes de datos heterogeneos: relacional (va jdbc), OLAP, XML, transformaciones de pentaho data integration. o Capacidad de integracin en aplicaciones o portales: jsp, portlet, web service. o Definicin modular de informes (distincin entre presentacin y consulta) Diseo de informes flexible o Entorno de diseo grfico o Capacidad de uso de templates o Acceso a datos relacionales, OLAP y XML Desarrollado para: o Ser embebible o Ser fcil de extender o No consumir muchos recursos o 100% Java: portabilidad, escalabilidad e integracin Multiplataforma (tanto a nivel de cliente como servidor): mac, linux/unix y Windows
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
10 INTRODUCCIN A PENTAHO BI SUITE 3.5
El workflow de procesos de negocio: Dos son los fundamentos del workflow de procesos de negocio: el motor de workflow Enhydra Shark y el estndar WPDL, auspiciado por la WorkFlow Management Coalition (WFMC), organismo que declara tener ms de 300 empresas asociadas, incluyendo a las desconocidas IBM, Oracle, BEA, Adobe, SAP, TIBCO o SUN, por citar algunas de ellas.
COMMUNITY ENTERPRISE?
En el contexto Open Source, nos encontramos que la gran mayora de proveedores tienen una versin para la comunidad y otra profesional (por ejemplo Pentaho, JasperSoft,Talend, MySQL). En qu consiste? Existe una versin open source comunitaria con un conjunto de funcionalidades bien definidas, acotadas y plenamente operativas. Y una versin profesional que presenta o bien ms funcionalidades que la otra versin o bien una versin mejorada de las mismas funcionalidades. Pentaho soporta la creacin de Dashboards, pero slo la versin profesional presenta un Dashboard Designer Ad-hoc. Dichas funcional slo pueden ser accedida mediante la adquisicin de una subscripcin o de soporte. Versiones disponibles de Pentaho: 1. Pentaho Community Edition: Versin comunitaria, sin costos de licencia, sin servicios de soporte asociados. Es una suite completa con todas las funcionalidades necesarias para el correcto desarrollo de proyectos de Business Intelligence. Aunque Pentaho sol la recomienda para: Aficionados al BI Acadmicos Programadores de Software Abierto Pentaho recomienda la versin EE para entornos empresariales, especialmente cuando el tiempo de inactividad dedicado averiguar cmo instalar, configurar y mantener una solucin de inteligencia de negocios son prohibitivamente caro. Es totalmente software de cdigo abierto, la licencia en su mayora bajo la versin GNU General Public License versin 2, con partes bajo el LGPLv2, la Common Public License, y la Licencia Pblica de Mozilla.
2. Pentaho Enterprise Edition: Versin empresarial, sin costos de licencia, tiene asociados servicios de soporte y mantenimiento que se pagan a travs de una suscripcin anual. Es una versin certificada que adems posee algunas funcionalidades mejoradas para la consola de administracin, y para la construccin de tableros de control.
Comparativa: (extrado de Pentaho BI Suite Enterprise Edition)
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
11 INTRODUCCIN A PENTAHO BI SUITE 3.5
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
12 INTRODUCCIN A PENTAHO BI SUITE 3.5 Dnde conseguir ayuda?
Community Wiki Home http://wiki.pentaho.com/display/COM/Community+Wiki+Home
Este wiki contiene la documentacin y la informacin para el Open Source de Pentaho BI Suite Community Edition (CE). La suite incluye ETL, anlisis OLAP, los metadatos, la minera de datos, informes, cuadros de mando y una plataforma que le permite crear soluciones complejas a problemas de negocios. La comunidad Pentaho es un grupo extraordinario de personas con muchos talentos diferentes que se dedica a ofrecer una completa y bien integrada, de alta calidad y una suite de software de Business Intelligence.
Pentaho Community Forums http://forums.pentaho.org/
Por qu Pentaho? (extrado de Todo Bi - http://www.cognus.cl)
Mejores productos Cobertura completa de punta a punta de las necesidades de BI Calidad sin igual, comunidad extensa y adopcin empresarial Arquitectura moderna, construida sobre estndares y en base a componentes Servicios de administracin Mejor servicio Soporte a produccin disponible 24x7x365 Atencin a soporte por los verdaderos expertos Pentaho desde la primera llamada Capacitacin y consultora profesional Mejor valor Licencia open source sin costo Servicio de subscripcin y soporte a una fraccin de proveedores propietarios
Mejor relacin Completa transparencia Relacin basada 100% en la calidad del soporte al cliente
Herramientas Cliente (extrado de: Introducing the Pentaho BI Suite 3.5 Community Edition)
Las herramientas de cliente de Pentaho son:
Report Designer: una herramienta avanzada de creacin de informes. Ofrece mucho ms flexibilidad y funcionalidad que las capacidades de informes ad hoc de la consola de usuario Pentaho. (http://reporting.pentaho.org)
Designer Studio: Una herramienta basada en Eclipse que le permite editar a mano un informe o una view de anlisis xaction file. En general, la gente lo utiliza para hacer modificaciones a un informe existente que no se puede aadir con el Diseador de informes.
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
13 INTRODUCCIN A PENTAHO BI SUITE 3.5 Aggregation Designer: una herramienta grfica que ayuda a mejorar la eficiencia del cubo Mondrian.
Metadata Editor: Le permite agregar un capa de metadatos a una fuente de datos existentes. Normalmente se podra hacer esto de una fuente de datos que desea utilizar para el anlisis o la presentacin de informes. No es necesario, pero hace ms fcil para los usuarios construir consultas para analizar la base de datos.
Pentaho Data Integration: Herramientas de extraccin, transformacin y carga (ETL), que permite a acceder a fuentes de datos y prepararlas para el anlisis, la minera de datos, o la presentacin de informes.
Schema Workbench: una herramienta grfica que le ayuda a crear esquemas ROLAP para el anlisis.
Lo primero que debemos obtener es el BI-Server de Pentaho, su distribucin CE (Community Edition). Si buscamos en www.google.com.ar sourceforge pentaho el primer link devuelto no d la pgina de dnde bajar el Server. Desde la carpeta Business Intelligence Server, bajaremos biserver-ce- 3.5.2.stable.zip . Descomprimimos sobre un directorio PENTAHO y tendremos las siguiente estructura de directorio:
Pentaho/ administrationconsole/ biserver-ce/
El primero es la consola de administracin y el segundo es el servidor BI de Pentaho y contiene la consola de usuario.
Crear un directorio /pentaho/design-tools Descargaremos tambin la ltima versin estable de las herramientas cliente, no vamos a utilizar todas pero igual las bajaremos: o Schema Workbench (http://sourceforge.net/projects/mondrian/files/) o Report Designer (http://sourceforge.net/projects/pentaho/files/) o Report Wizard (http://sourceforge.net/projects/pentaho/files/) o Pentaho Design Studio (http://sourceforge.net/projects/pentaho/files/) o Pentaho Metadata (http://sourceforge.net/projects/pentaho/files/) o Data Integration (http://sourceforge.net/projects/pentaho/files/) Tendremos entonces la siguiente estructura de directories: Pentaho/ administrationconsole/ biserver-ce/ design-tools/ schema-workbench/ report-design/ report-wizard/ design-studio/ pentaho-metada/ data-integration/
Descargaremos el motor Postgresql 8.4 que usaremos como repositorio de datos. o PostreSQL 8.4.3-1 for windows incluye PGADMIN III (http://www.enterprisedb.com/products/pgdownload.do) o JDBC de PostgreSQL (http://jdbc.postgresql.org/download/postgresql-8.4-701.jdbc3.jar)
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
14 INTRODUCCIN A PENTAHO BI SUITE 3.5 Para mayor informacin de download ver: http://wiki.pentaho.com/display/COM/Community+Edition+Downloads
Repositorio de la solucin
Viene por default en un RDBMS, HyperSQL. Para este curso introductorio no lo cambiaremos, pero puede migrase a: MySQL 5.x PostgreSQL 8.x.x Oracle 10g & 11g
Prashant Raju nos d un buen aporte con esto: http://www.prashantraju.com/projects/pentaho/ En est pgina encontramos cmo migrar el repositorio a con los correspondientes script de migracin.
Qu deberamos conocer? (por Prashant Raju) sto son algunos paquetes que son tiles en Pentaho BI Server: Apache Tomcat (el server que bajamos ahora viene con un tomcat incorporado, pero puede compilarse para JBoss) o Descripcin: El servidor web que provee la plataforma para ser la parte front end de Pentaho BI Server. o Puerto: 8080 (predeterminado) o URL de acceso: http://localhost:8080/ o Sitio Web: http://www.apache-tomcat.com/ Hibernate o Descripcin: Un paquete Java que ayuda a la base de datos relacional trabajar con Pentaho. o Sitio Web: http://www.hibernate.org/ Jetty o Descripcin: El servidor web que provee una plataforma para la Consola del Administrador o Puerto: 8099 (predeterminado) o URL de accesos: http://localhost:8099/ o Sitio Web : http://www.jetty-server.com/ PostgreSQL o Descripcin: El servidor de base de datos que usaremos para trabajar con Pentaho o Puerto: 5432 (predeterminado) o URL de acceso Java: jdbc:postgresql://localhost:5432/pentaho Quartz o Descripcin: El sistema de calendario de reportes que Pentaho usa. o Sitio Web: http://www.opensymphony.com/quartz/ Hypersonic: o Descripcin: o Sitio Web: Ver terminologa usada en el proyecto Pentaho en http://wiki.pentaho.com/display/PEOpen/Pentaho+Terminology+Project
Configuracin Correo: La plataforma enva mensajes a travs del correo usando el SMTP Server. En la mayora de los casos requiere el ID del usuario, contrasea y una direccin de correo vlida. Para modificar estas configuraciones la ruta de omisin es: /pentaho/biserver-ce/pentaho-solutions/system/smtp-email/email_config.xml Puertos: El servidor tratar de usar el puerto 8080. En la siguiente ruta se ubica el archivo de configuracin de puerto: /pentaho/biserverp-ce/tomcatt/conf/server.xml Publicaciones: Herramientas del Cliente Pentaho publicadas en el servidor. Para disponer de las herramientas del cliente (Report Design Wizard, Cube Design Wizard, etc) y publicarlas al servidor se requiere de una contrasea. Para configurar la contrasea edite el siguiente archivo: /pentaho/biserver-ce/pentaho-solutions/system/publisher_config.xml Despliegue: La instalacin de PENTAHO est diseada para trabajar localmente en http://localhost:8080/pentaho como la URL de base.
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
15 INTRODUCCIN A PENTAHO BI SUITE 3.5 Para accederlo a travs de otra terminal, se requiere configurar el web.xml, ubicado en: /pentaho/biserver-ce/tomcat/webapps/pentaho/WEB-INF <context-param> <param-name>base-url</param-name> <param-value>http://myserver.pentaho.org:8080/pentaho</param-value> </context-param> JAVA_HOME : con esta distribucin de Pentaho viene una JRE. Setear la variable de entorno:
SET JAVA_HOME= /pentaho/biserver-ce/tomcat/jre
Start el Business Intelligence Server
Debemos correr el archivo startup.bat localizado en el directorio pentaho/biserver-ce, sinembargo si se quiere correr cmo un servicio de Windows: Primero hay que registrar el Tomcat como un servicio. /pentaho/biserver-ce/tomcat/bin> service.bat install tomcat5
Ver la siguiente salida: Installing the service 'tomcat5' ... Using CATALINA_HOME: D:\pentaho352\biserver-ce\tomcat Using CATALINA_BASE: D:\pentaho352\biserver-ce\tomcat Using JAVA_HOME: Using JVM: auto The service 'tomcat5' has been installed . El servicio sera instalado pero no ha sido iniciado, por lo que debemos iniciar el servicio, desde la consola de servicios de windows.
En este curso, estamos usando como repositorio de la solucin la base por defecto en HyperSonic, por lo que antes de levantar el servicio debemos poner disponible la base corriendo /pentaho/biserver- ce/data/Stara_hypersonic.bat (este se para con stop-hypersonic.bat en el mismo directorio); o bien ponerla tambin como un servicio.
Ahora tenemos podemos entrar a la Consola de Usuario ya que tenemos el servidor BI corriendo. http://localhost:8080/pentaho o si lo configur para el acceso desde la red http://[nombre o ip del servidor BI]:8080/
Podremos ver la siguiente pantalla de Bienvenida:
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
16 INTRODUCCIN A PENTAHO BI SUITE 3.5
Podemos ingresar seleccionar el usuario joe del combo con los usuarios para demo, que es el usuario con rol de administrador. La password es password. Veremos:
Si elegimos la vista ventana haciendo clic en el cono indicado, tendremos acceso a los dos directorios de soluciones ejemplos que vienen con Pentaho:
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
17 INTRODUCCIN A PENTAHO BI SUITE 3.5
Podemos darle un vistazo a los ejemplos y ver que se puede hacer con el producto
En este curso iniciaremos el servidor con /pentaho/biserver-ce/start-pentaho.bat y lo pararemos con stop-pentaho.bat
Start de la Consola de Administracin
Tener en cuenta que siempre debe estar corriendo primero el servidor BI. Ejecutar /pentaho/administration-console/start-pac.bat. Se abrir una ventana de commandos con la siguiente salida: Puede ingresar a la interfase en http://localhost:8099/ o la direccin que especifique en la ventana anterior. Ver una ventana de login que pedir usuario y clave; estas son "admin" y "password". Si ingresa ver la siguiente pginaI siguiente:
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
18 INTRODUCCIN A PENTAHO BI SUITE 3.5
Tomar unos segundos que identifique que el Server est disponible. Podremos ver entonces haciendo click en Administration, distintas solapas que nos permitirn definir Usuario y Roles, Datasource, ejecutar algunos servicios de mantenimiento y programar estas tarea:
Creamos un nuevo Datasource para la soluciones que vamos a implementar
1. Agregar JDBC para PostgreSQL a /pentaho/administration-console/jdbc/, ya que nuestro repositorio de datos est en la base pentaho, en el servidor de PostgreSQL. 2. En la solapa Database Connections agregamos otro DataSource: Name: SIU Driver Class: elegimos en el combo, org.postgresql.Driver Usuario: dba Password: dba URL: jdbc:postgresql://localhost:5432/pentaho
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)
19 INTRODUCCIN A PENTAHO BI SUITE 3.5
Antes de hacer el Test de la coneccin, completar la solapa Advanced:
3. La solapa de Services, nos servir para refrescar el repositorio (la cache) y la configuracin del sistema.
Lic. Ana Smail - (esta documentacin no es de produccin propia sino recopilacin de la informacin disponible)