Está en la página 1de 46

Pentaho (BI Open Source)

Lic. Ana Smail


Ao 2010

Pentaho (BI Open Source)


OSBI - Concepto
En el rea de Business Intelligence, se ha
producido recientemente un despegue
espectacular en el desarrollo de soluciones e
implementacin de herramientas Open
Source.
La cantidad de proyectos libres de licencias
en este segmento y el nmero de personas
implicadas demuestran que existe capacidad
para que se desarrolle de formas muy
diferentes y complementarias a la vez.
(extrado de http://www.corebi.com)

Ao 2010

Pentaho (BI Open Source)


Por qu OSBI ?

Adaptabilidad a todos los entornos.


Sin costos de licencias
Independencia del proveedor
Seguridad
Garantas de permanencia. Upgrades y mejoras
frecuentes
Tendencia a la calidad y utilizacin de estndares
Dedicacin full a los servicios y a la solucin de
negocios
Gran aprovechamiento de Web Services y
tecnologa SOA
La comunidad del software libre

Los proyectos BI deberan ser proyectos a largo plazo, porque de


ellos depende no slo el presente de nuestras decisiones, sino el
futuro.
Ao 2010

Pentaho (BI Open Source)


OSBI existentes

Ao 2010
(extrado de: http://redcloverbi.wordpress.com/2009/06/20/bi-open-source-%C2%BFcual/ - 20/06/2009)

Pentaho (BI Open Source)


OSBI existentes
Una funcionalidad muy interesante es que admite el uso de
diferentes motores OLAP que dan respuesta a la necesidad sin
diferenciar si en dicho mbito usamos una solucin open source
o propietaria. Por ejemplo, podemos usar Mondrian es ROLAP y
PALO es MOLAP. De manera que ambos motores se
complementan.
OLAP: soporta los motores Mondrian, PALO y Microsoft
Analysis Services.
Informes: soporta los motores de JasperReports, BIRT y Cristal
Reports.
ETL: soporta los motores de Talend, Oracle Warehouse Builder
y Data Stage.
Dashboard: soporta los motores de Lazlo y Tibco.
Anlisis geogrfico: soporta mapserver y sbigeo.
Data Mining: soporta weka,
(extrado de http://todobi.blogspot.com/2009/04/novedades-en-spagobi.html)

Ao 2010

Pentaho (BI Open Source)


OSBI existentes

(extrado de http://todobi.blogspot.com/2009/04/novedades-en-spagobi.html)

Ao 2010

Pentaho (BI Open Source)


OSBI existentes
SpagoBI Server: nucleo central de SpagoBI que integra la
funcionalidad de los diferentes motores, gestin de usuarios,
etc.
SpagoBI Studio: entorno de desarrollo nico e integrado.
SpagoBI Meta: entorno enfocado a la capa de metadatos.
SpagoBI SDK: un nuevo nivel de integracin para utilizar
SpagoBI con aplicaciones externas
SpagoBI Applications: para mantener los modelos verticales
de anlisis desarrollados con SpagoBI.
Esta es una solucin enteramente Open Source.
En la pgina oficial puede verse una demo en lnea de la suite
(http://spagobi.ow2.org)

(extrado de http://todobi.blogspot.com/2009/04/novedades-en-spagobi.html)

Ao 2010

Pentaho (BI Open Source)


OSBI existentes
Es una aplicacin de Inteligencia de Negocios, diseado para el uso
basado en la web. Basado en Java EE con la aplicacin por defecto para
correr en tomcat, OpenI es una solucin para la construccin y
publicacin de informes de XMLA compatible con fuentes de datos
OLAP, como Microsoft Analysis Services o Mondrian. Su objetivo es
proporcionar anlisis consolidado de los principales componentes de
datos de una aplicacin inteligente, incluyendo:

Fuentes de datos OLAP


Bases de datos relacionales
Los datos estadsticos modelo
Los modelos de minera de datos
Pgina:http://openi.org/. Demo en lnea :
http://demo.openi.org/openi/ (usuario/pass= openi2/openi2)
Ao 2010

Pentaho (BI Open Source)


OSBI existentes
Con qu cuenta:
Reports (Ireport & BIRT engines)
Web reports (Web interface for creation and data exploration)
Olap views (FreeAnalysis engine)
Dashboard (FreeDashboard engine)
Key Performance Indicateors (FreeMetrics engine)
Maps (Googlemap integration & Map engines)
Obtener demo de: http://forge.bpm-conseil.com/
Documento de presentacin de la versin 2.2:

http://www.bpm-conseil.org/vanilla22/documentation/BPM_Vanilla_Presentation_200

Ao 2010

Pentaho (BI Open Source)


La plataforma Pentaho Open Source Business Intelligence

(extrado de Todo BI - http://www.gravitar.biz - http://www.cognus.cl)

Ao 2010

Pentaho (BI Open Source)


La plataforma Pentaho Open Source Business Intelligence

La plataforma Open Source Pentaho Business Intelligence cubre


muy amplias necesidades de Anlisis de los Datos y de
Informes empresariales. Las soluciones de Pentaho estn
escritas en Java y tienen un ambiente de implementacin
tambin basado en Java.
Administracin y distribucin de reportes, anlisis y
dashboards
Fcil integracin de fuentes de datos, portales y aplicaciones
usando estndares abiertos
Programacin de tareas y autentificacin integradas
Funcionalidades de customizacin a travs de APIs, Web
Services o modificacin a plantillas, reglas de negocio o incluso
el cdigo fuente
Registro de auditora integrado para seguimiento de
actividades de usuarios, performance y acceso a contenido
Procesos basados en workflow que permiten implementar
lgica de negocios nica
Ao 2010

Pentaho (BI Open Source)


Estado actual de la solucin y componentes

Ao 2010

Pentaho (BI Open Source)


Estado actual de la solucin y componentes
Plataforma 100% J2EE, asegurando la escalabilidad,
integracin y portabilidad.
Servidor: puede correr en servidores compatibles con J2EE
como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS.
Base de datos: va JDBC, IBM DB2, Microsft SQL Server,
MySQL, Oracle, PostgreSQL, NCR Teradata, Firebird.
Sistema operativo: no hay dependencia. Lenguaje
interpretado.
Lenguaje de programacin: Java, Javascript, JSP, XSL
(XSLT/XPath/XSL-FO).
Interfaz de desarrollo: Java SWT, Eclipse, Web-based.
Repositorio de datos basado en XML.
Todos los componentes estn expuestos va Web Services
para facilitar la integracin con Arquitecturas Orientadas a
Servicios (SOA).
(extrado de Todo BI)

Ao 2010

Pentaho (BI Open Source)


Estado actual de la solucin y componentes
Pentaho se define a si mismo como una plataforma de BI

orientada a la solucin
centrada en procesos
que incluye todos los principales componentes requeridos para
implementar soluciones basados en procesos y ha sido
concebido desde el principio para estar basada en procesos.
Las soluciones que Pentaho pretende ofrecer se componen
fundamentalmente de una infraestructura de herramientas de
anlisis e informes integrado con un motor de workflow de
procesos de negocio, una de las capacidades BI claves
de la plataforma.
(extrado de Todo BI)

Ao 2010

Pentaho (BI Open Source)


Component
es
de la
plataforma
Pentaho BI

Ao 2010

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
BI

de Datos
Se compone Integracin
de 4 herramientas:
SPOON: permite disear de forma grfica la transformacin
ETL.
PAN ejecuta la transformaciones diseadas con SPOON.
CHEF permite, mediante una interfaz grfica, disear la
carga de datos incluyendo un control de estado de los
trabajos.
KITCHEN permite ejecutar los trabajos batch diseados con
Ao 2010
Chef.

http://kettle.pentaho.org

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
BI

http://kettle.pentaho.org

Ao 2010

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
BI
Despliegue
grfico
Anlisis de Datos
interactivo,
con grillas de
datos
Resultados
explorables y
navegables
incluso en los
grficos
Sofisticadas
capacidades
OLAP,
arquitectura
ROLAP
Tcnicas de
optimizacin
para mejoras
http://kettle.pentaho.org

Ao 2010

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
BI
Anlisis de Datos

El servidor OLAP : Para obtener la


funcionalidad de procesamiento analtico en lnea
(OLAP) se utilizan dos aplicaciones combinadas
el servidor OLAP Mondrian, y

Jpivot,
Ambos permiten realizar querys a Datamarts, y
que los resultados sean presentados mediante un
browser y que el usuario pueda realizar drill
down y el resto de las navegaciones tpicas.
( http://mondrian.pentaho.org )

Ao 2010

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
BI
AlgunasAnlisis
cuestiones
sobre Mondrian:
de interesantes
Datos
Mondrian utiliza MDX como lenguaje de consulta,
que no tendra nada de raro si no fuera porque fue
un lenguaje propuesto por Microsoft.
En noviembre de 2005 Mondrian se incorpor al
proyecto Pentaho.
Mondrian funciona sobre las bases de datos
estndar del mercado: Oracle, DB2, SQL-Server,
MySQL,PostgreSQL... lo cual habilita y facilita el
desarrollo de negocio basado en la plataforma
Pentaho.
JPivot est considerado con un proyecto hermano
de Mondrian.
lo ha
( http://mondrian.pentaho.org
) Al incorporarse Mondrian tambin
Ao
2010

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
BI
Pentaho Dashboards
Todos los componentes del modulo Pentaho
Reporting y Pentaho Anlisis pueden formar
parte de un Dashboard.
Identificacin de Indicadores (KPIs, Key
Performance Indicators)
Monitoreo/Mtricas
Investigar detalles subyacentes
Drill a reportes de soporte
Seguimiento de excepciones
Alertas basadas en reglas del negocio

Ao 2010

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
BI
Pentaho Dashboards

Ao 2010

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
Pentaho est incorporando la tecnologa WeKa.
BI
Pentaho Datamining

Poderoso motor de minera de datos provee de un set


de algoritmos de aprendizaje del proyecto Weka
incluyendo clustering, segmentacin, rboles de
decisin, random forests, redes neuronales y anlisis de
componentes principales, entre otros.
Integracin de Pentaho Data Integration,
automatizacin de procesos de transformacin de
datos al formato que requiere el motor de data
mining.
Los algoritmos pueden ser aplicados
directamente a un set de datos o invocados desde
cdigo Java.
Provee filtros para discretizacin, normalizacin,
re-muestreo, seleccin de atributos,
transformacin y combinacin de atributos.
Modelos para prediccin de variables nominales
o numricas.
Herramientas grficas de diseo para
(http://www.sourceforge.net/projects/weka)
Ao 2010
preprocesamiento de datos, regresin, clustering,

Pentaho (BI Open


Componentes
de la Source)
plataforma Pentaho
BI
Pentaho Datamining

Ao 2010

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
BI
Pentaho Reporting

Es una solucin basada en el proyecto


JFreeReport (hay quienes usan BIRT).
Permite la distribucin de los resultados del
anlisis en mltiples formatos - todos los
informes incluyen la opcin de imprimir o
exportar a formato PDF, XLS, HTML y texto- y
permiten tambin la programacin de tareas y
ejecucin automtica de informes con una
determinada periodicidad.
http://reporting.pentaho.org

Ao 2010

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
BI
Pentaho Reporting

Esta herramienta cuenta con:


Implementacin flexible, desde solucin standalone de
escritorio, a reportes interactivos basados en
Inteligencia de Negocios
Amplio soporte a fuentes de datos incluyendo datos
relacionales, OLAP o basados en XML
Solucin proporcionada por pentaho e integrada en su
suite para el desarrollo de informes
http://reporting.pentaho.org

Ao 2010

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
BI
Pentaho Reporting

Existen tres productos con diferentes enfoques y dirigidos


a diferentes tipos de usuarios:
Pentaho Report Designer
Pentaho Report Design Wizard
Web ad-hoc reporting
(http://reporting.pentaho.org)

Ao 2010

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
BI
Pentaho Reporting

Ao 2010

Pentaho (BI Open Source)


Componentes de la plataforma Pentaho
BI
Pentaho Workflow de Procesos de Negocio
Existen dos fundamentos del Workflow de Procesos de
Negocio:
El motor de workflow Enhydra Shark
El estndar WPDL, auspiciado por la WorkFlow
Management Coalition (WFMC), organismo que declara
tener ms de 300 empresas asociadas, incluyendo a las
desconocidas IBM, Oracle, BEA, Adobe, SAP, TIBCO o SUN,
por citar algunas de ellas.

Ao 2010

Pentaho (BI Open Source)


COMMUNITY ENTERPRISE?
Existen dos versiones disponibles de Pentaho

Pentaho Community Edition


Pentaho Enterprise Edition

Ao 2010

Pentaho (BI Open Source)


COMMUNITY ENTERPRISE?
Pentaho Community Edition

Versin comunitaria, sin costos de licencia, sin servicios de


soporte asociados. Es una suite completa con todas las
funcionalidades necesarias para el correcto desarrollo de
proyectos de Business Intelligence. Aunque Pentaho sol la
recomienda para:
Aficionados al BI
Acadmicos
Programadores de Software Abierto
Es totalmente software de cdigo abierto, la licencia en su
mayora bajo la versin GNU General Public License versin 2,
con partes bajo el LGPLv2, la Common Public License, y la
Licencia Pblica de Mozilla.
Ao 2010

Pentaho (BI Open Source)


COMMUNITY ENTERPRISE?
Pentaho Enterprise Edition
Versin empresarial, sin costos de licencia.
Tiene asociados servicios de soporte y mantencin
que se pagan a travs de una suscripcin anual.
Es una versin certificada que adems posee algunas
funcionalidades mejoradas para la consola de
administracin, y para la construccin de tableros de
control.

Ao 2010

Pentaho (BI Open Source)


COMMUNITY ENTERPRISE?
Comparativa

(extrado de Pentaho BI Suite Enterprise Edition)

Ao 2010

Pentaho (BI Open Source)


COMMUNITY

ENTERPRISE
?

Comparativa
(extrado de Pentaho BI Suite Enterprise Edition)

Ao 2010

Pentaho (BI Open Source)


Dnde conseguir ayuda ?
Pentaho Community
Community Wiki Home

http://wiki.pentaho.com/display/COM/Community+Wiki+Home

Community Forums
http://forums.pentaho.org/
http://forums.pentaho.org/

Ao 2010

Pentaho (BI Open Source)


Por qu Pentaho ?
Mejores productos

Cobertura completa de punta a punta de las necesidades de BI


Calidad sin igual, comunidad extensa y adopcin empresarial
Arquitectura moderna, construida sobre estndares y en base a co
Servicios de administracin

Mejor servicio

Soporte a produccin disponible 24x7x365


Atencin a soporte por los verdaderos expertos Pentaho desde la
Llamada
Capacitacin y consultora profesional

(extrado de Todo Bi - http://www.cognus.cl)

Ao 2010

Pentaho (BI Open Source)


Por qu Pentaho ?
Mejor valor

Licencia Open Source sin costo


Servicio de subscripcin y soporte a una fraccin de proveedores p

Mejor relacin
Completa transparencia
Relacin basada 100% en la calidad de soporte al cliente

(extrado de Todo Bi - http://www.cognus.cl)

Ao 2010

Pentaho (BI Open Source)


Herramientas cliente
Report Designer (http://reporting.pentaho.org)
(http://reporting.pentaho.org)
Designer Studio
Aggregation Designer
Metadata Edition
Pentaho Data Integration
Schema Workbench
(extrado de: Introducing the Pentaho BI Suite 3.5 Community Edition)

Ao 2010

Pentaho (BI Open Source)


Instalacin
Qu necesitamos descargar ?
BI-Server de Pentaho, su distribucin CE (Community Edition)
Pentaho/
administrationconsole/
biserver-ce/
Crear un directorio /pentaho/design-tools

Schema Workbench (http://sourceforge.net/projects/mondrian/files


Report Designer (http://sourceforge.net/projects/pentaho/files/
(http://sourceforge.net/projects/pentaho/files
Report Wizard (http://sourceforge.net/projects/pentaho/files/)
Pentaho Design Studio (http://sourceforge.net/projects/pentah
Pentaho Metadata (http://sourceforge.net/projects/pentaho/file
Data Integration (http://sourceforge.net/projects/pentaho/files
(http://sourceforge.net/projects/pentaho/files/)

Ao 2010

Pentaho (BI Open Source)


Instalacin
Qu necesitamos descargar ?
Tendremos entonces la siguiente estructura
de directorios:
Pentaho/
administrationconsole/
biserver-ce/
design-tools/
schema-workbench/
report-design/
report-wizard/
design-studio/
pentaho-metada/
data-integration/

Descargaremos el motor Postgresql 8.4 que usaremos como reposit

PostreSQL 8.4.3-1 for windows incluye PGADMIN III

(http://www.enterprisedb.com/products/pgdownload.do)

JDBC de PostgreSQL (http://jdbc.postgresql.org/download/postgres


Para mayor informacin de download ver:
http://wiki.pentaho.com/display/COM/Community+Edition+Downloads
(http://sourceforge.net/projects/pentaho/files/)

Ao 2010

Pentaho (BI Open Source)


Instalacin
Repositorio de la solucin
Viene por default en un RDBMS, HyperSQL. Para este
curso introductorio no lo cambiaremos, pero puede
migrase a:
MySQL 5.x
PostgreSQL 8.x.x
Oracle 10g & 11g
Prashant Raju nos d un buen aporte con esto:
http://www.prashantraju.com/projects/pentaho/
En est pgina encontramos cmo migrar el repositorio a
con los correspondientes script de migracin.
(http://sourceforge.net/projects/pentaho/files/)

Ao 2010

Pentaho (BI Open Source)


Qu deberamos conocer ?
Apache Tomcat
Hibernate
Jetty
PostgreSQL
Quartz
Hypersonic
Ver terminologa usada en el proyecto Pentaho en
http://wiki.pentaho.com/display/PEOpen/Pentaho+Terminology+Project
(por Prashant Raju)

Ao 2010

Pentaho (BI Open Source)


Instalacin
Configuracin
Correo
/pentaho/biserver-ce/pentaho-solutions/system/smtpemail/email_config.xml
Puertos
/pentaho/biserverp-ce/tomcatt/conf/server.xml
Publicaciones
/pentaho/biserver-ce/pentaho-solutions/system/publisher_config.xml
Despliegue
/pentaho/biserver-ce/tomcat/webapps/pentaho/WEB-INF
<context-param>
<param-name>base-url</param-name>
<param-value>http://myserver.pentaho.org:8080/pentaho</paramvalue>
</context-param>
JAVA HOME
SET JAVA_HOME= /pentaho/biserver-ce/tomcat/jre
(http://sourceforge.net/projects/pentaho/files/)

Ao 2010

Pentaho (BI Open Source)


Instalacin
Iniciar el Business Intelligence Server
Registrar el Tomcat como un servicio
/pentaho/biserver-ce/tomcat/bin> service.bat
install tomcat5
Iniciar el servicio, desde la consola de
servicios de windows.
Entrar a la Consola de Usuario ya que tenemos el
servidor BI corriendo. http://localhost:8080/pentaho
Ingresar seleccionar el usuario joe del combo
con los usuarios para demo, que es el usuario con rol
de administrador. La password es password.
(http://sourceforge.net/projects/pentaho/files/)

Ao 2010

Pentaho (BI Open Source)


Instalacin
Iniciar la Consola de Administracin
Tener en cuenta que siempre debe estar corriendo
primero el servidor BI.
Ejecutar /pentaho/administration-console/start-pac.bat.
Se abrir una ventana de comandos cuya ltima lnea
mostrar: console if now started. It can be accessed using
http://[servidor]:8099
Puede ingresar a la interfase en http://localhost:8099/ o
la direccin que especifique en la ventana anterior. Ver
una ventana de login que pedir usuario y clave; estas son
"admin" y "password".
Creamos un nuevo Datasource para las soluciones que
vamos a implementar
(http://sourceforge.net/projects/pentaho/files/)

Ao 2010

Preguntas
Lic. Ana Smail
(anasmail@unnoba.edu.
ar)
Ao 2010