Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presentacion Pentaho OSBI SIU-DW
Presentacion Pentaho OSBI SIU-DW
5 Introduccin
Business Intelligence
Inteligencia de Negocios es el proceso de convertir datos en conocimientos y el conocimiento en accin, para la toma de decisiones
ANLISIS DATOS CONOCIMIENTO
Fases de un proceso BI
Pentaho OSBI
Open Source Business Intelligence
Qu es Pentaho? (1/2)
Proyecto Open Source (GNU GPL) cuyo objetivo es crear soluciones para Inteligencia de Negocios. Las funcionalidades principales son: Reporting empresarial y Anlisis. Tableros de mando. Minera de datos. Integracin de datos. Workflow, alertas, suscripciones, etc.
Qu es Pentaho? (2/2)
Plataforma orientada a la solucin y centrada en procesos. Compuesto por mltiples programas que trabajan juntos para crear y distribuir soluciones BI. (diferentes funcionalidades). Puede ser accedido desde un simple web browser, embebido en portales (LifeRay), embebido en sistemas de gestin (Alfresco). Su diseo modular le permite utilizar otros programas ajenos a la suite (BIRT, Jasper).
SIU Datawarehouse / Julio 2010
Principales proyectos
Pentaho Reporting (antes JFreeReport): http://reporting.pentaho.org Pentaho Data Integration (Kettle): http:// kettle.pentaho.org Pentaho Analysis (Mondrian OLAP server): http:// mondrian.pentaho.org Pentaho Data Mining (Weka): http:// weka.pentaho.org Pentaho Dashboards (CDF): http://www.pentaho.com/products/dashboards/ Pentaho BI Platform: http:// community.pentaho.com/projects/bi_platform/
SIU Datawarehouse / Julio 2010
Anlisis OLAP
Grfico s
Tableros de mando
Reporte s
Componentes (1/3)
Plataforma 100% J2EE, asegurando la escalabilidad, integracin y portabilidad. Servidor: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS. Base de datos: va JDBC, IBM DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, NCR Teradata, Firebird, etc.
Componentes (2/3)
Sistema operativo: no hay dependencia. Lenguaje interpretado. Lenguaje de programacin: Java, Javascript, JSP, XSL (XSLT/XPath/XSL-FO). Interfaz de desarrollo: Java SWT, Eclipse, Web-based. Repositorio de datos basado en XML. Todos los componentes estn expuestos va Web Services para facilitar la integracin con Arquitecturas Orientadas a Servicios (SOA).
Componentes (3/3)
Arquitectur a
Existen dos versiones disponibles de Pentaho Pentaho Community Edition Pentaho Enterprise Edition (*)
(*) (Costo de soporte 10.000 US$/ao hasta 25 usuarios 1 semestre 2010) http://desarrollos.siu.edu.ar/trac/datawarehouse/attachment/wiki/Informacin%20de%20inters/lower%20costs%20with%20OSBI.pdf
Community Enterprise?
Community Enterprise?
Community Enterprise?
Suites BI
Pentaho Community Edition (CE): Aplicacin web desarrollada en J2EE. Modular. Multiplataforma. Incluye: ETL, Reporting, OLAP, Data mining, Dashboards. GNU GPL.
OpenI: Aplicacin de tipo SaaS. Desarrolada en J2EE. Multiplataforma. Incluye: OLAP. Licencia Open Source.
SIU Datawarehouse / Julio 2010
Suites BI
SpagoBI: Aplicacin web desarrollada en J2EE. Modular. Multiplataforma. Incluye: ETL, Reporting, OLAP, Data mining, Dashboards. Licencia GNU LGPL.
JasperSoft Community Edition: Aplicacin de tipo SaaS. Modular. Multiplataforma. Incuye: ETL, Reporting, OLAP, Dashboards. Licencia GNU GPL.
SIU Datawarehouse / Julio 2010
Suites BI
Palo Community Version: Orientada a Planificacin y Presupuestos. Basada en AJAX. Multiplataforma. Incluye: ETL, Reporting, OLAP. Licencia Open Source.
Introduccin (1/4)
Usos comunes
Carga de datawarehouses y datamarts. Integracin de datos. Limpieza de datos (Data cleansing). Migracin y depuracin de datos. Exportacin de datos. Integracin de PDI usando Pentaho BI. ...
SIU Datawarehouse / Julio 2010
Introduccin (2/4)
Pentaho Data Integration (PDI) - Kettle Kettle Extraccin, Transformacin, y Carga. Licencia GNU LGPL. Las soluciones de PDI se basan en dos tipos de objetos diferentes: Transformaciones Trabajos PDI cuenta con un Motor propio que le permite interpretar, planificar y ejecutar Transformaciones y Trabajos (T&T).
Introduccin (3/4)
PDI cuenta con herramientas y utilidades para crear, administrar y ejecutar T&T: Spoon: IDE grfico para crear T&T. Kitchen: herramienta de lnea de comandos para ejecutar Trabajos. Pan: herramienta de lnea de comandos para ejecutar Transformaciones. Carte: servidor liviano para ejecutar T&T en host remotos.
Las T&T utilizan un lenguaje descriptivo (XML), el cual ser interpretado por el Data Integration Engine para su ejecucin.
SIU Datawarehouse / Julio 2010
Introduccin (4/4)
Catlogo Sin Catlogo: se almacenan y gestionan las T&T en algn directorio. Con Catlogo: se utiliza una BD Relacional para almacenar y gestionar T&T.
Kettle en el proceso de BI
Componentes PDI
Trabajo (job)
Orientacin a la Tarea y a los Datos. Usualmente un Trabajo se compone de una o ms Transformaciones, que sern ejecutadas secuencialmente. La ejecucin de cada Entrada de Trabajo presenta una salida de status, que puede ser analizada para la realizacin de diferentes acciones.
Transformacin (transformation)
Ejemplo:
Trabajo (job)
Ejemplo: Carga de un DW
Interfase grfica
Demo
Bibliografa
Roland Bouman, Jos van Dongen, 2009. Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho and MySQL. Wiley Publishing, Inc. Mara Carina Roldan, 2010. Pentaho 3.2 Data Integration - Beginner's Guide. Packt Publishing. Ing. Bernabeu Ricardo Dario, 2010. DATA WAREHOUSING:Investigacin y Sistematizacin de Conceptos HEFESTO: Metodologa propia para la Construccin de un Data Warehouse. http://tgx-hefesto.blogspot.com/2010/07/hefesto-v20.html Matt Casters. Pentaho Data Integration 4 and MySQL.. MySQL User Conference, Tuesday April 13th , 2010. http://community.pentaho.com http://kettle.pentaho.org http://todobi.blogspot.com
Preguntas?
Muchas Gracias!!!