Software Libre para la Toma de Decisiones FliSoL CUCEA 2016
2. 2. Inteligencia de Negocios - Business Intelligence Sabiduría Conocimiento Información Datos Hacer lo correcto Hacer las cosas bien ¿Por qué? ¿Qué es lo mejor? ¿Cómo hacerlo? ¿Qué? • Es obtener conocimiento a través de los datos que una organización tiene a su disposición para ayudar en la toma de decisiones. 3. 3. Business Intelligence Analysis • Análisis que pueden realizarse para la Inteligencia de Negocios: – Análisis estadístico – Pronósticos (Forecasting) – Minería de datos (Data Mining) – Optimización – Minería de Procesos 4. 4. Business Intelligence Reporting • El análisis de datos permite generar reportes o informes con la información y conocimientos obtenidos. • Tipos de reportes: – Informes predefinidos – Informes a la medida (ad-hoc) – Consultas y Cubos OLAP – Alertas 5. 5. Data Warehousing • Los Data Warehouses concentran la información de una organización en una base de datos diseñada para el análisis y la difusión eficiente de los datos. • Contiene todos los datos de los sistemas operacionales – Se organizan para que todos los datos relativos al mismo evento u objeto del mundo real queden relacionados entre sí. • La información no se modifica ni se elimina. – La información es read-only y solo accesible para consultas. 6. 6. ETL - Extract, Transform and Load ETL es la integración de los datos para poder ser analizados de una forma precisa y congruente. En la mayoría de los casos, la información que se quiere analizar se encuentra dispersa o los datos están “sucios”, es decir, no tienen las características ideales con la forma de trabajar de nuestras herramientas de inteligencia de negocios. 7. 7. Esquema de Proceso 8. 8. Extracción de Datos Este paso significa extraer datos de diversas fuentes de datos, tales como archivos XLS (Excel), archivos XML (facturas electrónicas, por ejemplo), bases de datos SQL (de nuestro ERP o sistema de planeación de recursos empresariales), bases de datos NoSQL, o simplemente de archivos TXT o puro texto. Con la fase de extracción, se valida si los datos tienen los valores correctos o esperados. 9. 9. Transformación de Datos En este proceso, se aplica una serie de reglas o funciones a una buena parte de los datos. Una función importante de la transformación es la limpieza de los datos, que tiene por objetivo el transmitir sólo los datos adecuados. Algunos de los procesos de transformación que se pueden aplicar son los siguientes 10. 10. • Elegir sólo ciertas columnas o filas. • Traducir valores codificados (0: masculino, 1: femenino) • Codificar valores (Aguascalientes:1, Jalisco:14) • Crear un Valor Calculado (ventas = cantidad * precio) • Agregación, acumulación y resumen de los valores. • Unir datos de diferentes fuentes y evitar duplicados • Transposición o pivote entre columnas y filas. • Separar una columna en diversas columnas 11. 11. Carga de Datos En esta fase se cargan los datos en el destino final que puede ser un archivo plano simple o un almacén de datos. Se pueden aplicar las restricciones definidas en el esquema de la BD, por lo que esta fase refleja si todo se ha realizado bien. Un uso alternativo para ETL es mover información hacia otra aplicación de forma permanente. La nueva aplicación podría utilizar un diferente proveedor de base de datos y podría tener un esquema muy diferente. 12. 12. ETL usando Kettle 13. 13. Algunas Herramientas Open Source – Pentaho – Jaspersoft – SpagoBI – RapidMiner – Palo – Eclipse BIRT Project – Logi Analytics 14. 14. Características de Pentaho • Es una de las herramientas más populares de BI. • Modelo de negocios basado en “Open Core” - Ofrece una versión de comunidad con las características principales de forma “open source” y gratuita, mientras que también se ofrece otra versión empresarial con características más avanzadas. • Pentaho tiene capacidades de integración de datos, servicios OLAP, informes, cuadros de mando, minería de datos y ETL. 15. 15. Herramientas de Pentaho 16. 16. Data Integration (Kettle): • Ofrece capacidades de ETL. • Diseña transformaciones y jobs de forma visual Report Designer: • Genera informes en Excel, PDF, HTML y más. Aggregation Designer: • Crea tablas agregadas y mejora rendimiento de análisis OLAP. Hadoop Shims: • Plugins para distribuciones de Hadoop. 17. 17. Características de Jaspersoft • Inició como una herramienta independiente para BI, su popularidad lo llevó a ser adquirida por Tibco, quienes tienen sus propias herramientas comerciales para BI (Spotfire). • Su modelo de negocios también está basado en “Open Core” • Además de ofrecer OLAP, informes y ETL, cuenta con un servidor donde se pueden almacenar los informes y realizar análisis. 18. 18. Proceso en Jaspersoft 19. 19. Herramientas de Jaspersoft Jaspersoft ETL: • Ofrece transformaciones y jobs de forma visual Jaspersoft Studio: • Genera informes con integración al Servidor, incluye librería JasperReports. JasperReports Server: • Ofrece Informes y Análisis en un Servidor autónomo y puede servir como un concentrador de información empresarial. 20. 20. Características de SpagoBI • Es la única suite de herramientas de BI 100% Open Source. • Su modelo de negocios está basado en Servicios y Consultoría • Es la que ofrece mayor cantidad de herramientas de todas, incluyendo ETL, Informes, Análisis OLAP, Gráficas Interactivas, Informes Ad-Hoc, Geolocalización, Minería de Datos, Análisis de Grafos, Automatización Ofimática, soporte móvil y más. 21. 21. Arquitectura de SpagoBI 22. 22. Módulos de SpagoBI SpagoBI Server: El núcleo de la suite incluyendo las herramientas de análisis. SpagoBI Studio: Entorno de desarrollo integrado. SpagoBI Meta: Entorno de los metadatos. SpagoBI SDK: La capa de integración que permite utilizar SpagoBI con herramientas externas SpagoBI Applications: Una colección de modelos analíticos verticales que se desarrollan utilizando SpagoBI. 23. 23. Fin de la Presentación