Está en la página 1de 6

Trabajo Colaborativo III Parcial

Arias Marcelo, Diaz David & Tovar Jerry


Departamento Ciencias de la Computación,
Universidad de las Fuerzas Armadas
ESPE, Ecuador
mjarias4@espe.edu.ec
dadiaz14@espe.edu.ec
jjtovar@espe.edu.ec

Abstract— Este trabajo colaborativo requiere el análisis y 5) Pentaho Analysis Services: Es compatible con el MDX,
desarrollo de una propuesta de proyecto de BI en Pentaho y el lenguaje de conducta XML para el análisis y
Enterprise Edition, el cual debe contener los componentes de especificaciones de la interfaz
datos y tratamiento, almacenamiento y explotación de la data.
III. FASES DEL DISEÑO DEL PROYECTO BI
I. INTRODUCCIÓN
Pentaho es una plataforma de Business Intelligence A. Análisis y requerimientos: (requerimientos y mapeo de
(BI) orientada a la solución y centrada en procesos que incluye fuentes)
los componentes requeridos para implementar soluciones En la etapa inicial es importante conocer las fuentes de
basadas en procesos como minería de datos, ETL, generación datos que se tienen y qué datos son los que se deben limpiar y
de informes. almacenar en el data Warehouse para poner comenzar el
Actualmente, muchas empresas utilizan Pentaho como proceso de ETL.
herramienta BI para la mejora de la capacidad de análisis y
de toma de decisiones, puesto que ofrece soluciones que se
componen fundamentalmente de una infraestructura de
herramientas de análisis e informes integrado con un motor
de workflow de procesos de negocio.

Fig. 2 Mapeo de fuentes de nuestra base de datos de Excel

Fig. 1 Logo de la aplicación Pentaho Enterprise Edition

II. DESARROLLO DE CONTENIDOS


A partir de esta sección, se desarrollan los contenidos del
tema, de una forma ordenada y secuencial. Nótese que la
sección debe ir organizada usando títulos como el anterior
para cada tema nuevo incluido. Aparte, se incluyen subtítulos
como el siguiente. Fig. 3 Mapeo de fuentes de nuestra base de datos de MySQL
Pentaho nos ofrece una serie de útiles productos como son
los siguientes: B. Modelado: (tabla de dimensiones y hechos)
1) Pentaho Reporting: Es un motor de presentación capaz El modelado multidimensional del data Warehouse
de generar informes programáticos sobre la base de un involucra la creación de tablas de hecho y tablas de
archivo de definición XML. dimensiones. Al momento de usar la transformación y carga
en la base de datos MySQL se recomienda comenzar por las
2) Pentaho Dashboard: Es una plataforma integrada para
tablas de dimensiones que no dependen de otra tabla y
proporcionar información sobre sus datos, donde se pueden finalizar con las de hechos.
ver informes, gráficos, etc.
Tanto las tablas de dimensiones y las tablas de hecho deben
3) Pentaho Data Mining: Es una suite de software que ser creadas en la base de datos para su carga posterior. Las
usa estrategias de aprendizaje de máquina, automático y tablas deben contener los mismos campos seleccionados en la
minería de datos. Cuenta con las herramientas necesarias para transformación de ETL para una correcta carga.
apoyar las tareas de análisis descriptivo.
4) Pentaho para Apache Hadoop: Es un conector de bajo
nivel para facilitar el acceso a grandes volúmenes manejados
en el proyecto Apache Hadoop.
b) Excel: Excel, es una herramienta que podemos utilizar
para gestionar la información, mantenerla ordenada y
estructurada, con el fin de que podamos encontrar los datos
de manera fácil, donde podemos observar los mismos
atributos que en las demás bases de datos.

Fig. 8 Tablas de dimensiones en Excel


Fig. 4 Tablas de dimensiones en Estrella
c) MySQL: es un sistema de gestión de bases de datos
relacional y está considerada como la base de datos de código
abierto más popular del mundo, donde podemos observar los
mismos atributos que en las demás bases de datos.

Fig. 5 Atributos de la base de datos en MySQL


C. Desarrollo: (Procesos ETL, metadatos) Fig. 9 Tablas de dimensiones en MySQL

1) Creación de tabla de dimensiones: Con la ayuda de las


herramientas de Spoon se debe extraer los datos de las 2) Creación de tabla de hechos: El proceso es similar a la
diferentes fuentes, para su posterior transformación. El creación de tablas de dimensiones, al ser una tabla que contiene
proceso de limpieza de la data se ayuda de ítems de datos cuantificados se recomienda las transformaciones
ordenación de filas y de filtrado de filas únicas, es decir no haciendo uso de la sección Metadatos a partir del cual se
repetidas. La tabla de output se carga a la base de datos Data pueden corregir los tipos de datos y sus atributos. La tabla de
Warehouse en su tabla de dimensión correspondiente. output se carga a la base de datos Data Warehouse en su tabla
de dimensión correspondiente.
ACCESS

Fig. 6 Extracción de datos de diferentes fuentes


a) Access DB: Microsoft Access es un sistema de gestión
de bases de datos incluido en las ediciones profesionales de
la suite Microsoft Office, donde podemos observar los Fig. 10 Carga del Archivo de la base de datos en Access
mismos atributos que en las demás bases de datos.

Fig. 7 Tablas de dimensiones en Access


Fig. 14 Modelo del proyecto de BI en Pentaho Enterprise Edition

Fig. 11 Carga de los atributos, mostrados en el archivo formato accdb D) Explotación de data: (análisis y reportes)
Una vez cargadas las tablas en el Data Warehouse creado en
mysql se debe realizar la correspondencia entre claves
EXCEL principales de la tabla de hechos con sus respectivas
dimensiones.

Fig. 12 Carga del Archivo de la base de datos en Excel

Fig. 15 Carga de los atributos, mostrados en el archivo formato xls

Su posterior análisis se debe realizar usando Pentaho User


Console a partir del cual se debe agregar el data ware y realizar
reportes de las tablas de dimensiones y hechos según los
requerimientos.

Fig. 13 Carga de los atributos, mostrados en el archivo formato xls

MYSQL
Fig. 16 Carga de los atributos, mostrados en el archivo formato xls

Fig. 14 Conexión a la base de datos en phpMyAdmin, carga de los atributos Fig. 17 Carga de los atributos, mostrados en el archivo formato xls

Una vez dentro del Pentaho User Console, nos vamos a crear
Modelo del proyecto
nuevo Data Source.

Fig. 18 Creación de Data Source


Fig. 21
Ponemos nombre a nuestra base de datos y seleccionamos
DataBase Table y añadimos una nueva conexión: Generamos los reportes de nuestra bases de datos, tales
como:

REPORTE DE PLACAS

Fig. 19 Nombre a nuestra base de datos

Creamos la nueva conexión a la base de datos con el


nombre de dataware y salió conexión exitosa.

Fig. 20 Conexión a la base de datos exitosa

Creamos un reporte interactivo y seleccionamos nuestra


base de datos, este caso Data1.

Fig. 22 Reporte de las placas de los vehículos registrados


REPORTE DE REQUERIMIENTOS

IV. CONCLUSIONES
Tal y como hemos podido comprobar, Pentaho como
herramienta de BI sirve para la gestión y toma de decisiones,
que satisfacen los requisitos de Business Intelligence.
Ofreciendo soluciones para la gestión y análisis de la
información, incluyendo el análisis multidimensional OLAP,
presentación de informes y minería de datos por lo que
constituye una solución factible para cualquier empresa que
quiera hacer BI en su organización.

REFERENCIAS
[1] I.T.O.P. (s. f.). ¿Qué es Pentaho y cuáles son sus beneficios?
Tecnologías y Negocios. https://www.itop.es/blog/item/que-es-
pentaho-y-cuales-son-sus-beneficios.html#:%7E:text=Es%20una
%20soluci%C3%B3n%20flexible%20que,bases%20de%20datos
%20no%20relacionales.
[2] Servidor Pentaho Enterprise Edition: localhost:8081/pentaho/Login
[3] Hitachi Vantara Corporation 2022. Pentaho Enterprise Edition
[4] Configurar un repositorio basado en archivos para Pentaho Data
Integration. (2022, 30 agosto). User Console Pentaho.
https://ingmmurillo-dwh-bi.blogspot.com/2018/01/como-configurar-un-
repositorio-basado.html
[5] Qué es Pentaho. Sus Productos y Ventajas. (2020, 23 enero). Pentaho
User Console. https://www.incentro.com/es-ES/blog/que-es-pentaho

Fig. 23 Reporte de los requerimientos

REPORTE TOTAL

Fig. 24 Reporte del total

También podría gustarte