Está en la página 1de 13

SISTEMA DE ANÁLISIS DE DATOS PARA LA GESTIÓN Y ADMINISTRACIÓN DE

LA UNIDAD EDUCATIVA PARTICULAR “HERMANO MIGUEL”

SYSTEM OF DATA ANALYSIS FOR THE MANAGEMENT AND ADMINISTRATION


OF “HERMANO MIGUEL” INSTITUTION

Cristhian O. Chimbolema, Michael A. Jijón


{cchimbolema, mjijon}_est@utmachala.edu.ec

RESUMEN

El trabajo cuenta con un conjunto de datos obtenidos mediante el análisis de una entidad
educativa en la que se mencionan proceso de matrículas, registros de incidencias académicas
y de conducta.
Los cuáles serán analizados debidamente mediante el uso de herramienta de análisis de datos
BI, en este caso se ha optado por trabajar con Power BI, que nos da la facilidad de un análisis
confiable y a su vez facilita el diseño de un Dashboard mediante el uso de la opción de
generación de cogido HTML.
Para lo cual se creara un data mart para cada uno de estos procesos siguiendo un esquema o
diseño lógico, en base a las reglas aplicadas en el negocio, y las necesidades expresadas por
la gerencia.
Con lo que se llevó a cabo soluciones a preguntas: cantidad de alumnos que tuvieron
incidencias de disciplina, en que materia y cuáles de estas fueron?, con el fin de dar un
seguimiento a estos problemas estudiantiles y brindar una corrección a dicho comportamiento.

Palabras Clave: matriculas, inteligencia de negocios, sistema de soportes de decisiones,


incidencias, tablero de control

ABTRACT

The work has a collection of data obtained through the analysis of an educational entity in which
the registration process is mentioned, records of academic and behavioral incidents.

Which will be analyzed properly by using BI data analysis tool, in this case has opted to work
with Power Bi, which gives us the ease of a reliable analysis and in turn facilitates the design of
a Dashboard by using the option of Generation of HTML caught.

For which a data mart is created for each of these processes following a logical design or
schema, based on the rules applied in the business, and the needs expressed by the
management.

With what was carried out solutions to questions: number of students who had incidences of
discipline, in what matter and which of these were?, in order to keep track of these student
problems and provide a correction to such behavior.

Keywords: enrollments, business intelligence, decision support system, incidents, dashboard.

1. INTRODUCCIÓN

En la actualidad, las diferentes organizaciones están comprendiendo la importancia de la


gestión de la información y las ventajas competitivas que implica su uso, este proceso de
gestión consiste en lograr de una manera eficiente el análisis de distintos tipos de datos de la
empresa y su entorno, a través de la explotación de la información, facilitando la adaptación de
aplicaciones para la inteligencia de negocios.
La Inteligencia de Negocios BI (Business Intelligence) es una herramienta bajo la cual
diferentes tipos de organizaciones, pueden soportar la toma de decisiones basadas en
información precisa y oportuna; garantizando la generación del conocimiento necesario que
permita escoger la alternativa que sea más conveniente para el éxito de la empresa. [ CITATION
Ros10 \l 12298 ]

El objetivo del proyecto es diseñar e implementar un dashboard para una organización


dedicada a la educación en la ciudad de Machala, provincia de El Oro, mediante el uso de
estrategias y herramientas de inteligencia de negocios, contribuyendo con información
consolidada e integrada de las áreas de matrículas, control de incidencias académicas y de
disciplina.

2. FUNDAMENTACIÓN TEÓRICA
2.1 INTELIGENCIA DE NEGOCIOS

Año Autor(es) Definición


El objetivo primario de la a
Inteligencia de Negocios es
contribuir a tomar decisiones que
mejoren el desempeño de la
empresa y promover su ventaja
2009 Calzada, Abreu
competitiva en el mercado. En
resumen, la Inteligencia de
Negocios faculta a la organización
a tomar mejores decisiones más
rápidas.
La inteligencia de negocios (BI) es
un enfoque estratégico para
orientar sistemáticamente el
Tapia Luis, Valdivia seguimiento, la comunicación y la
2010
Ricardo transformación relacionada al débil
conocimiento de la información
procesable en la cual se basa la
toma de decisiones
Se puede definir como
el proceso de analizar
los bienes o datos acumulados en
la empresa y extraer una cierta
inteligencia o conocimiento de
ellos. Dentro de la categoría de
José Miguel Rodríguez bienes se incluyen las bases de
2014
Parrilla datos de clientes, información de
la cadena de suministro, ventas
personales y cualquier actividad de
marketing o fuente de información
relevante para la empresa.

Fuentes: [ CITATION Tap10 \l 12298 ][ CITATION Cal09 \l 12298 ] [ CITATION Jos14 \l 1034 ]
2.2 DATAMARTS

Año Autor(es) Definición


Un DM es un subconjunto lógico
del DW orientado a áreas
Tapia Luis, Valdivia
2010 específicas de la organización,
Ricardo
estos DM unidos generan el DW en
su totalidad
2008 Fon Silvers Un Data Mart es una base de datos
separada o conjunto de bases de
datos, cada una con un enfoque
específico. Ese enfoque puede ser
un área temática, o que el enfoque
puede ser una necesidad de apoyo
a la toma de decisiones (auditoría,
prevención de pérdidas o
rentabilidad)
La estructura de los datos
encontrados en el Data Mart está
formada por los requisitos
particulares del Departamento. Los
2005 William H. Inmon departamentos de finanzas tendrán
una estructura para su Data Mart, y
el Departamento de marketing es
decir una para las diferentes áreas
de una empresa.
Es una base de datos
departamental, especializada en el
2015 Gerhard Svolba
almacenamiento de los datos de un
área de negocio específica.
Fuentes: [ CITATION Tap10 \l 12298 ] [ CITATION Tay \l 1034 ] [ CITATION wil05 \l 1034 ]
[ CITATION Ger15 \l 1034 ]
2.3 DATAWAREHOUSE

Año Autor Definición


Los DW están ganando cada vez
mayor popularidad en las
organizaciones. Ellas se están
Tapia Luis, Valdivia dando cuenta de las ventajas que
2010
Ricardo involucra el análisis de los datos
históricos de forma
multidimensional para apoyar el
proceso de toma de decisiones
Es el proceso de extraer datos de
distintas aplicaciones (internas y
externas), para que una vez
depurados y especialmente
2010 Rosado, Rico
estructurados sean almacenados
en un depósito de datos
consolidado para el análisis del
negocio.
Una vez construido el almacén de
datos, debe mantenerse. Un
componente importante del
mantenimiento del almacén de
2005 William H. Inmon
datos es administrar el
performance, que comienza
monitoreando el entorno del
almacén de datos.
Fuentes: [ CITATION Tap10 \l 12298 ] ,[ CITATION Ros10 \l 12298 ], [ CITATION wil05 \l 1034 ]

3 MATERIALES Y MÉTODOS
Para el desarrollo de la solución de Inteligencia de Negocios propuesta, optó por la
Metodología Hefesto, del autor Ralph Kimball, cuyas actividades se aprecian en la tabla
siguiente:
Tabla 1: Fases Metodología Hefesto

Fases Actividades
Análisis de Requerimientos Identificar preguntas de negocio,
indicadores y perspectivas, diseñar
modelo conceptual del Datawarehouse.
Análisis del Procesamiento Establecer correspondencias entre
Transaccional en Línea fuentes de datos y el datawarehouse,
determinar nivel de granuralidad
Modelo Lógico del Diseñar modelo lógico, diseñar tablas de
Datawarehouse dimensiones y tablas de hechos, realizar
uniones en las tablas.
Integración de datos Carga inicial de datos, utilizando técnicas
de limpieza y calidad de datos, proceso
ETL, definir reglas y políticas para su
respectiva actualización.
Fuentes: [ CITATION Ber10 \l 12298 ][ CITATION Loz \l 12298 ]
Las actividades seleccionadas de la metodología Hefesto para su aplicación son las siguientes:
1. Análisis de requerimientos de la empresa objeto de estudio, lo cual involucra tareas
como: entrevistas, identificación de preguntas de negocio y establecimiento de los
indicadores claves de desempeño y perspectivas.
2. Diseño Lógico del datawarehouse.
3. Proceso ETL (Extracción, Transformación y Carga) para la alimentación del
datawarehouse.
4. Diseño e implementación del dashboard para la gestión de un sistema de soporte de
decisiones.
DESCRIPCIÓN DE LAS ACTIVIDADES
1. Análisis de Requerimientos: Esta actividad de la metodología se inició con la
obtención de requisitos aplicando técnicas como entrevista a los usuarios que toman
las decisiones, observación de procesos y reuniones varias, con lo cual se determina
que la organización de educación estar formada por secciones: inicial, básica y
bachillerato, especialidades como: químico biólogo, físico matemáticas, ciencias
sociales, contabilidad e informática, además de bachillerato general unificado.
También cuenta con cursos, los cuales están divididos en paralelos, el cual es
designado a cada estudiante en su matrícula.
Los docentes, están distribuidos de manera tal que cuentan con sus respectivas
asignaturas, las cuales están clasificadas por áreas.
La organización para el control dispone de un sistema transaccional, en donde se van
almacenando los diferentes tipos de incidencias, además de enviar al padre de familia
la notificación a través de correo electrónico, en este registro se guardan los datos del
estudiante, la incidencia cometida, ya sea esta académica o de disciplina, datos del
docente que genera el registro, así como la asignatura, además de los datos del
representante.
La institución en la actualidad no cuenta con un sistema que sea capaz de integrar y
consolidar la información acerca de las diferentes temáticas que proporcione soporte a
decisiones gerenciales y de mandos medios. Los problemas específicos tratados son
los siguientes:

 Obtención de información sobre las matrículas ya sea en general, por


instrucción, curso, especialidad, o paralelo.
 Necesidad de generar estadísticas acerca de incidencias académicas y de
disciplina de los estudiantes pertenecientes a la institución.
Tabla 2: Preguntas de Negocio

Tema N° Pregunta
Matrículas 1 ¿Cuál es el número total de estudiantes entre
hombres y mujeres matriculados en el período
actual?
2 ¿Cuál es el número total de estudiantes
matriculados por curso?
3 ¿Cuántos estudiantes están matriculados en
una determinada instrucción, especialidad o
curso?
4 ¿Cuántos hombres y mujeres están
matriculados en un determinado curso o
paralelo?
5 ¿Cuántas faltas académicas se han generado
por determinado tipo por asignatura y curso?
6 ¿Cuántos hombres y cuántas mujeres han
cometido cierto tipo de faltas en alguna
asignatura?
Incidencias Académicas
7 ¿Qué número de faltas tiene un determinado
alumno considerando el tipo de incidencia,
curso y paralelo?
8 ¿Qué número de faltas ha reportado cierto
docente en un curso determinado?
9 ¿Cuántas incidencias de indisciplina existen por
curso, paralelo o asignatura?
10 ¿Cuántas faltas de indisciplina tiene cada
estudiante por determinado tipo y asignatura?
Incidencias de Conducta
11 ¿Cuántos hombres y cuántas mujeres han
cometido cierto tipo de falta por curso?
12 ¿Cuál es el número de faltas de indisciplina por
determinado tipo, instrucción y asignatura?

La siguiente tabla muestra los indicadores y medidas establecidos por los usuarios que
toman decisiones en la organización, las cuáles formarán parte de cada uno de los
datamarts:

Tabla 3: Indicadores y Dimensiones de cada Datamart

Tema N° Indicadores Dimensiones


Número de mujeres Curso, paralelo,
P4
matriculadas genero
Número de hombres Curso, paralelo,
P4
Matricula matriculados genero
P1 – Especialidad,
Número total de
P2 – curso, instrucción,
matriculados
P3 especialidad
Número de
Incidencia,
P5 - estudiantes
asignatura, curso
matriculados
Número de hombres
matriculados Incidencia,
Incidencias Académicas P6
Número de mujeres asignatura, genero
matriculadas
Número de faltas Curso, incidencia,
P7 –
académicas paralelo, docente,
P8
cometidas asignatura
Docente,
P9 –
Números de asignatura, género,
P10 –
incidencias asignatura, cuso,
Incidencias de Conducta P12
paralelo
Número de hombres
P12 Curso, género
Número de mujeres
2. Diseño Lógico del Datawarehouse: Para cada uno de los temas se diseñó un modelo
de datos de datamart de acuerdo a los requerimientos del negocio, el tipo de esquema
seleccionado es el de estrella y en algunos casos es copo de nieve, los mismos que al
combinarse en alguna ocasión forman un tipo constelación.

Ilustración 1: Modelo Lógico del Datawarehouse

Ilustración 2: Diseño Datamart Matrícula


Ilustración 3: Diseño Datamart Control Incidencias Académicas

Ilustración 4: Datamart Control Incidencias de Disciplina

3. Integración de Datos: Una vez diseñado el modelo multidimensional del DW, se


procedió con la población de los datos, es decir con el proceso de extracción,
transformación y carga. Se seleccionó Pentaho Data Integration, el cual Mazón
[ CITATION Maz17 \l 12298 ] establece que es una herramienta con un interfaz gráfico
de usuario intuitivo y cuenta con una variedad de librerías para realizar conexiones de
entrada a fuentes de datos diversas, dispone de funciones de transformación - limpieza
de datos y diversas formas de conexión de salida a DBMS donde se puede
implementar el data warehouse.

Los datos de la organización se encontraban inicialmente en archivos de Excel, por lo


cual se hizo uso del Pentaho Data Integrator para proceder a extraerlos, transformarlos
y cargarlos a PostgreSQL, teniendo en cuento de realizar los cambios necesarios para
evitar futuros errores en el resultado final.

Ilustración 5: Datos brutos en Excel


Ilustración 6: Proceso ETL realizado en la herramienta Pentaho Integrator

Ilustración 7: Base de Datos cargada en PostgreSQL

4. Diseño e Implementación del dashboard de soporte de decisiones: Después del


diseño del data warehouse y su alimentación con datos, se requiere de herramientas
para el análisis de la información e implementación de aplicaciones BI, con lo cual se
lograr construir un dashboard de soporte que proporciona la información más relevante
de la organización en los temas de estadísticas de matrícula, incidencias académicas y
de disciplina.
Para el diseño de los cubos y de las gráficas que conformarán el dashboard se utiliza la
herramienta BI denominada Power BI, la cual brinda muchas facilidades al momento de
graficar los dashboard correspondientes para lograr obtener un conjunto de
ilustraciones interactivas que permitirán al usuario observar diferentes tipos de
estadísticas o referencias sobre un determinado tema.

Ilustración 8: Diseño de Cubos y gráficas en Power BI

4 RESULTADOS Y DISCUSIÓN
La inteligencia de negocios aplicada a la organización dedicada a la educación, permitió la
implementación de un tablero de control o dashboard, el cual está clasificado en diferentes
temas para la visualización correcta de los datos, tales como las estadísticas de matrículas,
control de las incidencias académicas e incidencias indisciplinarías de los estudiantes.

Ilustración 9: Vista Principal Dashboard UNEPHEM


En Estadísticas de matrículas se puede observar la cantidad de estudiantes a partir de
diferentes criterios de filtros u opciones, ya sean estos del género masculino, femenino o en
general.
Los criterios de filtros pueden ser las instrucciones, especialidades, cursos, paralelos, géneros,
tipo de incidencias, siendo cada una de estas dimensiones de las tablas de hechos que
constituyen los datamart de matrícula., registro de incidencias académicas y de incidencias de
indisciplina.

Ilustración 10: Dashboard Estadísticas de Matrículas

Ilustración 11: Dashboard Control de Incidencias Académicas


Ilustración 12: Dashboard Incidencias de Indisciplina

5 CONCLUSIONES
 La implementación de un tablero de control o dashboard dentro de una organización es de
gran ayuda debido a que ayuda a la visualización de diferente tipo de información
organizada por temas, de la cual se puede obtener diversos tipos de clasificación, ya que
se la puede filtrar por diversos criterios de búsqueda, facilitando así la toma de decisiones
dentro de la organización basándose en las mejores estrategias para así lograr el objetivo
planteado.
 La mayoría de las organizaciones no cuentan en algunas ocasiones con algún tipo de
sistema que les permita realizar el análisis por temas de todos aquellos aspectos
importantes dentro de la misma, por lo cual al momento de tomar un decisión se hace
complicado determinar los factores que lleven a tomar la mejor de ellas, sin opción a tener
estrategias previamente planteadas.
 Para la elaboración de un Dashboard se deberá plantear de manera consistente la data
necesaria para cumplir con las necesidades establecidas o las que se requieren de una
solución inmediata.
 Durante el proceso de realización de cubos los problemas que se presentan en mayor
cantidad se deben principalmente a la replicación de información es decir en ocasiones
donde los datos establecidos dentro de las tablas de hechos no concuerdan con los datos
brutos iniciales.
 Para el diseño del análisis de datos se deberá tener un planteamiento correcto y enfocado
en la problemática a solucionar, mediante preguntas de negocios las cuales contaran con
sus medidas y dimensiones requeridas.
 Se deberá tener un enfoque práctico al realizar un Dashboard ya que se requiere
información específica de una solución de negocio.

6 REFERENCIAS BIBLIGRÁFICAS
[1] A. A. Rosado Gómez y D. W. Rico Bautista, «INTELIGENCIA DE NEGOCIOS: ESTADO DEL
ARTE,» Scientia et Technica, vol. 44, 2010.

[2] L. Tapia y Valdivia Ricardo, «INCORPORACIÓN DE ELEMENTOS DE INTELIGENCIA DE


NEGOCIOS EN EL PROCESO DE ADMISIÓN Y MATRÍCULA DE UNA UNIVERSIDAD
CHILENA,» Ingeniare, vol. 18, nº 3, pp. 383-394, 2010.

[3] L. Calzada y J. L. Abreu , «El impacto de las herramientas de inteligencia de negocios en la


toma de decisiones de los ejecutivos,» International Journal of Good Conscience, 2009.

[4] J. M. R. Parrilla, Cómo Hacer Inteligente su Negocio: Business Intelligence a su alcance,


2014.

[5] T. &. F. Group, Building and Maintaining a Data Warehouse, Informa business ed.

[6] w. H. Inmon, Building the data warehouse, 2005.

[7] G. Svolba, Data Preparation for Analytics Using SAS, 2015.

[8] R. D. Bernabeu, «HEFESTO: Metodología para la Construcción de un Data Warehouse,»


19 Julio 2010. [En línea].

[9] X. Lozada Peñafiel, H. Cruz Tamayo, W. Pérez Argudo y A. de la Torre Díaz, «ANÁLISIS,
DISEÑO, CONSTRUCCIÓN E IMPLEMENTACIÓN DE UN DATA WAREHOUSE PARA TOMA DE
DECISIONES Y CONSTRUCCIÓN DE LOS KPI, PARA LA EMPRESA KRONOSCONSULTING CIA
LTDA».

[10] B. Mazón Olivo, «DASHBOARD PARA EL SOPORTE DE DECISIONES EN UNA EMPRESA DEL
SECTOR MINERO,» Proccedings, vol. 1, 2017.