Documentos de Académico
Documentos de Profesional
Documentos de Cultura
44-Texto Del Artículo-48-2-10-20180626
44-Texto Del Artículo-48-2-10-20180626
RESUMEN
ABSTRACT
This paper analyzes the behavior of a Virtual Learning Environment (VLE), specifically with
respect to its performance, through the storage management processes of these platforms.
To understand and interpret the behavior of a VLE, a methodology based on Data Analytics
(DA) is used, which supports the decision-making processes to solve the performance
problems due to the storage. To this end, autonomic cycles of data analysis are specified
for the data loading and file downloading processes, in order to improve the performance of
3
the VLE storage media. In particular, during this work, the Moodle e-Learning platform is
used as a case study.
INTRODUCCIÓN
4
algunas ventajas para llevar a cabo su análisis, tales como, posee una completa bases de
datos, soporta distintos gestores de base de datos, entre las que se encuentran PostgreSQL
(Postgre Structured Query Language), MySQL, Microsoft SQL y Oracle; en cuanto al
código, está escrito en PHP (PHP Hypertext Preprocessor) bajo la licencia GPL (General
Public License). También, Moodle registra cada uno de los eventos que se llevan a cabo en
la plataforma, en archivos llamados logs, que pueden ser usados para determinar si existen
problemas de funcionamiento en la plataforma.
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
Este trabajo fue motivado por algunas investigaciones relacionadas con el tema de
estudio, entre las que se encuentra el trabajo sobre análisis y diseño de arquitecturas para
sistemas e-learning presentado por Álvarez y col [2], que realizan una revisión y
comparación de algunos modelos o estándares de calidad de software para plataformas
EVA. Por su parte, Marjanovic y col [3], describen un modelo basado en Big Data [4],
utilizando Hadoop, el cual se integra a una plataforma de e-learning para manejar los datos
estructurados y no estructurados, provenientes de fuentes heterogéneas de dicha
plataforma.
Por otra parte, también se ha estudiado la problemática sobre la gestión del
almacenamiento para optimizar el rendimiento, en plataformas Web, como las de e-
learning. Tal es el caso de Ramachandra y Sudarshan [5], quienes patentaron un método
para optimizar el rendimiento de aplicaciones Web que usen bases de datos, mediante
prefetching (recuperación previa) automática de los resultados de la consulta. Por su parte,
en [6] se estudia la importancia de los sistemas de almacenamiento en las plataformas de
e-learning que no cuentan con ningún tipo de estructura y que necesitan una serie de
análisis predictivos que permiten mejorar su manejo de los recursos. Por último, Merceron
y col [7], describen el estado actual del análisis de datos en e-learning, identifica algunas
de las tendencias en investigaciones recientes, y determina algunas direcciones que puede
seguir este campo, tal como la inclusión de datos multimodales (gesto, seguimiento ocular,
biosensores) o la diversificación de esos entornos de aprendizaje, con la inclusión de
aspectos tales como, Cursos Abiertos Masivos en Línea (MOOC, Massive Online Open
Courses) y el paradigma “aprender haciendo”.
En cuanto al uso de la analítica de datos para entornos educativos, a lo que
clásicamente se le denomina analítica de aprendizaje, actualmente existen muchos trabajos
en el área. Uno de ellos es el de Agular y col [8], donde propone el concepto de “Autonomic
Cycle Of Learning Analysis Tasks” (ACOLAT), el cual es un grupo de tareas de análisis de
datos cuyo objetivo es trabajar en conjunto para mejorar los procesos de aprendizaje en
aulas inteligentes [9]. Las tareas observan, analizan y actúan sobre el proceso educativo,
usando entre otros, los datos generados por el EVA. También, en [10] se define un conjunto
de tareas de analítica de aprendizaje como servicios, basados en el paradigma de la nube,
para mejorar procesos de aprendizaje en entornos educativos mediados por las TICs.
Los EVA son sistemas de e-learning [11], que integran un conjunto de herramientas
5
para la enseñanza-aprendizaje en línea, permitiendo una enseñanza no presencial (e-
learning) y/o una enseñanza mixta o B-learning (Blended Learning); en esta última, se
combina la enseñanza en Internet con experiencias en la clase presencial. A continuación,
se realizará una breve descripción de los componentes que conforman un EVA, sus
características, funcionalidades, así como de Moodle, por ser la plataforma de estudio.
Componentes
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
Los EVA, como cualquier sistema de e-learning, contiene los siguientes componentes
[12]: a) Sistema Integrado de Aprendizaje (SIA) o instrucción e interacción con los alumnos,
que incluye diversas herramientas para el aprendizaje síncrono y asíncrono, tales como
aula virtual, áreas de discusión, de presentación, y de acceso a contenidos y ejercicios; b)
Sistema de Gestión de Contenidos y Aprendizaje (SGCA), que almacena y conecta
contenidos en módulos reutilizables; c) Sistema de Gestión de Aprendizaje (SGA), conocida
también como Gestión de Alumnos, que lleva registro de la situación de cada estudiante,
en términos de su aprendizaje, participación, lo cual es usado para su supervisión. La Figura
1, muestra la interacción entre los tres componentes [12].
Características
Para Boneu [13], los EVA poseen cuatro características básicas que cualquier
plataforma de e-learning debería tener:
6
Interactividad: conseguir que la persona que está usando la plataforma tenga conciencia
de que es el protagonista de su formación.
Flexibilidad: conjunto de funcionalidades que permiten que el sistema de e-learning
tenga una adaptación fácil en la organización donde se quiere implantar, en relación a la
estructura institucional, los planes de estudio de la institución y los contenidos y estilos
pedagógicos de la organización.
Escalabilidad: capacidad de la plataforma de e-learning de funcionar, ya sea con un
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
Funcionalidades
Los EVA, a través de ciertos procesos, permiten crear y gestionar los espacios virtuales
de aprendizaje privados, para grupos de estudiantes y profesores. Los procesos pueden
dividirse en dos categorías: procesos estratégicos y de apoyo. Los procesos estratégicos
son tres, Comunicación, Formación y Evaluación, respaldados por un Proceso de Apoyo o
de Gestión Administrativa, como puede verse en la Figura 2.
7
como, presentaciones, archivos de texto, documentos PDF, hojas de cálculo, imágenes,
a los que se accede navegando. Además, a través de este proceso se puede realizar la
creación, edición y eliminación de grupos de usuarios, y la creación de escenarios
colaborativos de aprendizaje.
Evaluación: en este proceso, los EVA ofrecen una serie de recursos para ayudar al
profesor en el monitoreo de tareas, aplicación de pruebas, y calificación de los
estudiantes.
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
Gestión Administrativa: tiene como objetivo brindar soporte a los procesos estratégicos.
Es donde se gestionan, asignan, importan, exportan y eliminan roles, así como también,
se editan ciertos datos como nombres de usuario, contraseñas y cuentas de correos,
entre otros.
Los EVA se adaptan a las características y necesidades del usuario. Para ello, cuentan
con diferentes roles de usuario, los cuales son [14]:
Cabe destacar, que en algunos casos pueden incluirse roles adicionales que se
consideren necesarios.
Moodle
Moodle ha sido la plataforma utilizada como caso de estudio, por ser de distribución
libre y código abierto, creada en principio, con el propósito de ayudar a los docentes a
implementar cursos en línea, pensando en la colaboración para la elaboración del
contenido.
Moodle proporciona un conjunto de herramientas centradas en el estudiante y en
ambientes de aprendizaje colaborativo. Además, Moodle contiene una interfaz simple con
características de arrastrar y soltar, junto con mejoras continuas en usabilidad. Su
configuración modular y diseño inter-operable, les permite a los desarrolladores crear
plugins e integrar aplicaciones externas para lograr funcionalidades específicas. Esta
plataforma responde a los estándares internacionales SCORM, se encuentra en constante
evolución, posee una gran cantidad de recursos (documentación, foros, plugins y
complementos), y es respaldada por una comunidad internacional muy activa.
De particular interés para este artículo, cuenta con una base de datos de más de 300
tablas con todos los registros de logs, usuarios, asignaturas, permisos, etc, con soporte
para una variedad de Sistemas Manejadores de Bases de Datos Relacionales. Además,
8
soporta los procesos básicos de un EVA indicados en la subsección anterior, como con sus
características.
La plataforma Moodle tiene una variedad de módulos, que están enmarcados dentro
de cada uno de los procesos (ver las Figuras 3 y 4), los cuales son [15]:
9
Cuestionario: permite al profesor diseñar y armar exámenes, que pueden ser calificados
automáticamente o dárseles retroalimentación; incluso se pueden mostrar las
respuestas correctas.
Tareas: proporciona un espacio en el que los estudiantes pueden enviar sus trabajos,
para que los profesores los califiquen y proporcionen retroalimentación. También puede
usarse para recordarles a los estudiantes sobre tareas que necesitan completar offline.
Las tareas pueden tener fechas finales, que podrían extenderse en caso necesario.
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
10
ANÁLISIS DE LOS PROCESOS DE MOODLE
En esta fase se realizó un análisis de los procesos de un EVA, como Moodle, con el fin
de determinar los procesos viables para la aplicación de Analítica de Datos.
Modelo de Datos
Los datos que se plantean utilizar para obtener la información requerida por las tareas
de Analítica de Datos, provienen de la base de datos relacional de la plataforma Moodle,
cuyas tablas no sólo almacenan los objetos que se utilizan en el proceso de enseñanza
aprendizaje, sino que también almacenan cada evento llevado a cabo por cada uno de sus
actores, tales como momento en que realiza cada acción, curso al que accedió, actividad
que realizó y cuánto tiempo permaneció en ella, recursos que utilizó, entre muchos otros
detalles. Un ejemplo de esto se puede apreciar en los log, donde se almacenan algunos
registros básicos de cada usuario (ver Tabla 1, donde se muestra parte de estos registros).
Se consideraron los problemas que ocurren con más frecuencia, de acuerdo a los
participantes en los foros de la página oficial de Moodle (https://moodle.org/), tales como
lentitud en la comunicación entre recursos sincrónicos, congelamiento de la plataforma
al ser accedida por múltiples usuarios a una misma actividad, lentitud de carga y
descarga de archivos, descarga de archivos desactualizados y pérdida de información
al finalizar la sesión.
11
Se asignó un peso a las posibles causas de los problemas mencionados anteriormente,
dando un valor de 2 a las causas relacionadas con el almacenamiento, y de 1 a las que
no lo están (Ver Tabla 2).
Luego, se cruzaron las posibles causas con los problemas que ocurren con más
frecuencia en Moodle (Ver Tablas 3, 4 y 5), sumando sólo los casos donde el peso es 2,
que corresponde a las causas que afectan el rendimiento, dando como resultado la
selección del proceso de Evaluación, por haber sido el de la suma de mayor valor (38).
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
12
así sea, se selecciona uno de los tipos de evaluación (Encuesta, Retroalimentación, Taller,
Cuestionario o Tarea) y luego de seleccionado, se ejecuta el proceso particular de esa
evaluación. Al finalizar, se le pregunta si desea llevar a cabo otro tipo de evaluación. Si la
respuesta es positiva, el proceso comienza de nuevo, pero esta vez desde la selección de
la sesión. En caso de que no se desee aplicar otra evaluación o de que, incluso, no haya
existido una evaluación activa, finaliza el proceso de evaluación.
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
Proceso de Formación
VP SO N IN TFF CU TP DB
Velocidad de
1 1 1 1 - - 2 -
Procesamiento
Baja Sincronía - - - - - - - -
Congelamiento de la
- - - - - 2 2 2
plataforma
Lentitud en
carga y descarga 1 - - 1 2 - 2 2
de archivos
Archivos corruptos - - - - 2 2 2 2
Archivos no
- - - - 2 2 2 2
actualizados
Total 30
13
Tabla 5. Suma de los pesos asociados a los recursos de almacenamiento en el proceso de
evaluación
Proceso de Evaluación
VP SO N IN TFF CU TP DB
Velocidad de
1 1 1 1 - - 2 -
Procesamiento
Baja Sincronía - - - 1 - 2 2 2
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
Congelamiento de la
- - - 1 - 2 2 2
plataforma
Lentitud en
carga y descarga - - - 1 2 2 2 2
de archivos
Archivos corruptos - - - - 2 2 2 2
Archivos no
- - - - 2 2 2 2
actualizados
Total 38
14
CARACTERIZACIÓN DE TAREAS DE MINERÍA DE DATOS
Selección de Actores
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
Los problemas antes mencionados suelen afectar a quienes ejercen el rol de estudiante
dentro del EVA, ya que ellos suelen ingresar en la plataforma de manera concurrente en
algunos casos y utilizan los mismos recursos al encontrarse matriculados en los mismos
cursos. Es por ello que, el análisis realizado se enfocó, en este caso, en la trayectoria de
los estudiantes dentro de Moodle.
Después de seleccionar el proceso a estudiar, se llevó a cabo un análisis que permitió
caracterizar las posibles tareas de Analítica de Datos, considerando dos de los problemas
del proceso de almacenamiento como parte de los escenarios actuales y posibles
escenarios futuros, tal como se puede apreciar en las Tablas 6, 7 y 8, respectivamente.
Los ciclos autonómicos han sido definidos en [8] y se basan en la arquitectura MAPE-
K (Monitoreo, Análisis, Planificación y Ejecución) explicada en [16], donde las estrategias
de analítica básica están relacionadas entre si para generar nuevo conocimiento, que
servirá para realimentar una nueva secuencia. Los cuatro componentes que conforman un
ciclo autonómico son: Monitor, Analizador, Planificador y Ejecutor.
Este ciclo autonómico tiene como objetivo optimizar los procesos de transferencia de
archivos, siguiendo las tareas descritas en los escenarios futuros (ver Tabla 7), las cuales
se describen a continuación (ver Figura 6):
15
concurrencias, abandonos y tiempos de permanencia dentro de las actividades, entre
otras cosas. Usa como entrada los datos de la base de datos de Moodle.
16
realiza dentro del componente planificador. Esta tarea se alimentará partir de los datos
generados en la primera tarea.
17
Descarga de archivos: aquí se lleva a cabo el objetivo del ciclo autonómico, es decir, se
produce la descarga de uno o varios archivos. Se indica dónde se almacenarán y cómo
se realizará la descarga, considerando lo que haya indicado la predicción y las posibles
soluciones generadas en la tarea de clasificación de soluciones.
Este ciclo autonómico tiene como objetivo evitar la pérdida de información cuando se
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
lleva a cabo la carga de datos (ver Figura 7). Este ciclo presenta seis tareas (ver Tabla 8),
tres de los cuales son comunes con el primer ciclo (“Determinar patrones del
comportamiento de los estudiantes”, “Determinar los problemas frecuentemente
presentados en Moodle” y “Clasificar posibles soluciones a los problemas presentados en
la Plataforma”). Así que a continuación se describen las tres restantes:
Clasificar los Tipos de Evaluación: esta tarea divide las evaluaciones que fallaron en la
carga de los datos de las que no fallaron al momento de finalizar el período de tiempo
asignado, teniendo como entrada los datos obtenidos de la base de datos Moodle y los
problemas determinados en el Monitor.
Predecir carga de datos: se pronostica si las respuestas de las evaluaciones deben ser
guardadas en caso de que a la actividad se le haya asignado un tiempo de cierre, para
evitar perder los datos, considerando los patrones de conducta de los estudiantes,
obtenido en la primera tarea.
Cargar Datos: se lleva a cabo la carga de datos, agrupando las respuestas que el
estudiante ha proporcionado hasta cierto punto, segmentando por página o por
preguntas el almacenamiento de manera automática, considerando las posibles
soluciones obtenidas en la tarea de clasificación.
18
En las Tablas 7 y 8 se observa que la aplicación de las tareas de análisis de datos
(agrupamiento, minería Web de contenido, clasificación, pronóstico y asociación) generan
modelos o estrategias para optimizar el manejo de los recursos de almacenamiento de
Moodle, buscando acelerar los procesos de transmisión de datos y descarga de archivos.
Los datos asociados a las variables de los subprocesos que componen el proceso de
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
Vista Minable Conceptual: para la VMC fueron seleccionadas las variables requeridas
por los ciclos autónomos, desde la base de datos Moodle. Además, en la VMC se
establecen las operaciones de Extracción-Transformación-Carga (ETL, Extraction-
Transformation-Load), como lo establece la metodología MIDANO (ver en la Tabla 9,
una vista parcial de la VMC) [1, 17].
Vista Minable Operativa: en la Figura 8 se puede ver el modelo multidimensional que
contiene dos tablas de hechos (carga y descarga, una para cada ciclo autónomo),
además de varias tablas de dimensiones que integran las variables seleccionadas por
temas (por ejemplo, las tablas de dimensiones quiz, files, user, assignment, entre otras).
CONCLUSIONES
19
Tabla 9. Operaciones ETL
Variable Tipo Extraer de Transformar Cargar
Tabla
user Entero log Tablas de Hecho
Descarga y Carga
ip Entero log Tablas de Hecho
Descarga y Carga
course Entero log Tablas de Hecho
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
Descarga y Carga
module Entero log Tablas de Hecho
Descarga y Carga
action Cadena de log Cambiar por un entero Tablas de Hecho
Caracteres Descarga y Carga
time Entero Diferencia entre los tiempos Tablas de Hecho
timeend y timestart de la tabla Descarga y Carga
log. Indicaría el tiempo de
permanencia en el modulo.
dtime Entero log Tiempo en que inicia la descarga Tabla de Hecho
(timestart cuando action toma el Descarga
valor download en la tabla log)
loadtime Entero log Tiempo en que inicia la carga Tabla de Hecho
(timestart cuando action toma el Carga
valor upload en la tabla log)
timelimit Entero Tiempo asignado a una carga o Tablas de Hecho
descarga según tamaño del Descarga y Carga
archivo. (valor estimado)
concurrency BIT 1: si hay concurrencia. 0: no hay. Tablas de Hecho
En el caso de la descarga, existe Descarga y Carga
concurrencia si el dtime o
loadtime de otro usuario que
descarga el mismo archivo o
carga los mismos datos, coincide
con algún valor entre el dtime o
loadtime y el timelimit de este
usuario o viceversa.
nconcurrency BIT Número de usuarios concurrentes Tablas de Hecho
con este usuario. Se contabilizan Descarga y Carga
todos los usuarios que inicien la
descarga de un mismo archivo o
la carga de los mismos datos o no
hayan finalizado esta operación
entre el rango de tiempo que
cubre el dtime o loadtime y el
timelimit, según sea el caso.
file Entero files Tablas de Hecho
Descarga y Carga
20
sizefile Entero files Tablas de Hecho
Descarga y Carga
status Entero files Tablas de Hecho
Descarga y Carga
nfile Entero files Se contabilizan los archivos Tabla de Hecho
asociados al que se descarga Descarga
ndownloads Entero log/files Número de descargas que se Tabla de Hecho
llevan a cabo por éste y otros Descarga
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
21
AGRADECIMIENTOS
M.Sc Moreno ha sido becada como estudiante del Doctorado de Ciencias Aplicadas
por la Universidad de Los Andes, Mérida, Venezuela, programa en el cual se encuentra
enmarcado este trabajo.
REFERENCIAS BIBLIOGRÁFICAS
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
[1] Rangel C., Pacheco F., Aguilar J., Cerrada M., Altamiranda J. (2013). Methodology for
Detecting the Feasibility of Using Data Mining in an Organization. XXXIX Conferencia
Latinoamericana en Informática (CLEI 2013), Naiguatá, Vargas, Venezuela.
[2] Alvarez A., Alarcón A., Callejas M. (2016). Comparación de Modelos y Estándares de
Evaluación de Calidad para una Plataforma de Aprendizaje Virtual. Actas de Ingeniería.
Vol 2 (Pp. 254-262).
[3] Marjanovic D., Milovanovic M., Radenkovic B. (2014). Hadoop Infrastructure for
Education. Documento en Línea. Disponible en:
https://es.slideshare.net/darkomarjanovic/hadoop-infrastructure-for-education
(Consulta en enero 2017).
[4] O'Reilly Radar Team (2012). Big Data Now: Current Perspectives from O'Reilly Radar.
2012 Edition. O'Reilly Media.
[6] Ashraf A., El-Bakry H.M., El-razek S.M.A., El-Mashad Y., Mastorakis N. (2015).
Enhancing Big Data Processing in Educational Systems. 11th International Conference
on Educational Technologies (EDUTE 2015), Dubai, United Arab Emirates.
[7] Merceron A., Blikstein P., Siemens G. (2015). Learning Analytics: From Big Data to
Meaningful Data. Journal of Learning Analytics, Vol. 2, No. 3 (Pp. 4-8).
[8] Aguilar J., Buendia O, Cordero J. (2017). Specification of the Autonomic Cycles of
Learning Analytic Tasks for a Smart Classroom. Aceptado para su publicación en
Journal of Educational Computing Research.
[9] Aguilar J., Valdiviezo P., Cordero J., Sánchez M. (2015). Conceptual Design of a Smart
Classroom Based on Multiagent Systems. 17th International Conference on Artificial
Intelligence (ICAI 2015), Las Vegas, Nevada, USA.
22
[10] Aguilar J., Sanchez M., Cordero J., Valdiviezo-Díaz P., Barba-Guamán L., Chamba-
Eras L. (2017). Learning Analytics Tasks as Services in Smart Classroom, International
Journal Universal Access in the Information Society (Pp. 1-17).
[13] Boneu J.M. (2007). Plataformas Abiertas de e-learning para el Soporte de Contenidos
Educativos Abiertos. Revista de Universidad y Sociedad del Conocimiento, Vol. 4, No.
1 (Pp. 36-47).
[16] Arcaini P., Riccobene E., Scandurra P. (2015). Modeling and Analyzing MAPE-K
Feedback Loops for Self-Adaptation. 10th International Symposium on Software
Engineering for Adaptive and Self-Managing Systems (SEAMS 2015), Florence, Italy.
[17] Pacheco F., Aguilar J., Rangel C., Cerrada M., Altamiranda J. (2014). Methodological
Framework for Data Processing based on the Data Science Paradigm. XL Conferencia
Latinoamericana en Informática (CLEI 2014), Montevideo, Uruguay.
23
Jose Lisandro Aguilar Castro
Es Ingeniero de Sistema de la Universidad de los Andes, Mérida, Venezuela. Obtuvo una Maestría
en Informática en la Universidad Paul Sabatier, Toulouse, France y el Doctorado en Ciencias
Computacionales en la Universidad Rene Descartes, Paris, France. Además, realizó un
Postdoctorado en el Departamento de Ciencias de la Computación de la Universidad de Houston.
Es profesor Titular del Departamento de Computación de la Universidad de los Andes (ULA) e
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018
24