Está en la página 1de 22

ANÁLISIS DE LOS PROBLEMAS DE RENDIMIENTO EN UN EVA (ENTORNO

VIRTUAL DE APRENDIZAJE) A TRAVÉS DE LA EXTRACCIÓN DE CONOCIMIENTO

(ANALYSIS OF THE PROBLEMS OF PERFORMANCE IN A VIRTUAL LEARNING


ENVIRONMENT THROUGH THE EXTRACTION OF KNOWLEDGE)

Recibido: 30/09/2017 Aprobado: 01/12/2017


Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

Yaneth Moreno Caldera


Núcleo Universitario “Rafael Rangel”
Universidad de los Andes, Trujillo, Venezuela
ycmoreno@ula.ve

Jose Lisandro Aguilar Castro


Universidad de los Andes, Mérida, Venezuela
Universidad Técnica Particular de Loja, Ecuador
aguilar@ula.ve, aguilarjos@gmail.com

Francisco Javier Hidrobo


Departamento de Física
Universidad de los Andes, Mérida, Venezuela
hidrobo@ula.ve

RESUMEN

En este trabajo, se analiza el comportamiento de un Entorno Virtual de Aprendizaje (EVA),


específicamente en lo relacionado a su rendimiento, a través de los procesos de gestión
del almacenamiento de estas plataformas. Para comprender e interpretar el
comportamiento de un EVA, se usa una metodología basada en la Analítica de Datos (AD),
la cual soporta los procesos de toma de decisiones para resolver los problemas de
rendimiento debido al almacenamiento. Para ello, se especifican ciclos autonómicos de
tareas de análisis de datos para los subprocesos del EVA relacionados con la carga de
datos y descarga de archivos, con el fin de mejorar el rendimiento de los medios de
almacenamiento del EVA. En particular, durante este trabajo se usa como caso de estudio
a la plataforma de e-Learning Moodle.

Palabras claves: EVA, evaluación de rendimiento, Analítica de Datos, medios de


almacenamiento, Moodle

ABSTRACT

This paper analyzes the behavior of a Virtual Learning Environment (VLE), specifically with
respect to its performance, through the storage management processes of these platforms.
To understand and interpret the behavior of a VLE, a methodology based on Data Analytics
(DA) is used, which supports the decision-making processes to solve the performance
problems due to the storage. To this end, autonomic cycles of data analysis are specified
for the data loading and file downloading processes, in order to improve the performance of

3
the VLE storage media. In particular, during this work, the Moodle e-Learning platform is
used as a case study.

Keywords: VLE, performance evaluation, Data Analytics, storage media, Moodle

INTRODUCCIÓN

El e-learning, o aprendizaje electrónico, es un complemento o alternativa de la


Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

educación tradicional, utilizado frecuentemente para apoyar la educación a distancia, la cual


está dirigida a personas geográficamente alejadas de los centros de formación, que no
tienen la posibilidad de asistir de manera presencial. Estos últimos años, el uso intensivo
de las Tecnologías de Información y Comunicación (TIC), y en particular, la popularidad y
expansión de Internet, ha convertido a la educación a distancia en una alternativa real a la
educación presencial, consolidando el e-learning como método formativo, tanto para las
instituciones educativas como para las empresas.
Para facilitar este tipo de formación, se utiliza a menudo un tipo de software llamado
Entorno Virtual de Aprendizaje (EVA). Un EVA es un espacio educativo en la Web, que
contiene un conjunto de herramientas que posibilitan la interacción dinámica de los alumnos
con las actividades educativas definidas por el docente del curso, tales como conversar,
leer documentos, realizar ejercicios, entre otros. Estos sistemas generan muchos datos, ya
que cada vez que un usuario accede a una plataforma e-learning deja una colección de
registros de sus actividades (información de acceso, recursos descargados, actividades
realizadas, entre otros). Esta información puede ser de utilidad para evaluar cómo los
estudiantes se comportan durante el proceso de enseñanza del curso, y para conocer cómo
son usados los recursos de la plataforma de aprendizaje. Así, existe un gran volumen de
datos estructurados, no estructurados y semi-estructurados, generados por un EVA.
En general, estas plataformas de aprendizaje están diseñadas e implantadas para el
soporte del proceso e-learning, sin prestarle atención a las prestaciones de algunos
recursos computacionales (medios de almacenamiento, redes, entre otros), y menos aún,
a las degradaciones de rendimientos que se puedan producir al usar estas plataformas en
los procesos de aprendizaje e-learning.
Como se puede ver, existe la necesidad de gestionar grandes volúmenes de datos, en
contextos caracterizados por ser complejos, con múltiples fuentes de datos heterogéneas.
En ese sentido, es fundamental definir mecanismos que permitan analizar las plataformas
de e-learning, con la finalidad de obtener conocimiento que permita resolver los problemas
de rendimiento que suelen presentarse en este tipo de infraestructuras.
En este trabajo, se propone hacer ese análisis usando analítica de datos, la cual
permite construir modelos desde los datos del entorno estudiado. En particular, se usa la
metodología MIDANO (“Metodología para el desarrollo de aplicaciones de Minería de Datos
basados en el análisis organizacional”) [1] para el desarrollo de aplicaciones de analítica de
datos.
Como caso de estudio, se usó Moodle (Module Object-Oriented Dynamic Learning
Environment), plataforma de e-learning que desde el punto de vista tecnológico ofrece

4
algunas ventajas para llevar a cabo su análisis, tales como, posee una completa bases de
datos, soporta distintos gestores de base de datos, entre las que se encuentran PostgreSQL
(Postgre Structured Query Language), MySQL, Microsoft SQL y Oracle; en cuanto al
código, está escrito en PHP (PHP Hypertext Preprocessor) bajo la licencia GPL (General
Public License). También, Moodle registra cada uno de los eventos que se llevan a cabo en
la plataforma, en archivos llamados logs, que pueden ser usados para determinar si existen
problemas de funcionamiento en la plataforma.
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

Este trabajo fue motivado por algunas investigaciones relacionadas con el tema de
estudio, entre las que se encuentra el trabajo sobre análisis y diseño de arquitecturas para
sistemas e-learning presentado por Álvarez y col [2], que realizan una revisión y
comparación de algunos modelos o estándares de calidad de software para plataformas
EVA. Por su parte, Marjanovic y col [3], describen un modelo basado en Big Data [4],
utilizando Hadoop, el cual se integra a una plataforma de e-learning para manejar los datos
estructurados y no estructurados, provenientes de fuentes heterogéneas de dicha
plataforma.
Por otra parte, también se ha estudiado la problemática sobre la gestión del
almacenamiento para optimizar el rendimiento, en plataformas Web, como las de e-
learning. Tal es el caso de Ramachandra y Sudarshan [5], quienes patentaron un método
para optimizar el rendimiento de aplicaciones Web que usen bases de datos, mediante
prefetching (recuperación previa) automática de los resultados de la consulta. Por su parte,
en [6] se estudia la importancia de los sistemas de almacenamiento en las plataformas de
e-learning que no cuentan con ningún tipo de estructura y que necesitan una serie de
análisis predictivos que permiten mejorar su manejo de los recursos. Por último, Merceron
y col [7], describen el estado actual del análisis de datos en e-learning, identifica algunas
de las tendencias en investigaciones recientes, y determina algunas direcciones que puede
seguir este campo, tal como la inclusión de datos multimodales (gesto, seguimiento ocular,
biosensores) o la diversificación de esos entornos de aprendizaje, con la inclusión de
aspectos tales como, Cursos Abiertos Masivos en Línea (MOOC, Massive Online Open
Courses) y el paradigma “aprender haciendo”.
En cuanto al uso de la analítica de datos para entornos educativos, a lo que
clásicamente se le denomina analítica de aprendizaje, actualmente existen muchos trabajos
en el área. Uno de ellos es el de Agular y col [8], donde propone el concepto de “Autonomic
Cycle Of Learning Analysis Tasks” (ACOLAT), el cual es un grupo de tareas de análisis de
datos cuyo objetivo es trabajar en conjunto para mejorar los procesos de aprendizaje en
aulas inteligentes [9]. Las tareas observan, analizan y actúan sobre el proceso educativo,
usando entre otros, los datos generados por el EVA. También, en [10] se define un conjunto
de tareas de analítica de aprendizaje como servicios, basados en el paradigma de la nube,
para mejorar procesos de aprendizaje en entornos educativos mediados por las TICs.

ENTORNOS VIRTUALES DE APRENDIZAJE

Los EVA son sistemas de e-learning [11], que integran un conjunto de herramientas

5
para la enseñanza-aprendizaje en línea, permitiendo una enseñanza no presencial (e-
learning) y/o una enseñanza mixta o B-learning (Blended Learning); en esta última, se
combina la enseñanza en Internet con experiencias en la clase presencial. A continuación,
se realizará una breve descripción de los componentes que conforman un EVA, sus
características, funcionalidades, así como de Moodle, por ser la plataforma de estudio.

Componentes
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

Los EVA, como cualquier sistema de e-learning, contiene los siguientes componentes
[12]: a) Sistema Integrado de Aprendizaje (SIA) o instrucción e interacción con los alumnos,
que incluye diversas herramientas para el aprendizaje síncrono y asíncrono, tales como
aula virtual, áreas de discusión, de presentación, y de acceso a contenidos y ejercicios; b)
Sistema de Gestión de Contenidos y Aprendizaje (SGCA), que almacena y conecta
contenidos en módulos reutilizables; c) Sistema de Gestión de Aprendizaje (SGA), conocida
también como Gestión de Alumnos, que lleva registro de la situación de cada estudiante,
en términos de su aprendizaje, participación, lo cual es usado para su supervisión. La Figura
1, muestra la interacción entre los tres componentes [12].

Figura 1. Sistema e-learning (Modificado de Bernardez)

LAN (Local Area Network)


WAN (Wide Area Network)
M-Learning (Mobile Learning)

Características

Para Boneu [13], los EVA poseen cuatro características básicas que cualquier
plataforma de e-learning debería tener:

6
 Interactividad: conseguir que la persona que está usando la plataforma tenga conciencia
de que es el protagonista de su formación.
 Flexibilidad: conjunto de funcionalidades que permiten que el sistema de e-learning
tenga una adaptación fácil en la organización donde se quiere implantar, en relación a la
estructura institucional, los planes de estudio de la institución y los contenidos y estilos
pedagógicos de la organización.
 Escalabilidad: capacidad de la plataforma de e-learning de funcionar, ya sea con un
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

número pequeño o grande de usuarios.


 Estandarización: Posibilidad de importar y exportar cursos en formatos estándar, como
el SCORM (Sharable Content Object Reference Model).depende de los estados
emocionales generados.

Funcionalidades

Los EVA, a través de ciertos procesos, permiten crear y gestionar los espacios virtuales
de aprendizaje privados, para grupos de estudiantes y profesores. Los procesos pueden
dividirse en dos categorías: procesos estratégicos y de apoyo. Los procesos estratégicos
son tres, Comunicación, Formación y Evaluación, respaldados por un Proceso de Apoyo o
de Gestión Administrativa, como puede verse en la Figura 2.

Figura 2. Procesos de un EVA

 Comunicación: en este proceso, los estudiantes pueden intercambiar información, en


grupos o individualmente, ya sea con el profesor o con otros estudiantes, además de
hacer contribuciones. Para ello hay múltiples recursos, como foros, chats, encuestas,
wikis y bases de datos.
 Formación: aquí se realizan una serie de actividades que permiten al profesor suministrar
la información necesaria para impartir un curso, a través de carga de archivos, tales

7
como, presentaciones, archivos de texto, documentos PDF, hojas de cálculo, imágenes,
a los que se accede navegando. Además, a través de este proceso se puede realizar la
creación, edición y eliminación de grupos de usuarios, y la creación de escenarios
colaborativos de aprendizaje.
 Evaluación: en este proceso, los EVA ofrecen una serie de recursos para ayudar al
profesor en el monitoreo de tareas, aplicación de pruebas, y calificación de los
estudiantes.
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

 Gestión Administrativa: tiene como objetivo brindar soporte a los procesos estratégicos.
Es donde se gestionan, asignan, importan, exportan y eliminan roles, así como también,
se editan ciertos datos como nombres de usuario, contraseñas y cuentas de correos,
entre otros.

Los EVA se adaptan a las características y necesidades del usuario. Para ello, cuentan
con diferentes roles de usuario, los cuales son [14]:

 Administrador: es el encargado de la gestión administrativa de los cursos, y de la


configuración y mantenimiento del entorno.
 Profesor: es el responsable del desarrollo e implementación de los cursos.
 Estudiante: es a quien van dirigidos los cursos. En este tipo de aprendizaje, es
fundamental la participación activa del alumno en su aprendizaje, ya que existe una
cierta autonomía en el proceso, proporcionada por el propio entorno.

Cabe destacar, que en algunos casos pueden incluirse roles adicionales que se
consideren necesarios.

Moodle

Moodle ha sido la plataforma utilizada como caso de estudio, por ser de distribución
libre y código abierto, creada en principio, con el propósito de ayudar a los docentes a
implementar cursos en línea, pensando en la colaboración para la elaboración del
contenido.
Moodle proporciona un conjunto de herramientas centradas en el estudiante y en
ambientes de aprendizaje colaborativo. Además, Moodle contiene una interfaz simple con
características de arrastrar y soltar, junto con mejoras continuas en usabilidad. Su
configuración modular y diseño inter-operable, les permite a los desarrolladores crear
plugins e integrar aplicaciones externas para lograr funcionalidades específicas. Esta
plataforma responde a los estándares internacionales SCORM, se encuentra en constante
evolución, posee una gran cantidad de recursos (documentación, foros, plugins y
complementos), y es respaldada por una comunidad internacional muy activa.
De particular interés para este artículo, cuenta con una base de datos de más de 300
tablas con todos los registros de logs, usuarios, asignaturas, permisos, etc, con soporte
para una variedad de Sistemas Manejadores de Bases de Datos Relacionales. Además,

8
soporta los procesos básicos de un EVA indicados en la subsección anterior, como con sus
características.
La plataforma Moodle tiene una variedad de módulos, que están enmarcados dentro
de cada uno de los procesos (ver las Figuras 3 y 4), los cuales son [15]:

 Foros: permite a los estudiantes y profesores intercambiar ideas y comentarios como


parte de un “hilo” de una discusión. Se pueden incluir archivos, tales como imágenes y
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

multimedios, dentro de las publicaciones en el foro.


 Chat: permite a los participantes tener una discusión en tiempo real, dentro de un curso
Moodle.
 Mensajería Interna: los profesores, estudiantes y otros usuarios pueden enviar y recibir
mensajes privados mediante Moodle.
 Glosario: permite a los participantes crear y mantener una lista de definiciones, similar a
un diccionario. Se pueden buscar y ojear las entradas en diferentes formatos. Un glosario
puede ser una actividad colaborativa, o estar restringida a las entradas hechas por el
profesor. Las entradas pueden ponerse en categorías.
 Blog: forma de revista (journal) en línea. Generalmente, están organizados como una
serie de publicaciones cronológicas creadas por el autor del blog. Los blogs en Moodle
están basados en el usuario, cada usuario tiene su propio blog.
 Wiki: colección de páginas Web en donde cualquiera puede añadir otras páginas Web o
editarlas.
 Base de Datos: permite al profesor o al estudiante, mostrar y buscar registros acerca de
cualquier tópico concebible. El formato y la estructura de estas entradas pueden ser casi
ilimitados, incluyendo imágenes, archivos, URLs, números y texto, entre otras cosas.
 Lección: existen dos tipos de páginas básicas de lección que el estudiante visita: páginas
de preguntas y páginas de contenido. También hay varias páginas de navegación
avanzadas, que pueden cumplir con necesidades más especializadas del profesor.
 Encuesta Predefinida: proporciona varios instrumentos de encuesta, incluyendo
COLLES (Constructivist On-Line Learning Environment Survey) y ATTLS (Attitudes to
Thinking and Learning Survey). La primera comprende 24 premisas agrupadas en seis
escalas, cada una de las cuales ayuda a formular una pregunta clave sobre la calidad
del ambiente educativo en línea. Por su parte, la segunda es un instrumento desarrollado
para medir el grado en que una persona es un “conocedor conectado” o un “conocedor
separado”.
 Retroalimentación: permite crear y aplicar encuestas, con el propósito de conocer la
opinión de sus alumnos.
 Taller: es una actividad de evaluación por pares. Los estudiantes envían su propio
trabajo y reciben varios envíos de otros estudiantes, que tienen que evaluar de acuerdo
con las especificaciones del profesor. Ellos también pueden evaluar sus propios trabajos,
si el profesor así lo solicita.

9
 Cuestionario: permite al profesor diseñar y armar exámenes, que pueden ser calificados
automáticamente o dárseles retroalimentación; incluso se pueden mostrar las
respuestas correctas.
 Tareas: proporciona un espacio en el que los estudiantes pueden enviar sus trabajos,
para que los profesores los califiquen y proporcionen retroalimentación. También puede
usarse para recordarles a los estudiantes sobre tareas que necesitan completar offline.
Las tareas pueden tener fechas finales, que podrían extenderse en caso necesario.
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

 Gestionar Roles: permite al administrador del sistema, editar cualquiera de las


capacidades asociadas a cualquier rol.
 Conceder Permisos: Moodle permite que ciertos roles puedan cambiar las capacidades
específicas del rol, basadas en el contexto.
 Anulaciones: permisos específicos diseñados para anular un papel en un contexto
específico, lo que permite “ajustar” los permisos según sea necesario.

Figura 3. Módulos de Moodle por Procesos Estratégicos

Figura 4. Módulos de Moodle por Procesos Administrativos

10
ANÁLISIS DE LOS PROCESOS DE MOODLE

En esta fase se realizó un análisis de los procesos de un EVA, como Moodle, con el fin
de determinar los procesos viables para la aplicación de Analítica de Datos.

Problemas Potenciales en un EVA

Los EVA presentan deficiencias en cuanto a su gestión de los medios de


Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

almacenamiento, comunes en la mayoría de los sistemas Web que utilizan BD (Base de


Datos). Lo anterior, normalmente se traduce en tiempos lentos de respuesta, desmotivación
y baja productividad, por causa de canales congestionados, protocolos ineficientes,
intercambio de datos excesivo, problemas de latencia, entre otros. Por otro lado, tal como
señalan Aguilar y col [8], la carga de sitios Web en dispositivos móviles presenta más
latencia que en las redes cableadas, haciendo frustante la experiencia del usuario. Así,
surge la necesidad de aumentar la velocidad y la eficiencia de las aplicaciones Web,
buscando enriquecer la experiencia de sus usos, mejorando la calidad de servicio, referida
al rendimiento del sistema.

Modelo de Datos

Los datos que se plantean utilizar para obtener la información requerida por las tareas
de Analítica de Datos, provienen de la base de datos relacional de la plataforma Moodle,
cuyas tablas no sólo almacenan los objetos que se utilizan en el proceso de enseñanza
aprendizaje, sino que también almacenan cada evento llevado a cabo por cada uno de sus
actores, tales como momento en que realiza cada acción, curso al que accedió, actividad
que realizó y cuánto tiempo permaneció en ella, recursos que utilizó, entre muchos otros
detalles. Un ejemplo de esto se puede apreciar en los log, donde se almacenan algunos
registros básicos de cada usuario (ver Tabla 1, donde se muestra parte de estos registros).

Priorización y Selección del Proceso

Luego de definir las deficiencias asociadas al rendimiento que suelen presentarse en


los EVA, se seleccionaron los procesos a ser estudiados de la plataforma Moodle, para
mejorar el problema de rendimiento. Para analizar los cuatro procesos que tiene un EVA,
se llevaron a cabo los siguientes pasos:

 Se consideraron los problemas que ocurren con más frecuencia, de acuerdo a los
participantes en los foros de la página oficial de Moodle (https://moodle.org/), tales como
lentitud en la comunicación entre recursos sincrónicos, congelamiento de la plataforma
al ser accedida por múltiples usuarios a una misma actividad, lentitud de carga y
descarga de archivos, descarga de archivos desactualizados y pérdida de información
al finalizar la sesión.

11
 Se asignó un peso a las posibles causas de los problemas mencionados anteriormente,
dando un valor de 2 a las causas relacionadas con el almacenamiento, y de 1 a las que
no lo están (Ver Tabla 2).
 Luego, se cruzaron las posibles causas con los problemas que ocurren con más
frecuencia en Moodle (Ver Tablas 3, 4 y 5), sumando sólo los casos donde el peso es 2,
que corresponde a las causas que afectan el rendimiento, dando como resultado la
selección del proceso de Evaluación, por haber sido el de la suma de mayor valor (38).
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

Tabla 1. Log de Moodle


Nombre de Dato Descripción Tipo
Id Identificador del log Entero
Time Momento en que inició el evento en formato timestamp Entero
Userid Identificador del usuario Entero
Ip Dirección IP desde donde ingresó Cadena de
caracteres
Course Número asignado a cada curso Entero
Module Nombre asignado al módulo (tarea, chat, foro, otro) Cadena de
caracteres
Cmid Identificador del contexto Entero
action Acción que se realiza (ver, actualizar, cargar, etc) Cadena de
caracteres
url Ruta de la página en la que se encuentra Cadena de
caracteres
info Estado o alguna información relacionada con la actividad que Cadena de
realiza caracteres

Tabla 2. Ponderación a las causas de los problemas


Causas Ponderación
Velocidad de Procesamiento (VP) 1
Sistema Operativo (SO) 1
Navegador (N) 1
Interrnet/Intranet (IN) 1
Tipos de Formatos de Archivo (TFF) 2
Concurrencia de Usuarios(CU) 2
Throughput (TP) 2
Distribución de Base de Datos (DB) 2

El proceso de evaluación es diagramado en la Figura 5. Allí, se puede observar que


para ingresar a dicho proceso, se debe entrar primeramente a un curso que esté registrado.
Ya dentro del curso, se puede decidir si selecciona o no una sesión; en caso de que no
desee hacerlo, se le preguntará si desea ir al próximo evento. Si la respuesta es no, se le
consultará si desea ir a la actividad reciente. Si al igual que a la anterior esta respuesta es
negativa, el usuario saldrá del proceso de evaluación. Si en alguno de los casos anteriores
la respuesta es afirmativa, se le preguntará si existe una evaluación activa; en caso de que

12
así sea, se selecciona uno de los tipos de evaluación (Encuesta, Retroalimentación, Taller,
Cuestionario o Tarea) y luego de seleccionado, se ejecuta el proceso particular de esa
evaluación. Al finalizar, se le pregunta si desea llevar a cabo otro tipo de evaluación. Si la
respuesta es positiva, el proceso comienza de nuevo, pero esta vez desde la selección de
la sesión. En caso de que no se desee aplicar otra evaluación o de que, incluso, no haya
existido una evaluación activa, finaliza el proceso de evaluación.
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

Tabla 3. Suma de los pesos asociados a los recursos de almacenamiento en el proceso de


comunicación
Proceso de Comunicación
VP SO N IN TFF CU TP DB
Lentitud de
1 1 1 1 - - 2 -
Navegación
Baja Sincronía - - - 1 - 2 - -
Congelamiento de la
- - - 1 - 2 2 2
plataforma
Lentitud en
carga y descarga 1 - - 1 2 2 2 2
de archivos
Archivos corruptos - - - - 2 2 2 2
Archivos no
- - - - 2 2 2 2
actualizados
Total 34

Tabla 4. Suma de los pesos asociados a los recursos de almacenamiento en el proceso de


formación

Proceso de Formación
VP SO N IN TFF CU TP DB
Velocidad de
1 1 1 1 - - 2 -
Procesamiento
Baja Sincronía - - - - - - - -
Congelamiento de la
- - - - - 2 2 2
plataforma
Lentitud en
carga y descarga 1 - - 1 2 - 2 2
de archivos
Archivos corruptos - - - - 2 2 2 2
Archivos no
- - - - 2 2 2 2
actualizados
Total 30

13
Tabla 5. Suma de los pesos asociados a los recursos de almacenamiento en el proceso de
evaluación
Proceso de Evaluación
VP SO N IN TFF CU TP DB
Velocidad de
1 1 1 1 - - 2 -
Procesamiento
Baja Sincronía - - - 1 - 2 2 2
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

Congelamiento de la
- - - 1 - 2 2 2
plataforma
Lentitud en
carga y descarga - - - 1 2 2 2 2
de archivos
Archivos corruptos - - - - 2 2 2 2
Archivos no
- - - - 2 2 2 2
actualizados
Total 38

Figura 5. Diagrama de actividades del Proceso de Evaluación

14
CARACTERIZACIÓN DE TAREAS DE MINERÍA DE DATOS

Las posibles tareas de MD (Minería de Datos) a realizar en el proceso seleccionado se


caracterizan en esta fase, determinando los actores involucrados en el proceso de estudio,
y describiendo los escenarios actuales y posibles escenarios futuros de dicho proceso.

Selección de Actores
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

Los problemas antes mencionados suelen afectar a quienes ejercen el rol de estudiante
dentro del EVA, ya que ellos suelen ingresar en la plataforma de manera concurrente en
algunos casos y utilizan los mismos recursos al encontrarse matriculados en los mismos
cursos. Es por ello que, el análisis realizado se enfocó, en este caso, en la trayectoria de
los estudiantes dentro de Moodle.
Después de seleccionar el proceso a estudiar, se llevó a cabo un análisis que permitió
caracterizar las posibles tareas de Analítica de Datos, considerando dos de los problemas
del proceso de almacenamiento como parte de los escenarios actuales y posibles
escenarios futuros, tal como se puede apreciar en las Tablas 6, 7 y 8, respectivamente.

Tabla 6. Escenario actual


Resultado Actores Variables Actividades
Obtenido Asociados Asociadas Ejecutadas
Lentitud en la
Taller, Lección,
descarga de archivos
Cuestionario,
y perdida de Estudiante BD Moodle
Tarea, BD,
información en la
Encuesta
carga de datos

CICLO AUTONÓMICO DE TAREAS DE ANÁLISIS DE DATOS

Los ciclos autonómicos han sido definidos en [8] y se basan en la arquitectura MAPE-
K (Monitoreo, Análisis, Planificación y Ejecución) explicada en [16], donde las estrategias
de analítica básica están relacionadas entre si para generar nuevo conocimiento, que
servirá para realimentar una nueva secuencia. Los cuatro componentes que conforman un
ciclo autonómico son: Monitor, Analizador, Planificador y Ejecutor.

Ciclo Autonómico “Descarga de Archivos”

Este ciclo autonómico tiene como objetivo optimizar los procesos de transferencia de
archivos, siguiendo las tareas descritas en los escenarios futuros (ver Tabla 7), las cuales
se describen a continuación (ver Figura 6):

 Determinar los patrones de comportamiento de los estudiantes: estrategia de


agrupamiento (clustering) dentro del componente Monitor. Permite encontrar los
patrones de comportamiento de los estudiantes dentro de la plataforma Moodle,
específicamente cuando ellos presentan evaluaciones. Ellos describen los patrones de

15
concurrencias, abandonos y tiempos de permanencia dentro de las actividades, entre
otras cosas. Usa como entrada los datos de la base de datos de Moodle.

Tabla 7. Escenario Futuro – Descarga de Archivos


Actividades Nuevas
Resultados Actores Variables
de AD Funcionalidades
Patrones en el
comportamiento de los
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

estudiantes cuando Base de Datos


Clustering
presentan evaluaciones en Moodle
los cursos donde se
encuentran registrados.
Lista de los problemas Definir los modelos
Foro de
asociados al o estrategias para
Moodle. Minería Web
almacenamiento mejorar el manejo
Redes de Contenido
frecuentemente presentado de los recursos de
Sociales.
en Moodle almacenamiento
Estudiantes
Clasificación de soluciones de Moodle,
Foro de
a los problemas buscando acelerar
Moodle. Minería Web
encontrados por elemento los procesos de
Redes de Contenido
utilizado (Hardware, transmisión de
Sociales.
Software or Hibrido) archivos
Indicadores que señalen si
se debe realizar descargas Base de Datos
Pronóstico
de archivos, de cuántos y de Moodle
cuáles.
Base de Datos
Archivos Descargados Asociación
de Moodle

 Determinar problemas presentados frecuentemente en la plataforma Moodle: extrae los


problemas que se presentan frecuentemente en la plataforma Moodle asociados con el
almacenamiento, considerando sólo aquellos que tienen relación con la gestión de
archivos. Al igual que la primera tarea, tendrá como entrada los datos de la base de
datos de Moodle y se complementará con los datos obtenidos del foro de desarrolladores
de la página oficial de Moodle, a través de técnicas de Analítica de Datos Social.
 Clasificar posibles soluciones a los problemas presentados con frecuencia en la
plataforma Moodle: esta tarea está enmarcada dentro de las estrategias de Clasificación,
al categorizar las soluciones en tres tipos: Software, Hardware, o ambos (híbrido). Los
datos de entrada serán los obtenidos de los foros de desarrolladores de la página oficial
de Moodle y los de la tarea anterior.
 Predecir descarga de archivos: esta tarea permite predecir si se debe descargar o no un
archivo, dependiendo de diferentes factores, tales como el tiempo de cierre de una
actividad, si el archivo pertenece o no a un curso específico, entre otras cosas, y se

16
realiza dentro del componente planificador. Esta tarea se alimentará partir de los datos
generados en la primera tarea.

Tabla 8. Escenario Futuro – Carga de Datos


Actividades Nuevas
Resultados Actores Variables
de AD Funcionalidades
Patrones en el
comportamiento de los
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

estudiantes cuando Base de Datos


Clustering
presentan evaluaciones en Moodle
los cursos donde se
encuentran registrados.
Lista de los problemas
Foro de
asociados al Definir los modelos
Moodle. Minería Web
almacenamiento o estrategias para
Redes de Contenido
frecuentemente presentado mejorar el manejo
Sociales.
en Moodle de los recursos de
Estudiantes
Clasificación de soluciones almacenamiento
Foro de
a los problemas de Moodle,
Moodle. Minería Web
encontrados por elemento buscando evitar la
Redes de Contenido
utilizado (Hardware, pérdida de datos
Sociales.
Software or Hibrido)
Evaluaciones clasificadas Base de Datos
Clasificación
como exitosas y no exitosas de Moodle
Tiempo estimado para la Base de Datos
Pronóstico
carga de datos de Moodle
Base de Datos
Datos Cargados Asociación
de Moodle

Figura 6. Ciclo Autonómico: Descarga de Archivos

17
 Descarga de archivos: aquí se lleva a cabo el objetivo del ciclo autonómico, es decir, se
produce la descarga de uno o varios archivos. Se indica dónde se almacenarán y cómo
se realizará la descarga, considerando lo que haya indicado la predicción y las posibles
soluciones generadas en la tarea de clasificación de soluciones.

Ciclo Autonómico “Carga de Datos”

Este ciclo autonómico tiene como objetivo evitar la pérdida de información cuando se
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

lleva a cabo la carga de datos (ver Figura 7). Este ciclo presenta seis tareas (ver Tabla 8),
tres de los cuales son comunes con el primer ciclo (“Determinar patrones del
comportamiento de los estudiantes”, “Determinar los problemas frecuentemente
presentados en Moodle” y “Clasificar posibles soluciones a los problemas presentados en
la Plataforma”). Así que a continuación se describen las tres restantes:

 Clasificar los Tipos de Evaluación: esta tarea divide las evaluaciones que fallaron en la
carga de los datos de las que no fallaron al momento de finalizar el período de tiempo
asignado, teniendo como entrada los datos obtenidos de la base de datos Moodle y los
problemas determinados en el Monitor.
 Predecir carga de datos: se pronostica si las respuestas de las evaluaciones deben ser
guardadas en caso de que a la actividad se le haya asignado un tiempo de cierre, para
evitar perder los datos, considerando los patrones de conducta de los estudiantes,
obtenido en la primera tarea.
 Cargar Datos: se lleva a cabo la carga de datos, agrupando las respuestas que el
estudiante ha proporcionado hasta cierto punto, segmentando por página o por
preguntas el almacenamiento de manera automática, considerando las posibles
soluciones obtenidas en la tarea de clasificación.

Figura 7. Ciclo Autonómico: Carga de Datos

18
En las Tablas 7 y 8 se observa que la aplicación de las tareas de análisis de datos
(agrupamiento, minería Web de contenido, clasificación, pronóstico y asociación) generan
modelos o estrategias para optimizar el manejo de los recursos de almacenamiento de
Moodle, buscando acelerar los procesos de transmisión de datos y descarga de archivos.

Modelo de Datos Multidimensional

Los datos asociados a las variables de los subprocesos que componen el proceso de
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

evaluación se basan en el diagrama entidad relación de la base de datos Moodle. El estudio


de esta base de datos permitió construir una Vista Minable Conceptual (VMC) con las
variables de interés para el caso de estudio, y una Vista Minable Operativa (VMO) en la que
se definieron las variables objetivo.

 Vista Minable Conceptual: para la VMC fueron seleccionadas las variables requeridas
por los ciclos autónomos, desde la base de datos Moodle. Además, en la VMC se
establecen las operaciones de Extracción-Transformación-Carga (ETL, Extraction-
Transformation-Load), como lo establece la metodología MIDANO (ver en la Tabla 9,
una vista parcial de la VMC) [1, 17].
 Vista Minable Operativa: en la Figura 8 se puede ver el modelo multidimensional que
contiene dos tablas de hechos (carga y descarga, una para cada ciclo autónomo),
además de varias tablas de dimensiones que integran las variables seleccionadas por
temas (por ejemplo, las tablas de dimensiones quiz, files, user, assignment, entre otras).

CONCLUSIONES

En este trabajo, se aplicaron técnicas de Analítica de Datos, utilizando la metodología


MIDANO, que identifica procesos de interés para el estudio planteado. En este caso, la
metodología MIDANO fue capaz de priorizar los procesos que se llevan a cabo en el EVA,
partiendo de la problemática a estudiar.
Los ciclos autonómicos de tareas de AD tienen como finalidad la obtención de
conocimiento que permitan analizar y resolver los problemas de rendimiento que suelen
presentarse en este tipo de infraestructuras. Esos ciclos autonómicos estudian dos
subprocesos relacionados con el rendimiento en la gestión de almacenamiento en un EVA,
como lo son la descarga de archivos y la carga de datos. Ellos se basan en escenarios
futuros deseados, donde se presentan las mejoras que se quieren ocurran, que en este
trabajo fueron acelerar los procesos de transmisión de archivos y evitar la pérdida de datos.
Por otro lado, los ciclos autonómicos obtenidos son la base para desarrollar las
implementaciones específicas de optimización del proceso de evaluación, usando técnicas
de minería de datos, tales como árboles de decisión, reglas de asociación, redes
neuronales, entre otros. En futuros trabajos realizarán dichas implementaciones.

19
Tabla 9. Operaciones ETL
Variable Tipo Extraer de Transformar Cargar
Tabla
user Entero log Tablas de Hecho
Descarga y Carga
ip Entero log Tablas de Hecho
Descarga y Carga
course Entero log Tablas de Hecho
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

Descarga y Carga
module Entero log Tablas de Hecho
Descarga y Carga
action Cadena de log Cambiar por un entero Tablas de Hecho
Caracteres Descarga y Carga
time Entero Diferencia entre los tiempos Tablas de Hecho
timeend y timestart de la tabla Descarga y Carga
log. Indicaría el tiempo de
permanencia en el modulo.
dtime Entero log Tiempo en que inicia la descarga Tabla de Hecho
(timestart cuando action toma el Descarga
valor download en la tabla log)
loadtime Entero log Tiempo en que inicia la carga Tabla de Hecho
(timestart cuando action toma el Carga
valor upload en la tabla log)
timelimit Entero Tiempo asignado a una carga o Tablas de Hecho
descarga según tamaño del Descarga y Carga
archivo. (valor estimado)
concurrency BIT 1: si hay concurrencia. 0: no hay. Tablas de Hecho
En el caso de la descarga, existe Descarga y Carga
concurrencia si el dtime o
loadtime de otro usuario que
descarga el mismo archivo o
carga los mismos datos, coincide
con algún valor entre el dtime o
loadtime y el timelimit de este
usuario o viceversa.
nconcurrency BIT Número de usuarios concurrentes Tablas de Hecho
con este usuario. Se contabilizan Descarga y Carga
todos los usuarios que inicien la
descarga de un mismo archivo o
la carga de los mismos datos o no
hayan finalizado esta operación
entre el rango de tiempo que
cubre el dtime o loadtime y el
timelimit, según sea el caso.
file Entero files Tablas de Hecho
Descarga y Carga

20
sizefile Entero files Tablas de Hecho
Descarga y Carga
status Entero files Tablas de Hecho
Descarga y Carga
nfile Entero files Se contabilizan los archivos Tabla de Hecho
asociados al que se descarga Descarga
ndownloads Entero log/files Número de descargas que se Tabla de Hecho
llevan a cabo por éste y otros Descarga
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

usuarios desde que entra al


módulo hasta que sale de él, ya
sea del mismo archivo o de
archivos asociados
uploadtime Entero log Tiempo en que hace el envío de Tabla de Hecho
los datos Carga
abandon Entero log Tiempo en que cambia el action Tabla de Hecho
del usuario sin haber culminado la Carga
carga

Figura 8. Modelo Multidimensional

21
AGRADECIMIENTOS

M.Sc Moreno ha sido becada como estudiante del Doctorado de Ciencias Aplicadas
por la Universidad de Los Andes, Mérida, Venezuela, programa en el cual se encuentra
enmarcado este trabajo.

REFERENCIAS BIBLIOGRÁFICAS
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

[1] Rangel C., Pacheco F., Aguilar J., Cerrada M., Altamiranda J. (2013). Methodology for
Detecting the Feasibility of Using Data Mining in an Organization. XXXIX Conferencia
Latinoamericana en Informática (CLEI 2013), Naiguatá, Vargas, Venezuela.

[2] Alvarez A., Alarcón A., Callejas M. (2016). Comparación de Modelos y Estándares de
Evaluación de Calidad para una Plataforma de Aprendizaje Virtual. Actas de Ingeniería.
Vol 2 (Pp. 254-262).

[3] Marjanovic D., Milovanovic M., Radenkovic B. (2014). Hadoop Infrastructure for
Education. Documento en Línea. Disponible en:
https://es.slideshare.net/darkomarjanovic/hadoop-infrastructure-for-education
(Consulta en enero 2017).

[4] O'Reilly Radar Team (2012). Big Data Now: Current Perspectives from O'Reilly Radar.
2012 Edition. O'Reilly Media.

[5] Ramachandra K., Sudarshan S. (2014). Method for Optimizing Performance of


Database/web-service Backed Applications by Automatically Prefetching Query
Results. Documento en Línea. Disponible en
https://www.google.com/patents/US20140195512 (Consulta en enero 2017).

[6] Ashraf A., El-Bakry H.M., El-razek S.M.A., El-Mashad Y., Mastorakis N. (2015).
Enhancing Big Data Processing in Educational Systems. 11th International Conference
on Educational Technologies (EDUTE 2015), Dubai, United Arab Emirates.

[7] Merceron A., Blikstein P., Siemens G. (2015). Learning Analytics: From Big Data to
Meaningful Data. Journal of Learning Analytics, Vol. 2, No. 3 (Pp. 4-8).

[8] Aguilar J., Buendia O, Cordero J. (2017). Specification of the Autonomic Cycles of
Learning Analytic Tasks for a Smart Classroom. Aceptado para su publicación en
Journal of Educational Computing Research.

[9] Aguilar J., Valdiviezo P., Cordero J., Sánchez M. (2015). Conceptual Design of a Smart
Classroom Based on Multiagent Systems. 17th International Conference on Artificial
Intelligence (ICAI 2015), Las Vegas, Nevada, USA.

22
[10] Aguilar J., Sanchez M., Cordero J., Valdiviezo-Díaz P., Barba-Guamán L., Chamba-
Eras L. (2017). Learning Analytics Tasks as Services in Smart Classroom, International
Journal Universal Access in the Information Society (Pp. 1-17).

[11] Fernández-Pampillón Cesteros A. (2009). Las Plataformas e-learning para la


Enseñanza y el Aprendizaje Universitario en Internet. Documento en Línea. Disponible
en http://eprints.ucm.es/10682/1/capituloE learning.pdf (Consulta en enero 2017).
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

[12] Bernárdez M. (2005). Módulo: Organización y Mercado. Documento en Línea.


Disponible en http://www.expert2business.com/itson/Organizacionymercado.htm
(Consulta en enero 2017).

[13] Boneu J.M. (2007). Plataformas Abiertas de e-learning para el Soporte de Contenidos
Educativos Abiertos. Revista de Universidad y Sociedad del Conocimiento, Vol. 4, No.
1 (Pp. 36-47).

[14] Belloch C (2017). Entornos Virtuales de Formación. Documento en Línea. Disponible


en http://www.uv.es/bellochc/pedagogia/EVA5.wiki (Consulta en enero 2017).

[15] Dougiamas M. (2016). Actividades. Documento en Línea. Disponibe


https://docs.moodle.org/all/es/Actividades (Consulta en diciembre 2016).

[16] Arcaini P., Riccobene E., Scandurra P. (2015). Modeling and Analyzing MAPE-K
Feedback Loops for Self-Adaptation. 10th International Symposium on Software
Engineering for Adaptive and Self-Managing Systems (SEAMS 2015), Florence, Italy.

[17] Pacheco F., Aguilar J., Rangel C., Cerrada M., Altamiranda J. (2014). Methodological
Framework for Data Processing based on the Data Science Paradigm. XL Conferencia
Latinoamericana en Informática (CLEI 2014), Montevideo, Uruguay.

BIOGRAFIA DE LOS AUTORES

Yaneth Moreno Caldera

Es Ingeniero de Sistemas y obtuvo una Maestría en Computación en la Universidad de Los Andes


(ULA), Mérida, Venezuela. Actualmente, cursa estudios doctorales en el programa de Ciencias
Aplicadas de la Universidad de los Andes, Mérida, Venezuela, dirigiendo la línea de investigación
Optimización en la Gestión de los recursos de Almacenamiento de Entornos E-Learning Basada en
Big Data. Es profesora Asistente del Núcleo Universitario “Rafael Rangel”, Trujillo, de la ULA, en el
área de computación. Además, es investigadora del Centro de Microcomputación y Sistemas
Distribuidos (CEMISID), en la ULA.

23
Jose Lisandro Aguilar Castro

Es Ingeniero de Sistema de la Universidad de los Andes, Mérida, Venezuela. Obtuvo una Maestría
en Informática en la Universidad Paul Sabatier, Toulouse, France y el Doctorado en Ciencias
Computacionales en la Universidad Rene Descartes, Paris, France. Además, realizó un
Postdoctorado en el Departamento de Ciencias de la Computación de la Universidad de Houston.
Es profesor Titular del Departamento de Computación de la Universidad de los Andes (ULA) e
Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 4 Edición No 1.Enero – Junio del 2018

investigador del Centro de Microcomputación y Sistemas Distribuidos (CEMISID) de la misma


universidad. Es miembro Correspondiente Estadal de la Academia de Mérida y del Comité Técnico
Internacional de la IEEE en Redes Neuronales. Además, actualmente es el coordinador del
Programa Doctoral en Ciencias Aplicadas de la Facultad de Ingeniería de la Universidad de los
Andes. Fue Presidente fundador del Centro Nacional de Desarrollo e Investigaciones en Tecnología
Libre (CENDITEL), y de FUNDACITE-Mérida. Además, Jefe del Departamento de Computación de
la ULA del 2011 al 2014, y Director del CEMISID del 2001 al 2007. Ha publicado más de 400 artículos
científicos en revistas, libros y actas de congresos internacionales, en los campos de Sistemas
Paralelos y Distribuidos, Computación Inteligente, Optimización Combinatoria, Reconocimiento de
Patrones, Sistemas de Automatización Industrial, etc. También ha sido autor/coautor de 10 libros,
editor de varios libros, y forma parte de varios comités editoriales de revistas. Además, ha dictado
cursos de entrenamiento nacional e internacional y ha recibido varios premios/reconocimientos
nacionales e internacionales científicos. El Dr. Ha sido presidente del Comité Científico de varios
eventos nacionales e internacionales. Además, ha coordinado o participado en más de 30 proyectos
de investigación o industriales. Por otro lado, ha sido consultor de diferentes empresas, ministerios
y universidades latinoamericanas y venezolanas. Finalmente, ha sido tutor de más de 90 tesis de
Licenciatura, Maestría y Doctorado.

Francisco Javier Hidrobo

Es Ingeniero de Sistemas y obtuvo un título de Maestría en Computación en la Universidad de Los


Andes (ULA), Mérida, Venezuela, y de Ph.D en Arquitectura y Tecnología de Computadoras en la
Universidad Politécnica de Cataluña, España. Es profesor Titular en la Facultad de Ciencias de la
Universidad de los Andes e investigador adscrito al laboratorio de Sistemas Unificados en
Matemáticas Aplicadas (SUMA).

24

También podría gustarte