Predicción Del Rendimiento de Estudiante en Entornos Virtuales

Predicción del rendimiento de un alumno en línea interpretable
Modelo basado en análisis de aprendizaje

Wei Zhang Yilin Zhou Baolin Yi
Universidad Normal de China Central Universidad Normal de China Central Universidad Normal de China Central
NO.152 Luoyu Road, Wuhan, NO.152 Luoyu Road, Wuhan Hubei, PR NO.152 Luoyu Road, Wuhan Hubei, PR
Hubei, PR China 43007 China 43007 China 43007
8613476213036 8618827420751 8613971190483
zwccnu@163.com 2017113209zyl@mails.ccnu.edu.cn 306978196@qq.com
RESUMEN como MOOC, y un gran número de usuarios de la plataforma generan datos educativos a
gran escala [5]. Con respecto al fenómeno de que el número de usuarios registrados en la
La mayor parte del modelo de predicción del rendimiento de los estudiantes solo se centró en
plataforma MOOC es alto y la tasa de abandono es extremadamente alta, los
la precisión de los resultados de la predicción, pero lograr un modelo de predicción
investigadores han comenzado a explorar la relación entre el comportamiento de los
interpretable puede ser tan importante como obtener una alta precisión en la investigación de
usuarios y si han abandonado la escuela (o si pueden obtener un certificado). Al analizar la
predicción del aprendizaje. Este artículo propuso un modelo de predicción del desempeño de
información del comportamiento del usuario y predecir los resultados del aprendizaje,
los estudiantes basado en análisis de comportamiento de aprendizaje en línea con 19
esperan descubrir la relación, a fin de tomar medidas tempranas para reducir la tasa de
indicadores de comportamiento. Este modelo consta de cuatro pasos: recopilación y
abandono de la plataforma MOOC [6,7].
procesamiento de datos, análisis de correlación, análisis de datos, algoritmo de predicción del
rendimiento del estudiante, predicción e intervención. Además, se ha tomado un caso para
predecir el desempeño de los estudiantes según el modelo con algoritmo de programación En los estudios de predicción reales, la mayoría de los estudios utilizaron modelos de
genética basado en reglas. Los resultados del experimento muestran que el algoritmo de algoritmos incomprensibles para predecir los resultados del aprendizaje [8], como las redes
programación genética basado en reglas tiene una interpretación más sólida para garantizar logísticas y bayesianas. Aunque tales modelos pueden predecir con precisión los resultados
una precisión de predicción competitiva. del aprendizaje, no se pueden interpretar. Sin duda, eso tendrá un impacto en la
implementación de intervenciones específicas. Por lo tanto, para promover la construcción del
Hstar y mejorar la calidad docente del aprendizaje en línea, desde la perspectiva de alta
interpretación de los resultados de la predicción, es muy necesario construir un modelo de
Conceptos de CCS predicción del desempeño del estudiante basado en analíticas de comportamiento de
• Temas sociales y profesionales ➝ Evaluación del estudiante • Temas sociales y aprendizaje en línea.
profesionales ➝ Educación K-12.
El modelo de análisis de aprendizaje es la base teórica para el análisis del

Palabras clave
comportamiento de aprendizaje en línea en el contexto de big data. educación.
Plataforma de aprendizaje en línea; modelo de desempeño estudiantil; análisis del comportamiento
Actualmente, la analítica del aprendizaje está todavía en pañales. Sin embargo, los
de aprendizaje; algoritmo de predicción; intervención.
modelos de análisis de aprendizaje representativos existentes tienen las características
1. INTRODUCCIÓN comunes: ciclo de datos. Desde la perspectiva de la analítica de enfoques de sistemas,

George Siemens proporciona un modelo de analítica de aprendizaje cíclico, que incluye
Con el aumento de datos en la plataforma de aprendizaje en línea, los investigadores y
siete componentes: recopilación, almacenamiento, limpieza de datos, integración,
académicos comienzan a encontrar formas de hacer que estos datos sean comprensibles y
análisis, representación y visualización, y acción [9]; Desde el ángulo de la mejora de la
significativos [1]. Por lo tanto, para analizar y desenterrar más información educativa potencial,
enseñanza y el aprendizaje, Tanya Elias presenta un modelo cíclico de mejora continua
los investigadores han explorado más la teoría del aprendizaje y el análisis, los marcos, las
para la analítica del aprendizaje, que consta de tres partes: recopilación de datos,
herramientas y las prácticas [2, 3]. En los últimos años, la gente ha estudiado cada vez más la
procesamiento de información y aplicación del conocimiento, todo el proceso está
analítica de los comportamientos de aprendizaje y la predicción del rendimiento de los
respaldado por cuatro tipos de recursos tecnológicos: computadoras, teoría, personas,
estudiantes también ha atraído la atención de los académicos. Desde 2013, con el desarrollo
organizaciones. Con el fin de explorar diferentes enfoques para el análisis de datos, Dirk
continuo de la investigación y el análisis del aprendizaje, los investigadores han comenzado a
Ifenthaler plantea un marco de análisis de aprendizaje, que incluye diez partes, y la
utilizar el aprendizaje automático para estudiar las predicciones del aprendizaje [4]. Por
relación entre cada parte se convirtió en bidireccional [10].
supuesto, esto se beneficia del desarrollo de plataformas de aprendizaje en línea como
El permiso para hacer copias digitales o impresas de todo o parte de este trabajo para uso personal
o en el aula se otorga sin cargo siempre que las copias no se hagan o distribuyan con fines de lucro Con el desarrollo continuo de la tecnología de aprendizaje y análisis [11], en los
o ventaja comercial y que las copias lleven este aviso y la cita completa en la primera página. . Se últimos años han surgido más y más investigaciones nuevas sobre la predicción
deben respetar los derechos de autor de los componentes de este trabajo que son propiedad de inclinada. A partir de la investigación existente, el modelo de predicción del
terceros distintos de ACM. Se permite resumir con crédito. Copiar de otra manera, o volver a aprendizaje se puede dividir en dos categorías, una pertenece al modelo de caja
publicar, publicar en servidores o redistribuir a listas, requiere permiso específico previo y / o una
negra, es decir, para el resultado de la predicción, la razón no se puede ver
tarifa.
directamente; el otro pertenece al modelo de caja blanca, es decir, hay una
explicación directa del resultado de la predicción.
ICETC 2019, 28 al 31 de octubre de 2019, Ámsterdam, Países Bajos © 2019
Association for Computing Machinery.
ACM ISBN 978-1-4503-7254-1 / 19/10… $ 15,00
https://doi.org/10.1145/3369255.3369277
148
En estudios relacionados de predicción del aprendizaje, los investigadores generalmente Girish Balakrishman usó cuatro indicadores del porcentaje acumulado de conferencias en
creen que la predicción de caja negra tiene mayor precisión. Especialmente cuando se video que se pueden ver, el número de publicaciones en el foro, el número de usuarios
trata de relaciones complejas. Los algoritmos de predicción de caja negra que se utilizan que se basan en el foro y el número de visualizaciones del progreso del curso como
a menudo para la investigación incluyen regresión logística, máquinas de vectores de predictores; Cristóbal Romero et al. predijo directamente el desempeño de los alumnos a
soporte (SVM) y bosque aleatorio (RF). Pedro y col. utilizar algoritmos de regresión partir de la participación del foro. Los indicadores incluían: el número de mensajes de los
logística para predecir si los estudiantes registran cursos en sistemas asistidos alumnos, el número de alumnos que crean nuevos temas, el número de alumnos que leen
inteligentes (ITS) [6]. Teniendo en cuenta la complejidad de la investigación y los datos pegatinas, la concentración de alumnos y alumnos, la persistencia y otros indicadores
difíciles recopilados del estado emocional, la motivación y el conocimiento previo, la [15].
precisión de la predicción final es cercana al 70% y el rendimiento de la predicción no es
malo. Ley y col. utilizar la regresión lineal y la regresión logística para predecir el nivel del
En la actualidad, el modelo de analítica del aprendizaje tiene una importancia rectora
alumno (si el alumno es un principiante, un avanzado o un experto), los resultados de la
importante para el desarrollo de un sistema de enseñanza personalizado, sin embargo,
predicción muestran que el algoritmo tiene un buen efecto de predicción. Los bosques
carece de orientación práctica, lo que hace que el alcance de la analítica sea abstracto. El
aleatorios también se utilizan ampliamente como algoritmo de predicción. Schalk y col.
estudio de la predicción del rendimiento de los estudiantes proporciona una guía real para el
utilizar modelos de RF para predecir si los alumnos fallan, el estudio también obtiene
desarrollo o la investigación del sistema, ofrece los métodos de recomendación basados en
resultados de predicción más satisfactorios, pero es difícil explicar la compleja relación
diferentes principios, como el filtrado colaborativo, la red bayesiana, la regla de asociación,
entre entrada y salida.
etc. Pero la selección del indicador algorítmico carece de integración con las características
de el entorno de aprendizaje en línea, conduce a una mala interpretación y poca precisión en
los resultados de predicción. Por lo tanto, este artículo construye un modelo de predicción del
efecto de aprendizaje en línea con una fuerte interpretabilidad y una alta precisión de
La predicción de caja blanca tiene un mayor grado de interpretación, es decir, existe una razón predicción. que combina las características de la plataforma Hstar y el proceso de aprendizaje
específica para el resultado de la predicción. Por supuesto, cuando la interpretación es alta, la en línea, y selecciona indicadores de comportamiento de aprendizaje científicamente
precisión de la predicción puede verse reducida. En el campo de la educación, los algoritmos apropiados mientras aprende de los últimos resultados de investigación y entrevista a
de predicción de caja blanca que se utilizan a menudo para la investigación incluyen árboles de expertos. Este estudio selecciona la programación genética basada en reglas como algoritmo
decisión y árboles aleatorios. Macfadyen y col. Desarrollar un sistema de predicción de caja de predicción.
blanca que prediga el rendimiento de los alumnos en un sistema de gestión del aprendizaje
(LMS) mediante el tiempo de aprendizaje dedicado al módulo de actividades y la frecuencia de
uso del módulo [12]. Hu y col. usar el árbol de decisiones para desarrollar sistemas de
predicción temprana usando cuatro valores propios y clasificarlos en cuatro categorías:
comportamiento de aceptación, uso de materiales del curso en línea, estado de la tarea y 2. METODOLOGÍA
participación en un foro de discusión. El objetivo de la predicción es la puntuación del alumno, y 2.1 Selección de indicadores de comportamiento
la precisión general de la predicción alcanzó el 95% [13], después de lo cual combinaron estas El indicador de comportamiento de aprendizaje afecta directamente la precisión y credibilidad de la
técnicas con el algoritmo Adaboost. Mayor precisión al 98% (Freund). predicción del desempeño del estudiante. Por lo tanto, la selección científica de indicadores de
comportamiento de aprendizaje eficaces es una parte importante de la predicción del rendimiento
del estudiante [16]. Debido a la diversidad de comportamientos de aprendizaje en línea, y la
complejidad de la correlación entre comportamientos, no todos los indicadores de comportamientos
La selección de indicadores de comportamiento de aprendizaje adecuados es una parte de aprendizaje que pueden afectar el efecto de aprendizaje pueden recopilarse de forma
importante para la predicción. En la actualidad, existen muchos estudios teóricos sobre la cuantitativa. Por lo tanto, con base en los resultados de investigación existentes, combinando las
selección de indicadores de comportamiento de aprendizaje [14]. Estos estudios cubren características del Hstar, desde las cinco etapas de preparación del aprendizaje, progreso
indicadores que pueden estar relacionados con el efecto del aprendizaje desde diferentes curricular, aprendizaje de recursos, intercambio de foros y prueba de tareas, en las múltiples
perspectivas. Por ejemplo, Brown resumió tres indicadores principales de predicción: dimensiones de objetivos de aprendizaje autoexplicativos, recolección de información, procesar
características del alumno, indicadores de comportamiento de aprendizaje y trabajos de los información, publicar información y usar información, realizamos estadísticas sobre todos los
alumnos. Discutió las capacidades de predicción relacionadas y los casos para diferentes tipos indicadores de comportamiento de aprendizaje relacionados con las actividades de aprendizaje en
de indicadores. Usamah y col. resumió varios indicadores importantes del desempeño línea en la plataforma. Luego, tome un cuestionario abierto para entrevistar a expertos en el campo.
académico previo de los estudiantes, antecedentes de aprendizaje, participación en clase y Los 19 indicadores de conducta de aprendizaje requeridos para el estudio fueron seleccionados
desempeño social. Berry y col. combinó tres indicadores que influyeron en el rendimiento como se muestra en la Tabla 1.
académico: factores académicos, factores demográficos y factores culturales y sociales.
Tabla 1. Indicadores de comportamiento de aprendizaje en línea
Aprendizaje Dimensión Contenido Indicador Código

proceso
Número de curso P_BI
Preparación Antes de clase Antes de clase vistas de introducción
Número de registro del curso P_BR
Asistencia Número de inicio de sesión del curso CAMARADA
Progreso Autoexplicativo Número de página de progreso del curso comprobada P_CP

Objetivos de aprendizaje
Preocupación
Tiempo de vigilancia de recursos R_LT
149
Coleccionando Recurso principal Finalización de la vigilancia de recursos R_LC
información aprendizaje
Densidad de la vigilancia de recursos R_LD
Procesando Recurso principal Número de reproducción repetida de recursos R_PT1
Recurso información persistencia
aprendizaje Grado de recurso repetido reloj R_PD
Número de recurso repetido ver después R_PT2

curso de finalización
Recolección / procesamiento Otro recurso Número de otro recurso de acceso R_LN

información aprendizaje
Número de exploración del foro MENTIRA
Foro Publicación Interactivo Número de publicaciones en el foro F_IP

Interacción información participación
Número de respuestas del foro ABETO
Terminación Número de publicación T_CP

cantidad
Número medio de ahorro T_CS
Prueba Usando información Diferencia horaria entre publicación y lanzamiento T_PT
Terminación Densidad del puesto T_PD

positividad
Intervalo de tiempo T_PI
En la Tabla 1, la finalización de la vigilancia de recursos se calcula por el tiempo total del recurso de
2.3 Recopilación y procesamiento de datos
aprendizaje (tiempo recomendado) dividido por el tiempo que el estudiante dedica al recurso de
Esta etapa debe completar dos tareas: recopilación de datos y procesamiento de datos. La escena
aprendizaje, lo que refleja la finalización del aprendizaje. La densidad de la vigilancia de recursos se
de recopilación de datos de comportamiento de aprendizaje es una plataforma de aprendizaje en
refiere a la cantidad de tiempo de vigilancia de recursos dividida por la diferencia de tiempo entre la
línea. Los datos generados desde PC, móvil y Web.
última vista del recurso y la primera vista, lo que refleja la concentración de los estudiantes. La
densidad de la publicación se calcula dividiendo la cantidad de publicaciones de prueba por la
Los datos almacenados en la base de datos están fragmentados y
diferencia de tiempo entre la última presentación de la prueba y la primera presentación, lo que
desordenados. Hay problemas como la inclusión de datos inconsistentes,
refleja la positividad de los estudiantes.
datos incompletos y números anormales. Es necesario procesar los datos
del comportamiento de aprendizaje. El procesamiento de datos significa la
eliminación de valores perdidos, valores irrelevantes y combinación de
2.2 Modelo de predicción del desempeño del estudiante datos de múltiples fuentes de datos en una base de datos consistente. En
A través de los datos de comportamiento de aprendizaje de la plataforma en línea, se pueden general, la integración de datos de diferentes bases de datos en la misma
analizar los comportamientos de aprendizaje individualizados de diferentes tipos de estudiantes, es base de datos requiere herramientas de procesamiento de datos de
beneficioso descubrir posibles problemas en el proceso de aprendizaje de los estudiantes y terceros, como herramientas de desarrollo eclipse y tomcat. En la etapa de
proporcionar a los maestros una base oportuna para la intervención (alerta temprana), a fin de llevar procesamiento de datos, se utilizan métodos de minería de datos para
a cabo enseñanza y aprendizaje personalizados. procesar conjuntos de datos. Por un lado, los métodos de procesamiento
tradicionales, como la limpieza de datos, la conversión de formato y la
Intervención separación de datos, se utilizan para mejorar el significado representativo
Pareo de los datos o las tecnologías que deben usarse posteriormente. Por otra
Cálculos parte,
Predicción Intervención
Resultado
Intervención
Estrategia
2.4 Análisis de correlación
Motor Después del procesamiento de datos, se realizan más análisis de los datos. Para identificar si un
Reconocimiento Implementación
indicador de comportamiento está relacionado con el resultado final, se realiza un análisis de
correlación. Si el resultado del análisis no muestra nada, se abandona el indicador de
comportamiento y, si es relevante, se retiene el indicador de comportamiento. A través del
Figura 1. Modelo de predicción del desempeño de los estudiantes
análisis de correlación de datos, los indicadores de comportamiento que influyen en los
Este estudio parte del propósito de la predicción del desempeño del estudiante, de acuerdo
resultados se seleccionan como valores de entrada para el algoritmo de predicción del siguiente
con los indicadores de comportamiento determinados en el apartado anterior, recoge y coteja
paso.
datos de la plataforma de aprendizaje online. Luego, realiza un análisis de correlación de los
datos y determina el valor del índice requerido como entrada del algoritmo de predicción. A
continuación, seleccione el algoritmo de predicción apropiado para calcular y obtenga el 2.5 Algoritmo de predicción del rendimiento del
resultado de predicción interpretable. Según la analítica del resultado de la predicción, el
estudiante
método y los medios de intervención se pueden proporcionar a tiempo. El modelo específico
La elección del algoritmo de predicción tiene una gran influencia en la precisión de los
de predicción del rendimiento de los estudiantes se muestra en la figura 1.
resultados de la predicción. En términos de efectos de enseñanza, si solo conocemos los
resultados de la predicción, solo podemos clasificarlos y adoptar intervenciones artificiales para
diferentes tipos de estudiantes.
150
Sin embargo, si conocemos el motivo de los resultados de la predicción, los profesores el estado de cada enlace, y hacer que la intervención proceda según el
pueden utilizar los motivos de la clasificación de los alumnos para adoptar intervenciones proceso normal. Al mismo tiempo, se pueden realizar ajustes al proceso de
específicas, el modelo de algoritmo predecible que se puede interpretar al mismo tiempo intervención.
es propicio para la construcción de sistemas de intervención automática. Por tanto, debe
2. Con base en el resultado producido por el modelo de predicción, reconocer el
tener explicaciones en la selección de modelos de predicción.
desempeño predicho del estudiante e interpretar las razones de su efecto.
Desde la perspectiva de alta interpretación de los resultados de la predicción, los métodos de

3. Los cálculos de emparejamiento de intervenciones significan que una serie de intervenciones
aprendizaje automático, como los árboles de decisión y los sistemas basados en reglas, superan las
correspondientes a los efectos del aprendizaje se formulan de antemano para los posibles
limitaciones que los clasificadores no permiten que las personas comprendan y verifiquen,
resultados de la predicción y, en función del rendimiento del estudiante y las razones del mismo,
proporcionando una inteligibilidad transparente. Los algoritmos evolutivos, en particular la
mediante cálculos de emparejamiento relevantes, las intervenciones se eliminan de la
planificación evolutiva (EP) y la programación genética (GP), se han aplicado con éxito para construir
intervención. grupo de estrategias, encuentre el mejor método de coincidencia.
árboles de decisión y sistemas basados en reglas. Los sistemas basados en reglas son
particularmente fáciles de usar y proporcionan un modelo de clasificación compacto, fácil de
entender, intuitivo y preciso. Para la comprensión, por lo general, el uso de un modelo más simple 4. La implementación de intervenciones se refiere a impulsar las
pero transparente sacrifica la precisión, que equilibra la precisión y la comprensión. Cano et al ' El intervenciones a aprendices con apropiado
algoritmo mejorado de programación genética basado en reglas (GP-ICRM) tiene como objetivo intervenciones basadas en las mejores estrategias de intervención.
maximizar la interpretabilidad de la clasificación minimizando el número y las condiciones de las

3. RESULTADOS Y DISCUSIÓN
reglas [18]. En los 35 conjuntos de datos diferentes, los experimentos se compararon utilizando 9
Este estudio selecciona un curso en línea "Education Cloud Computer" en la
algoritmos. El resultado experimental mostró que el algoritmo de programación genética basado en
plataforma de enseñanza Hstar de la Universidad Normal de China Central. A partir
reglas obtuvo resultados competitivos y precisos en comparación con otros modelos de algoritmos de
de la demanda de predicción de alta interpretación, las calificaciones del alumno se
clasificación interpretables en la tasa de precisión de predicción y el tiempo de ejecución. En la
analizarán y predecirán utilizando un algoritmo de programación genética basado en
interpretabilidad, el algoritmo obtiene un número menor de reglas y condiciones. Por lo tanto,
reglas. El curso comienza el 1 de marzo de 2016 y tiene una duración de 16
elegimos un algoritmo de programación genética basado en reglas como algoritmo de predicción. El
semanas. Un total de 105 estudiantes toman el curso. El curso tiene 68 materiales
resultado experimental mostró que el algoritmo de programación genética basado en reglas obtuvo
didácticos y 3 asignaciones. La estructura del plan de estudios se muestra en la
resultados competitivos y precisos en comparación con otros modelos de algoritmos de clasificación
Figura 4.5. Los datos del comportamiento de aprendizaje de los estudiantes se
interpretables en la tasa de precisión de predicción y el tiempo de ejecución. En la interpretabilidad, el
almacenan en las bases de datos MySQL y MongoDB. Este caso usa la calificación
algoritmo obtiene un número menor de reglas y condiciones. Por lo tanto, elegimos un algoritmo de
del estudiante para representar el desempeño del estudiante, y la calificación toma el
programación genética basado en reglas como algoritmo de predicción. El resultado experimental
promedio de las tres tareas. Después de ser considerado por el maestro, la
mostró que el algoritmo de programación genética basado en reglas obtuvo resultados competitivos y precisos en comparación con otros modelos de algoritmos de clasificación interpretables en la tasa de precisión de predicción y el t
calificación se divide en cuatro categorías: perfecta (90-100), excelente (80-89),
2.6 Predicción e intervención del desempeño del buena (70-79) y suficiente (60-69).
estudiante
El estado de egreso de los alumnos, los exámenes aprobados, los niveles de aprendizaje de los
alumnos y los estilos de aprendizaje en la plataforma de aprendizaje en línea pertenecen al 3.1 Recopilación y procesamiento de datos de Hstar
rendimiento de los alumnos [15]. El estudio utiliza la herramienta eclipse para contar los datos en la base de datos que se refieren a
A través del comportamiento de aprendizaje del alumno en la plataforma y el modelo de 19 indicadores de comportamiento en la Sección III, luego se ocupa de los valores perdidos y los
predicción del rendimiento del alumno, se puede predecir el rendimiento del alumno. valores atípicos. La forma en que los estudiantes registran el curso está siendo invitado por el
maestro directamente, el tiempo para que los estudiantes se registren en el curso es casi uniforme,
así que elimine el indicador P_BR. Los datos del foro del curso fueron muy pequeños, más del 95%
El propósito de la intervención es instar a los alumnos a cambiar en la dirección correcta.
de los estudiantes no dejaron ninguna huella en el foro, el contenido que publica o responde en el
Después de la predicción, se realizan las intervenciones correspondientes hasta que los alumnos
foro no tiene nada que ver con el contenido de aprendizaje, por lo que se eliminan todos los
se desempeñen de manera óptima. Este estudio propone una medida de intervención basada en
indicadores sobre la interacción del foro. Más del 97% de los estudiantes no vieron la introducción
resultados predictivos interpretativos, como se muestra en la Figura 2, con el objetivo de
del curso, por lo que se eliminó el indicador P_BI.
proporcionar una referencia para la predicción e intervención automatizadas.
Intervención La plataforma de enseñanza Hstar no requiere una respuesta en línea, y el método de

Pareo evaluación del curso es relativamente simple, siempre que los estudiantes envíen las
Cálculos pruebas, habrá resultados, así que elimine los indicadores relevantes de la prueba T_CP,
T_CS, T_PD, T_PI. Al final del curso, menos del 0.2% de los estudiantes vuelven a ver el
recurso de material didáctico, así que elimine R_PT2. Este curso solo proporciona recursos
de material didáctico, así que elimine R_LN. Los indicadores restantes pasan al siguiente
Predicción Intervención paso, para más análisis.
Intervención
Resultado Estrategia
Motor
Reconocimiento Implementación
3.2 Análisis de correlación de resultados experimentales
Figura 2. Medida de intervención

Los ocho indicadores de comportamiento restantes se correlacionaron con el rendimiento de los
Como se muestra en la Fig. 2. Este modelo se centra en el motor de intervención, incluida la estudiantes utilizando el software SPSS, los resultados se muestran en la Tabla 2. Número de
identificación de los resultados de la predicción, los cálculos de correspondencia de la intervención y tiempo de la página de progreso del curso revisada (P_AL), grado de observación repetida de
la implementación de las intervenciones. recursos (R_PD), finalización de la observación de recursos (R_LC) no existe una correlación
significativa con el grado, la densidad de vigilancia de recursos (R_LD) se correlaciona
1. El núcleo de este modelo es el motor de intervención, que juega un papel regulador. Su
negativamente con el grado, lo que puede estar relacionado con el fenómeno de que la mayoría de
función es controlar los otros tres enlaces, identificar
151
los alumnos comenzaron a ver el material del curso solo unos días antes de la presentación, por lo
3.3 Resultado de la predicción
que la densidad de la vigilancia de recursos es grande, pero la calificación es baja en comparación
Este estudio considera desde la alta interpretación de los resultados de la predicción. Después
con los estudiantes que siguen el progreso para ver el material del curso. Pero la importancia no es
de consultar la literatura, selecciona el algoritmo de programación genética con un grado de
obvia, por lo que el indicador no tiene nada que ver con los resultados. Los cuatro indicadores
interpretación relativamente alto y relativamente competitivo en términos de precisión de
restantes: número de inicio de sesión del curso (P_AL), tiempo de observación de recursos (R_LT),
predicción. Para comprender a los alumnos con más detalle, los alumnos se dividen en cuatro
tiempo de observación repetida de recursos (R_PT1), diferencia de tiempo entre publicación y
categorías según sus calificaciones: perfecto (90-100), excelente (80-89), bueno (70-79) y
lanzamiento (T_PT) están relacionados con los resultados, como valores propios, ingrese el
suficiente (60-69). En el conjunto de datos, la calificación fue reemplazada por el tipo de
siguiendo el proceso de construcción del algoritmo.
calificación, se utilizaron cuatro indicadores de comportamiento seleccionados y calificaciones
marcadas para formar un nuevo conjunto de datos.
Tabla 2. Los resultados del análisis de correlación con el grado
Grado
Los algoritmos de programación genética basados en reglas pertenecen al
Comportamiento Correlación de Pearson Sig (dos colas) norte
algoritmo mejorado, que se puede ejecutar de dos formas. Una forma es
CAMARADA 0.556 ** 0.000 105 comprimir el paquete descargando el algoritmo e instalarlo en weka como
complemento. El otro es el marco de Java que utiliza cálculos evolutivos como
P_CP 0,031 0,226 105 JCLEC. Los detalles del algoritmo
pueden ser adquirido mediante Enlaces:
R_LT 0,288 ** 0,001 105 http://www.uco.es/grupos/kdis/kdiswiki/ICRM/
3.3.1 Evaluación del modelo y predicción de resultados

R_LC 0.093 0,113 105
Para verificar que el algoritmo de programación genética en la literatura tiene una
precisión relativamente competitiva en modelos de predicción interpretables, elegimos
R_LD 0,064 0.108 105
dos modelos de algoritmos interpretables clásicos: Random Tree y Decision Tree (J48)
R_PT1 0,287 0,002 105 para comparar los indicadores de evaluación de sus modelos de predicción. Los
resultados de la comparación se muestran en la Tabla 3. En comparación, encontramos
R_PD 0.073 0,147 105 que el algoritmo genético no es el valor más bajo en términos de precisión, tasa de
recuperación, etc. En otras palabras, la brecha entre estos tres algoritmos no es muy
T_PT 0.383 0.000 105 grande. En general, el árbol de decisiones tiene la mayor precisión en estos tres
algoritmos.
CAMARADA 0.556 ** 0.000 105
Cuadro 3. Comparación de indicadores de evaluación
Indicador de evaluación
Algoritmo precisión recordar Puntuación F Puntuación ROC
GP-ICRM 0,89 0,867 0,875 0,899
RandomTree 0,848 0,857 0,857 0,923
J48 0.908 0,914 0,91 0,892
d (suficiente) 0 0 1 6
La Tabla 4 muestra los resultados de la predicción de los algoritmos de programación suficiente, los indicadores de evaluación son relativamente altos. Este modelo es muy adecuado
genética. En general, la precisión del modelo es 89%, la recuperación es 86,7%, el valor F para la enseñanza práctica, porque para los alumnos con buen efecto de aprendizaje, los profesores
es 87,5% y el valor ROC es 89,9%. La tasa de predicción experimental ha obtenido buenos generalmente no interfieren demasiado para él. Para los alumnos cuyo efecto de aprendizaje no es
resultados. muy bueno, los buenos resultados de predicción pueden ayudar a los profesores a realizar las
intervenciones de forma más adecuada. La Tabla 5 es el registro de predicción específico después
La Tabla 4 muestra que cuando el efecto de aprendizaje de la predicción es perfecto, la precisión
de usar el modelo de algoritmo de programación genética.
es relativamente baja, solo el 46,7%. Muestra que al predecir buenos resultados de aprendizaje,
el efecto de predicción no es bueno. Sin embargo, cuando el efecto de aprendizaje de predicción
es excelente, bueno,
Tabla 4. Resultados de la predicción
Materias primas Precisión Recordar Puntuación F Puntuación ROC
Perfecto 0,467 0,7 0,56 0,808
Excelente 0,952 0,87 0.909 0.909
Bueno 0,9 0,947 0,923 0,962
Suficiente 0,857 0,857 0,857 0,923
Promedio 0,89 0,867 0,875 0,899

peso
152
Tabla 5 Registro de predicción real
Resultados de la predicción
Situación actual un segundo C re
un perfecto) 7 3 0 0
b (excelente) 8 60 1 0
c (bueno) 0 0 18 1
d (suficiente) 0 0 1 6
3.3.2 Comparación de interpretabilidad

En general, el conjunto de reglas "si-entonces" es el más explicativo en formas
representativas interpretables. Sin embargo, el simple uso de las reglas generadas
por el modelo no garantiza su interpretabilidad. Si se producen muchas reglas, o si
cada regla tiene muchas condiciones, su interpretabilidad disminuirá. De hecho, es
necesario utilizar un cierto número de reglas y condiciones en cada regla para medir
la interpretabilidad de un modelo basado en reglas. Consultando la literatura, los
criterios de interpretabilidad del modelo se pueden resumir de la siguiente manera:
(1) Si el modelo es un modelo de "caja blanca"; (2) Si el modelo se puede
representar mediante reglas "si-entonces"; (3) si el número de reglas generadas es
menor; (4) si el número de condiciones generadas por cada regla es menor [19].
La figura 3 es una estructura explicativa generada utilizando el modelo de árbol aleatorio.

Muestra las condiciones en una estructura jerárquica. Si quieres ver el desempeño del Figura 4. Reglas generadas por el árbol de decisiones
estudiante, debes leer desde el nodo raíz hasta el nodo hoja, lo cual es muy difícil de
encontrar el motivo. El tamaño del árbol resultante es 29, lo que indica que genera 29 reglas
para predecir el desempeño de los estudiantes. La figura 4 muestra el árbol de reglas
generado por el modelo de árbol de decisión con un tamaño de 7, lo que indica que se
generan 7 reglas y que el número de condiciones para cada regla no es mucho. En
Figura 5. Reglas generadas por GP_ICRM
comparación con las 27 reglas generadas por el árbol aleatorio, los árboles de decisión
tienen menos reglas y son más interpretativos. Las reglas si-entonces generadas por algoritmos de programación genética
basados en reglas se muestran en la Fig. 5. En comparación con la estructura
jerárquica de árboles aleatorios y árboles de decisión, las reglas generadas por el
algoritmo presentan resultados predictivos de una manera más intuitiva y legible.
Las reglas específicas se explican a continuación. Si la diferencia de tiempo de
envío y liberación de la prueba (t_pt) es mayor o igual a 4.5, el resultado de la
predicción se clasifica como suficiente. Si t_pt es menor que 4.5 y el número de
inicios de sesión del curso (p_al) es menor o igual a 16.6, entonces el resultado de
la predicción se clasifica como bueno; Si t_pt es mayor o igual a 1.5 y menor que
4.5 y p_al es mayor que 16.6 y el número de reproducción repetida de video /
curso (r_pt1) es menor o igual a 3.2, el resultado de la predicción se clasifica como
excelente,
4. CONCLUSIÓN
La construcción de un modelo interpretable de predicción del rendimiento del estudiante es un
problema que el modelo de análisis de aprendizaje debe resolver. Ayuda a promover la
enseñanza personalizada. Este estudio propone un modelo de predicción del efecto del
aprendizaje basado en el análisis del comportamiento del aprendizaje en línea y realiza un
estudio experimental. Para realizar mejor el entrenamiento del modelo de predicción, llevamos a
cabo análisis de correlación en los indicadores de comportamiento recopilados para reducir la
dimensión de datos. Se utiliza un algoritmo de programación genética basado en reglas para
experimentos de predicción. Al compararlo con otros algoritmos típicos de predicción de caja
blanca, el algoritmo de programación genética basado en reglas logra un alto grado de
interpretación de los resultados de la predicción con menos reglas y números de condición bajo
la garantía de una predicción de precisión competitiva.
Figura 3. Reglas generadas por árbol aleatorio
153
El desempeño de los estudiantes se ve afectado por muchos factores. El comportamiento de analítica y su relación con el rendimiento en F2F compatible con VLE y aprendizaje en
aprendizaje es solo una parte del proceso de aprendizaje. Los factores subjetivos en el línea [J]. Computadoras en el comportamiento humano, 31 (2): 542-550.
proceso de aprendizaje no se reflejan en el estudio, y cómo integrar los factores subjetivos de
los estudiantes en el desempeño de los estudiantes es un tema muy desafiante que nos obliga
[9] Siemens G. 2013. Análisis del aprendizaje La aparición de un
a explorar constantemente. En el próximo estudio, se considerará la tecnología de
Disciplina [J]. Científico del comportamiento estadounidense, 57 (10): 1380-
reconocimiento de expresiones faciales para su aplicación en la investigación de predicciones,
1400.
y el reconocimiento de expresiones faciales se puede cuantificar como una exhibición externa
de factores subjetivos. [10] Ifenthaler D, Widanapathirana C. 2014. Desarrollo y
Validación de un marco de análisis de aprendizaje: dos estudios de caso que
utilizan máquinas de vectores de soporte [J]. Tecnología, conocimiento y
5. RECONOCIMIENTO aprendizaje, 19 (1): 221-240.
Esta investigación fue financiada parcialmente por el apoyo de la Fundación de Ciencias [11] Rupp AA, Leighton J p. 16 (2014). Minería de datos educativos
Naturales de la Universidad Normal de China Central (NO. CCNU18TS004), el y análisis de aprendizaje [M]. Springer Nueva York, págs. 379-396.
Programa Nacional de Investigación y Desarrollo Clave de China (NO.
[12] Macfadyen LP, Dawson S. 2010. Extracción de datos de LMS para
2018YFB1004505).
desarrollar un "sistema de alerta temprana" para educadores: una prueba de concepto
6. REFERENCIAS [J]. Informática y educación, 54 (2): 588-599.
[1] De-Marcos L, García-López E, García-Cabot A. 2016. Análisis de redes sociales de un [13] Hu YH, Lo CL, Shih S P. 2014. Desarrollo de alerta temprana
curso de e-learning gamificado: Fenómeno Smallworld y métricas de redes como sistemas para predecir el rendimiento del aprendizaje en línea de los estudiantes [J].
predictores del rendimiento académico [J]. Computadoras en el comportamiento Computadoras en el comportamiento humano, 36: 469-478.
humano, 60: 312-321.
[14] Sinclair PM, Kable A, Levett-Jones T. 2016. El
eficacia del aprendizaje electrónico basado en Internet sobre el comportamiento de
[2] Ruipérez-Valiente JA, Muñoz-Merino PJ, Leony D. 2015. ALAS-KA: Una extensión los médicos y los resultados de los pacientes: una revisión sistemática [J].
de análisis de aprendizaje para comprender mejor el proceso de aprendizaje en la Revista Internacional de Estudios de Enfermería, 57: 70-81.
plataforma Khan Academy [J]. Computadoras en el comportamiento humano, 47:
[15] Romero C, López MI, Luna JM, 2013. Predicción de estudiantes '
139-148.
desempeño final de la participación en foros de discusión en línea [J]. Informática
[3] Greller WD, Hendrik. 2012. Traducir el aprendizaje en números: un marco y educación, 68: 458-472.
genérico para el análisis del aprendizaje [J].
[16] Villagrá-Arnedo CJ, Gallego-Durán FJ, Llorens-Largo F.
Sociedad y tecnología educativa, 15 (3): 42-57.
2016. Mejora de la expresividad de los modelos de caja negra para predecir el desempeño
[4] Baepler P, Murdoch C J.2008. Analítica académica y minería de datos en la de los estudiantes [J]. Computadoras en el comportamiento humano, 72.
educación superior [J]. Revista internacional para la beca de enseñanza y
aprendizaje, 4 (2): 267-281.
[17] Márquez-Vera C, Cano A, Romero C. 2013. Predicción
[5] Hrastinski S. 2009. Una teoría del aprendizaje en línea como participación en fracaso de los estudiantes en la escuela usando programación genética y diferentes
línea [J]. Informática y educación, 52 (1): 78-82. enfoques de minería de datos con datos de alta dimensión y desequilibrio [J]. Inteligencia
[6] Pedro MOZS, Baker RSJD, Bowers AJ. 2013. Predecir la matrícula universitaria a aplicada, 38 (3): 315-330.
partir de la interacción de los estudiantes con un sistema de tutoría inteligente en la [18] Cano A, Zafra A, Ventura S. 2013. An Interpretable
escuela secundaria [J]. Langmuir, el diario Acs de superficies y coloides, 27 (11): Algoritmo de minería de reglas de clasificación [J]. Ciencias de la Información, 240
6897-6904. (11): 1-20.
[7] Burgos C, Campanario ML, Peña DD L. 2017. Minería de datos para modelar el [19] Xing W, Guo R, Petakovic E. 2015. Basado en la participación
desempeño de los estudiantes: un plan de acción de tutoría para prevenir la deserción modelo de predicción del rendimiento final del estudiante a través de Programación
académica [J]. Computación e Ingeniería Eléctrica. Genética interpretable: Integración de análisis de aprendizaje, minería de datos educativos
y teoría [J]. Computadoras en el comportamiento humano, 47 (C): 168-181.
[8] Iglesias-Pradas S. 2014. ¿Podemos predecir el éxito a partir de los datos de registro
en los VLE? Clasificación de interacciones para el aprendizaje
154

Predicción Del Rendimiento de Estudiante en Entornos Virtuales

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Predicción Del Rendimiento de Estudiante en Entornos Virtuales

Cargado por

Copyright:

Formatos disponibles

Predicción del rendimiento de un alumno en línea interpretable

Modelo basado en análisis de aprendizaje

El modelo de análisis de aprendizaje es la base teórica para el análisis del

1. INTRODUCCIÓN comunes: ciclo de datos. Desde la perspectiva de la analítica de enfoques de sistemas,

académico: factores académicos, factores demográficos y factores culturales y sociales.

Tabla 1. Indicadores de comportamiento de aprendizaje en línea

Aprendizaje Dimensión Contenido Indicador Código

Número de curso P_BI

Preparación Antes de clase Antes de clase vistas de introducción

Número de registro del curso P_BR

Asistencia Número de inicio de sesión del curso CAMARADA

Progreso Autoexplicativo Número de página de progreso del curso comprobada P_CP

Tiempo de vigilancia de recursos R_LT

Procesando Recurso principal Número de reproducción repetida de recursos R_PT1

Recurso información persistencia

aprendizaje Grado de recurso repetido reloj R_PD

Número de recurso repetido ver después R_PT2

Recolección / procesamiento Otro recurso Número de otro recurso de acceso R_LN

Número de exploración del foro MENTIRA

Foro Publicación Interactivo Número de publicaciones en el foro F_IP

Terminación Número de publicación T_CP

Prueba Usando información Diferencia horaria entre publicación y lanzamiento T_PT

Terminación Densidad del puesto T_PD

Desde la perspectiva de alta interpretación de los resultados de la predicción, los métodos de

maximizar la interpretabilidad de la clasificación minimizando el número y las condiciones de las

Intervención La plataforma de enseñanza Hstar no requiere una respuesta en línea, y el método de

Figura 2. Medida de intervención

R_LT 0,288 ** 0,001 105 http://www.uco.es/grupos/kdis/kdiswiki/ICRM/

3.3.1 Evaluación del modelo y predicción de resultados

Cuadro 3. Comparación de indicadores de evaluación

Algoritmo precisión recordar Puntuación F Puntuación ROC

GP-ICRM 0,89 0,867 0,875 0,899

RandomTree 0,848 0,857 0,857 0,923

J48 0.908 0,914 0,91 0,892

Materias primas Precisión Recordar Puntuación F Puntuación ROC

Perfecto 0,467 0,7 0,56 0,808

Excelente 0,952 0,87 0.909 0.909

Bueno 0,9 0,947 0,923 0,962

Suficiente 0,857 0,857 0,857 0,923

Promedio 0,89 0,867 0,875 0,899

Situación actual un segundo C re

3.3.2 Comparación de interpretabilidad

La figura 3 es una estructura explicativa generada utilizando el modelo de árbol aleatorio.

Figura 3. Reglas generadas por árbol aleatorio

6. REFERENCIAS [J]. Informática y educación, 54 (2): 588-599.

También podría gustarte