Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen - La analítica en educación se ha recibido mucho el nivel institucional o político [2]. En la analítica académica, la garantía de la calidad de
atención durante la última década. Es necesario mantener una alta tasa de retención en la educación o la responsabilidad de la universidad se centran más en la perspectiva del
cualquier institución de educación superior, por lo que se han realizado varios intentos de aprendizaje o la enseñanza, por lo que los resultados del aprendizaje o la retención de
aplicación de analíticas para este problema. Para detectar temprano a los estudiantes con alto los estudiantes son objetivos de la analítica. La analítica académica tiene una estrecha
riesgo de deserción escolar e intervenirlos de manera efectiva, puede ser útil utilizar el big data relación con el punto de vista de la gestión de la matrícula en la investigación
educativo. En este artículo, se considera un método de detección automática de estudiantes en
institucional (RI). Para las instituciones educativas, especialmente los colegios o
riesgo académico mediante el uso de datos de registro de los sistemas de gestión del
universidades, es necesario que se mantenga una alta tasa de retención, por lo que la
aprendizaje. Se utilizan algunos métodos de aprendizaje automático bien conocidos para
gestión de la matrícula es importante.
construir un modelo predictivo del desempeño de los estudiantes evaluado por GPA. Mediante
el uso de un conjunto de datos real, investigamos la disponibilidad del método propuesto y
discutimos su capacidad para la detección temprana del comportamiento fuera de la tarea. Los En estudios recientes, por ejemplo, en este contexto se ha considerado la
resultados experimentales indicaron que algunas características del comportamiento sobre el detección temprana de estudiantes en riesgo con análisis de aprendizaje [3]. Para
aprendizaje que afectan los resultados del aprendizaje pueden detectarse solo con los datos de detectar temprano a los estudiantes que tienen un alto riesgo de deserción e
registro en línea. Además, la importancia comparativa de las variables explicativas obtenidas intervenirlos de manera efectiva, puede ser útil utilizar el big data educativo. Varios
por el enfoque ayudaría a estimar qué variable afecta comparativamente al resultado del
estudios también investigaron la correlación entre el resultado del aprendizaje y el uso
aprendizaje y se puede utilizar en la investigación institucional.
del sistema de gestión del aprendizaje (LMS) [4], y los datos de registro de LMS se han
vuelto útiles para analizar el comportamiento de aprendizaje de los estudiantes.
Palabras clave: análisis del aprendizaje; gestión de inscripciones; investigación institucional; En este estudio, se propone un enfoque para la detección de estudiantes en riesgo
detección de estudiantes en riesgo; aprendizaje automático; Datos de registro de LMS académico mediante el uso de métodos de aprendizaje automático basados en datos de
registro del sistema de gestión del aprendizaje. Luego se mostrarán los resultados de algunos
experimentos numéricos con datos reales implementados para investigar el desempeño del
Yo NTRODUCCIÓN enfoque.
10.1109 / IIAI-AAI.2017.51
aprendizaje en la universidad, porque los estudiantes necesitan usarlo para pasar su vida TABLA I. V ARIABLES U SED IN T SU S TUDY
problema de predecir un GPA del primer semestre. (7) # de finalización del envío (8) Duración del
Aunque los rendimientos de detección en el caso de no usar “(2) Tasa de asistencia” fueron
La regresión logística es una especie de modelo lineal generalizado y se utiliza a más bajos que en el caso de usarlo, el modelo de bosque aleatorio funcionó relativamente bien con
menudo como clasificador de dos clases. Debido a su facilidad de manejo y aplicabilidad, se solo los datos de registro de LMS. Como se muestra en la figura 6, la recuperación en la semana 0
ha utilizado en varios campos. La máquina de vectores de soporte (SVM) es una máquina de fue de aproximadamente 0,3 y la recuperación en la semana 3 fue de aproximadamente 0,4. Por lo
kernel ampliamente utilizada para la clasificación de patrones y problemas de regresión. tanto, el modelo de bosque aleatorio puede detectar aproximadamente el 30% de los estudiantes en
Como se dice que SVM tiene una alta capacidad de generalización, se ha utilizado riesgo hasta la primera semana y puede detectar aproximadamente el 40% de los estudiantes en
ampliamente al igual que la regresión logística. El bosque aleatorio es uno riesgo hasta la cuarta semana.
111999999
1 1
0,9 0,9
0,8 0,8
0,7 0,7
0,6 0,6
0,5 0,5
0.4 0.4
0,3 0,3
0,2 0,2
0,1 0,1
0 0
0 1 2 3 45 6 7 8 9 10 11 12 13 14 15 0 1 2 3 4 5 6 78 9 10 11 12 13 14 15
semanas semanas
Fig. 1. Métricas de clasificación para regresión logística con datos de asistencia. Fig. 4. Métricas de clasificación para regresión logística sin datos de asistencia.
1 1
0,9 0,9
0,8 0,8
0,7 0,7
0,6 0,6
0,5 0,5
0.4 0.4
0,3 0,3
0,2 0,2
0,1 0,1
0 0
0 1 2 3 45 6 7 8 9 10 11 12 13 14 15 0 1 23 4 5 6 78 9 10 11 12 13 14 15
semanas semanas
Fig. 2. Métricas de clasificación para SVM con datos de asistencia. Fig. 5. Métricas de clasificación para SVM sin datos de asistencia.
1 1
0,9 0,9
0,8 0,8
0,7 0,7
0,6 0,6
0,5 0,5
0.4 0.4
0,3 0,3
0,2 0,2
0,1 0,1
0 0
0 1 23 4 5 6 7 8 9 10 11 12 13 14 15 0 1 23 4 5 6 78 9 10 11 12 13 14 15
semanas semanas
Fig. 3. Métricas de clasificación para bosque aleatorio con datos de asistencia. Fig. 6. Métricas de clasificación para bosque aleatorio sin datos de asistencia.
222000000
100% Los valores de las métricas de clasificación también eran cada vez más altos. En la
90% semana 10, los valores de la métrica de clasificación aumentaron
80%
considerablemente, y la importancia del tiempo de registro también aumentó y la
70% duración del registro se redujo. Este fenómeno indica que las actividades
60%
importantes se pueden inferir observando atentamente el cambio semanal de la
50%
importancia comparativa de las variables, y nos ayuda a evaluar el currículo y la
40%
estrategia de apoyo al estudiante desde la perspectiva de la investigación
30%
institucional.
20%
10%
0%
0 12345678 9 10 11 12 13 14 15 IV. C ONCLUSIÓN
semanas En este estudio, se consideró el método de detección automática para estudiantes
en riesgo. Examinamos las técnicas típicas de aprendizaje automático para estos
noche acceso sumisión comienzo hora jugador asistencia
estudiantes en función de los datos de registro reales de LMS e investigamos su
rendimiento.
Fig. 7. Cambio semanal de la importancia comparativa de las variables explicativas con los datos
de asistencia. El modelo de bosque aleatorio mostró el comportamiento más estable y una buena
cenefa de precisión y recuerdo. El modelo puede detectar alrededor del 40% de los
estudiantes en riesgo al final de la tercera semana del primer semestre con solo los datos de
100%
registro de LMS. Como el enfoque puede detectar un signo de comportamiento fuera de la
90%
tarea de los estudiantes con solo los datos de registro que se almacenarán automáticamente
80%
en el LMS, se muestra un cierto nivel de aplicabilidad del enfoque. Se indica que algunas
70%
características del comportamiento sobre el aprendizaje que afectan los resultados del
60%
aprendizaje pueden detectarse solo con los datos de registro en línea.
50%
40%
30%
20%
Además, la clasificación de la importancia comparativa de las variables
10%
explicativas obtenidas por el enfoque ayudaría a estimar qué variable afecta
0%
comparativamente al resultado del aprendizaje en un momento dado. Al
012 34 5 6 7 8 9 10 11 12 13 14 15
observar la importancia de la variable constantemente, se espera que una
semanas
estrategia de intervención sea más adaptativa y se pueda considerar la
noche acceso sumisión comienzo hora jugador
planificación de las clases, el plan de estudios y el apoyo al estudiante en base
a la información.
Fig. 8. Cambio semanal de la importancia comparativa de las variables explicativas sin los datos
de asistencia.
A AGRADECIMIENTO
2017].
La importancia comparativa de las variables para cada semana se muestra
en las Figuras 7 y 8. Estas cifras corresponden a la Fig. 3 y la Fig. 6 [2] JP Campbell y DG Oblinger, “Análisis académico”, EDUCAUSE Review, 2007.
222000111