Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El problema que los autores propusieron resolver es segmentar de manera temprana a los alumnos según su
rendimiento académico en cualquier institución de educación superior, limitándose en este estudio en la
facultad de ingeniería de la Universidad de Porto (Portugal), para poder tomar las mejores decisiones para
una correcta distribución de recursos con el objetivo de ayudar a aquellos alumnos de bajo rendimiento y
seguir motivando (o recompensando) a aquellos de alto rendimiento académico.
Por otro lado, Marbouti et al (2016) en sus estudios tuvieron como objetivo el predecir si un estudiante
aprobaría o desaprobaría un determinado curso de ingeniería. Para lograr tal objetivo, primero extrajeron
datos una universidad de los Estados Unidos y se valieron del uso de las técnicas de regresión logística,
redes neuronales, SVM, árboles de decisión, naïve Bayes, la técnica del vecino más cercano y una última
técnica híbrida para poder realizar las predicciones. Al concluir con el estudio, se determinó que la técnica
híbrida diseñada por los autores llegó a tener los mejores resultados, con una precisión del 85%.
Además, Gray et al (2014) se planteó en identificar a aquellos alumnos con riesgo de desaprobar el primer
año de estudios en el instituto de tecnología Blanchardstown, Irlanda. Por ello utilizaron un dataset que
consistía de 1193 registros de estudiantes de primer año. Para realizar la identificación de los alumnos con
riesgo a desaprobar, los autores utilizaron las técnicas de regresión logística, redes neuronales, SVM,
árboles de decisión, naïve Bayes y la técnica del vecino más cercano. Los autores al finalizar concluyeron
que la técnica del vecino más cercano fue la mejor de todas, superando el 90% de precisión para algunos
casos, mientras que los algoritmos de Naïve Bayes y regresión logística fueron los que brindaron los peores
resultados.
Finalmente, Hoffait y Schyns (2017) se propusieron en encontrar si un estudiante podría o no, terminar su
primer año de estudios en la Universidad de Lieja, Francia. Para ello extrajeron los datos de 6845
estudiantes y una vez transformados los datos, evaluaron los algoritmos de regresión logística, redes
neuronales y random forests. Al terminar con el estudio, determinaron que todas las técnicas utilizadas
brindaron resultados pobres, sin embargo, lograron elevar la precisión de estas técnicas cambiando ciertos
atributos, destacando el Random Forest por brindar mejores resultados.
Por ello, primero tuvieron que extraer los datos de los estudiantes de la universidad de Porto, obteniendo
un total de 2459 registros que datan del año 2003 al 2015 y según los posibles valores del indicador AP1,
se crearon 5 categorías de estudiantes según su desempeño (A, B, C, D, E), las cuales serían los valores
dependientes para predecir.
Luego, los autores decidieron utilizar 6 algoritmos de clasificación, los cuales fueron Random Forest,
árboles de decisión, máquinas de vectores de soporte (SVM), Naïve Bayes, Bagged trees y Adaptative
Boosting Trees.
Entonces, una vez escogidos los algoritmos, se decidió empezar con la validación de cada uno de estos
utilizando una validación cruzada de 10 etapas, es decir, los datos se dividen en 10 grupos de cantidades
iguales y 9 de las 10 partes son utilizadas para entrenar al algoritmo, mientras la parte sobrante es usada
para realizar pruebas de validación. Una vez esta validación acaba, se procede nuevamente a repetir lo
mismo, pero con otro bloque hasta que todos los 10 bloques hayan servido como validación.
Una vez terminado este bucle, los autores procedieron calculando la precisión y la sensibilidad de cada
algoritmo según segmento para encontrar al que tenga un mayor rendimiento mediante el uso de la matriz
1
Nivel de desempeño
de confusión, tal como se muestra en la tabla I. Entonces, se tomaron los resultados del algoritmo con mayor
precisión, el cual terminó siendo el Random Forest.
A continuación, los autores proceden identificando las variables más influyentes en el desempeño de los
alumnos, valiéndose del uso de Random Forest y aplicando una técnica propuesta por Menze et al (2009).
Finalmente, los autores empezaron a segmentar a los alumnos según su AP actual y su AP predicho por el
Random Forest y una vez terminado con este paso, empezaron a plantear posibles alternativas a partir de
dicha segmentación.
Finalmente, como el gran aporte de este estudio destaca el algoritmo de Random forest es el que ha brindado
los mejores resultados para la segmentación de los estudiantes de la facultad de ingeniería de la universidad
de Porto, con una precisión aproximada al 96.1%, mientras que el algoritmo de Naïve Bayes demostró tener
los peores resultados de todos los algoritmos utilizados.
Los autores esperan que, mediante estos resultados, la universidad de Porto pueda tomar mejores decisiones
con el objetivo de maximizar el aprovechamiento de sus recursos y a su vez, actuar de manera proactiva
con el objetivo de mejorar la educación brindada.
Marbouti, F., Diefes-Dux, H. A., and Madhavan, K. (2016). Models for early prediction of at-risk
students in a course using standards-based grading. Computers & Education, 103:1-15.
Gray, G., McGuinness, C., and Owende, P. (2014). An application of classi_cation models to
predict learner progression in tertiary education. In Advance Computing Conference (IACC),
2014 IEEE International, pages 549{554.
Hoffait, A.-S. and Schyns, M. (2017). Early detection of university students with potential
difficulties. Decision Support Systems.
Página de la publicación con impacto (index)
2. ¿Cómo identificamos a los factores tanto académicos como no académicos que podrían
afectar el rendimiento de los estudiantes?