Está en la página 1de 4

Modelo predictivo para el Análisis del Rendimiento Académico en

Estudiantes Colombianos mediante Machine Learning utilizando Datos de


las pruebas Saber 11 2020-2

Omar Lambraño
Jamer Díaz

Agosto 2023

Introducción

En el contexto de la educación en Colombia, el rendimiento académico de los


estudiantes en las pruebas Saber 11, es un indicador crucial para evaluar la calidad
del sistema educativo y la efectividad de las políticas implementadas. Sin embargo,
predecir el rendimiento futuro de los estudiantes es un desafío complejo debido a la
multitud de factores que pueden influir en su desempeño. Estos factores pueden ser
de naturaleza socioeconómica, demográfica, educativa o incluso psicológica, lo que
hace que el proceso de predicción sea altamente complejo para los métodos de
análisis tradicionales.

El rendimiento académico es un indicador crítico que influye en la toma de


decisiones educativas y políticas para mejorar la calidad de la educación en el país.
La capacidad de prever con precisión el rendimiento académico de los estudiantes
permitirá a las instituciones educativas y los responsables de la formulación de
políticas, implementar intervenciones tempranas y estrategias de apoyo específicas
para aquellos estudiantes que se identifiquen como en riesgo de bajo rendimiento o
deserción escolar. Además, este enfoque de predicción personalizada podría
ayudar a impulsar una educación más inclusiva y adaptada a las necesidades
individuales de cada estudiante.

En los últimos años, el sistema educativo colombiano ha experimentado avances


significativos en la recolección y análisis de datos educativos, especialmente a
través de las pruebas Saber, las cuales evalúan el rendimiento académico de los
estudiantes en diferentes niveles educativos, ya que existen las de 9° grado, las de
11° y las saber Pro. Estas pruebas han proporcionado una valiosa fuente de
información para comprender la calidad educativa y las brechas de desempeño
entre diferentes regiones y grupos socioeconómicos en el país.

Varios estudios previos han abordado la predicción del rendimiento académico


utilizando datos de pruebas estandarizadas y técnicas de aprendizaje automático.
En el contexto colombiano, algunos proyectos de investigación han utilizado análisis
estadísticos tradicionales para identificar factores asociados al rendimiento
académico, como el impacto del nivel socioeconómico, el acceso a recursos
educativos y la calidad del ambiente familiar. Angulo (2021), menciona como
determinantes del rendimiento académico las caracteristicas socioeconómicas,
características familiares, la calidad docente, la alimentación, uso del tiempo libre,
acceso a libros, etc.
Estando en concordancia con los datos que tenemos a nuestra disposición.

Sin embargo, la complejidad de los datos de las pruebas Saber 11 y la diversidad


de factores influyentes requieren el uso de metodologías avanzadas como Machine
Learning. Se deberán abordar desafíos tales como la identificación y selección
adecuada de características relevantes, la mitigación de sesgos inherentes a los
datos y la optimización de los modelos para alcanzar la máxima precisión en la
predicción del rendimiento académico.

La presente propuesta se propone abordar esta problemática mediante el uso de


técnicas de Machine Learning aplicadas a los datos obtenidos de las pruebas Saber
11 del periodo 2020-2, en Colombia. El objetivo es desarrollar un modelo predictivo
preciso y confiable que pueda anticipar el rendimiento académico de los estudiantes
en futuras pruebas Saber 11, basándose en información como hábitos de lectura,
uso del tiempo libre, características familiares, sociales y económicas, así como
correlaciones entre los resultados de las diferentes dimensiones evaluadas en las
pruebas.

Recientemente, proyectos similares en otros países han demostrado el potencial de


los enfoques de machine learning para predecir el rendimiento académico de los
estudiantes con mayor precisión y rapidez. Estos estudios han utilizado atributos
demográficos y socioeconómicos, así como datos educativos previos de los
estudiantes, para entrenar modelos de aprendizaje automático que pueden anticipar
el rendimiento futuro con mayor eficacia, ejemplo de ello tenemos a Victor Gil-Vera
(2021), quienes utilizaron “redes neuronales artificiales” para predecir el rendimiento
académico, utilizando datos de 395 estudiantes colombianos, y concluyeron que la
predicción temprana permite formular estrategias didacticas y pedagógicas más
eficientes en la enseñanza.

Por otra parte, se sabe que mejores resultados en las pruebas saber 11, permiten
que el estudiante tenga acceso a mejores universidades, incluso a becas por
desempeño, lo que retornará en mejora de la calidad de vida, mejoras en
productividad y mejores ingresos, esto a su vez permite que haya movilidad social.
Sobre esto tenemos a Mauricio Gil (2020), quien indica que un título universitario
tendrá una rentabilidad media de 11 % para hombres, y de 9 % para mujeres.

En síntesis, este proyecto pretende desarrollar un modelo de predicción del


rendimiento académico en estudiantes colombianos utilizando Machine Learning,
con el objetivo de contribuir a la toma de decisiones educativas más informadas y a
la mejora del sistema educativo del país. La investigación abordará la pregunta de
cómo utilizar eficazmente los datos de las pruebas Saber 11 2020-2, para anticipar
el rendimiento de los estudiantes en futuras pruebas y proporcionar herramientas
que fomenten la igualdad de oportunidades y la excelencia académica.
Bibliografía
Angulo, G. (2021). Repositorio Eafit. Obtenido de chrome-
extension://efaidnbmnnnibpcajpcglclefindmkaj/https://repository.eafit.edu.co/
bitstream/handle/10784/29949/Germ%C3%A1nDavid_AnguloCambindo_20
21.pdf?sequence=2&isAllowed=y

Mauricio Gil, J. C. (2020). ¿Es rentable la formación universitaria en Colombia?: una


estimación. Scielo.

Victor Gil-Vera, C. Q. (2021). Predicción del rendimiento académico estudiantil con


redes neuronales artificiales. Scielo. Obtenido de
https://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-
07642021000600221

También podría gustarte