Documentos de Académico
Documentos de Profesional
Documentos de Cultura
M é x ic o
U ru g u a y
A r g e n ti n a
B o li v ia
B r a s il
C uba
C h il e
H o n d u ra s
C o l o m b ia
R .D o m in ic a n a
TE&ET'09 173
de factores (determinación de grupos • datos propios del alumno (por ejemplo:
correlacionados de atributos), análisis de edad al momento de ingreso, colegio
clusters (determinación de grupos de secundario en que estudio, entre otros.),
conceptos que están cercanos según una • datos referentes al rendimiento académico
función de distancia dada), análisis de en la carrera durante el primer año
regresión (búsqueda de los coeficientes de una • datos propios del alumno que se modifican
ecuación de los puntos dados como datos), con el tiempo (estado civil, si tiene hijos, si
análisis multivariable de la varianza, y análisis trabaja, situación económica, entre otros.).
de los discriminantes. Todos estos métodos Se realizó un preprocesamiento con el objetivo
están orientados numéricamente. Son de mejorar la calidad de los datos y se
esencialmente cuantitativos. detectaron algunos problemas relacionados
En contraposición, los métodos de la con datos faltantes, incompletos e
explotación de información permiten obtener inconsistentes que fueron depurados para
resultados de análisis de la masa de optimizar el proceso de explotación de
información que los métodos convencionales información.
no logran tales como: los algoritmos TDIDT, Algunas variables fueron descartadas ya que
los mapas auto organizados (SOM) y las redes no brindaban información sustantiva al
bayesianas. Los algoritmos TDIDT permiten el objetivo planteado y fueron creadas nuevas
desarrollo de descripciones simbólicas de los variables a partir de variables ya existentes.
datos para diferenciar entre distintas clases Se tomo como punto de corte lo acontecido
[Quinlan, 1986; 1990]. Los mapas auto durante el año de ingreso a la carrera y lo que
organizados pueden ser aplicados a la sucede luego de transcurrido el primer año del
construcción de particiones de grandes masas alumno, Se considera tener actividad posterior
de información. Tienen la ventaja de ser al primer año como realizar alguna de estas
tolerantes al ruido y la capacidad de extender actividades: rendir algún final, cursar alguna
la generalización al momento de necesitar materia (más allá de aprobarla o no) u obtener
manipular datos nuevos [Kohonen, 1982; alguna equivalencia. No fueron considerados
1995]. Las redes bayesianas pueden ser los postgrados, solamente las carreras de grado
aplicadas para identificar atributos y pregrado. Para el estudio realizado se
discriminantes en grandes masas de tomaron los datos del año 2003. Las
información, detectar patrones de principales variables utilizadas se muestran en
comportamiento en análisis de series la Tabla 1 (al final del trabajo).
temporales. [Heckerman et al., 1995].
4. Resultados e Interpretación
3. Diseño experimental y Variables
4.1 Resultados
El objetivo del trabajo fue tratar de encontrar
en forma automática las posibles causas de El principal objetivo fue encontrar
abandono entre el primer y segundo año de características de alumnos que permitan
una Facultad con carreras Técnicas (variable explicar algunas de las causales que pueden
independiente). Se trató de obtener patrones generar que un alumno deje de tener actividad
automáticos de comportamiento de la base de académica después del primer año de cursado.
datos del sistema de gestión academico SIU- La variable objetivo planteada fue
Guaraní mediante el uso de procesos de tuvo_actividad_posterior, definiéndose como
explotación de información estandarizados actividad posterior durante el segundo año:
[Britos, 2008] . cursar y/o rendir una materia u obtener una
Se trabajó con los siguientes datos (variables equivalencia.
dependientes):
TE&ET'09 174
Para llegar al objetivo propuesto se aplicó un materia, costean sus estudios con su trabajo y
algoritmo de inducción que permitió obtener tienen titulo de Bachiller.
árboles de decisión y a partir de los mismos
reglas que posibilitan explicar porque los Regla 2:
alumnos no tuvieron actividad durante el • mat_regularizadas_primer_año <=1 (62,38%)
segundo año de cursado. El conocimiento que o costea_estudios = con el aporte de
surgió llamo la atención a los expertos del familiares u otros (31,01%)
dominio, en particular en las siguientes reglas finales_des_y_ausentes_primer_año
obtenidas a partir del nodo raíz: <=3 (35,14%)
• dif_egreso_sec__ingreso = Entre 8
y 15 años (44,44%)
o viaja = Si (100%) then
tuvo_actividad_posterior = F
(28,59%)
TE&ET'09 175
Esta regla brinda conocimiento para el caso de deserción, dando elementos para realizar una
la permanencia de los alumnos en el segundo análisis institucional y tomar decisiones que
año y el peso que tiene tener mas de una permita definir nuevas estrategias dentro de la
materia regularizada en el primer año (el institución, como por ejemplo orientar la
88,94% tuvo actividad en el segundo año de la política de becas, cursos de nivelación para
carrera) y dentro de ese universo el 96,47% egresados de escuelas secundarias no afines a
tuvo menos de una materia cursada la carrera Universitaria, clase de apoyo para
desaprobada en el primer año. disminuir los desaprobados, entre otros. Es
importante destacar que la confiabilidad de los
4.2 Interpretación resultados del proceso de explotación de
información tiene directa relación con la
El conocimiento que surge en la base de datos calidad de los datos de los sistemas de gestión.
del sistema de gestión de alumnos, permite Como consecuencia de estas conclusiones
detectar como un denominador común en los surgen una serie de preguntas con relación a
alumnos que abandonan al segundo año el no los datos que se recogen de cada persona que
regularizar materias en el primer año de se inscribe en una carrera: ¿son los necesarios?
cursada, como contraparte la mayoría de ¿Son pocos? ¿Son bien interpretados? ¿Son
alumnos que regulariza mas de una materia excesivos? ¿Están bien categorizados? ¿Se
continúa sus estudios, esto implica que la necesita incorporar datos nuevos? ¿Se debe
permanencia depende directamente de esta realizar un control de calidad mas exhaustivo
variable. de los datos que están en la base de datos?
Ahora bien, que particularidad tienen los
alumnos que no regularizan materias y que
abandonan al segundo año, el proceso de 6. Bibliografía
explotación de información muestra que las
variables que representan la forma en que Aparicio, M. Garzuzi, V (2006): Dinámicas
costean sus estudios, el tipo de titulo Identitarias, Procesos Vocacionales y su
secundario, los años que pasaron desde el Relación con el Abandono de los Estudios.
egreso del secundario, si el alumno debe viajar Un Análisis en Alumnos Ingresantes a la
más de 10 km desde su residencia hasta la Universidad. Revista De Orientación
facultad, tienen un peso significativo en la Educacional V20. Pp 15-36
población que abandona sus estudios. Bean, J. P. (1980): Student Attrition,
Muchas de estas variables aparecen como Intensions and Confidence. In: Research in
hipótesis de causas de abandono para muchos Higher Education 17. Pp 291-320.
autores, lo particular de este trabajo tiene que Britos, P. (2008). Procesos de Explotación de
ver con la detección de la cantidad de materias Información Basados en Sistemas
regularizadas, este es el primer indicador Inteligentes. Tesis de Doctorado en
temprano que se debe observar para establecer Ciencias Informáticas. Facultad de
políticas que permitan lograr la permanencia. Informática de la Universidad Nacional de
La Plata. http://laboratorios.fi.uba.ar/lsi/td-
pb-fi-unlp.pdf. Pagina vigente al 4/05/09.
5. Conclusiones y futuras líneas de Hackman, J. y Dysinger, W. S. (1970):
Investigación Commitment To College as a Factor in
Student Attrition. Sociology of Education,
Analizando los resultados obtenidos después 1970, 43 (3), 311-324.
del proceso de explotación de la información Heckerman, D., Chickering, M., Geiger, D.
aplicando algoritmos de inducción, es posible (1995). Learning bayesian networks, the
afirmar que estas herramientas resultan de gran combination of knowledge and statistical
importancia para determinar las causales de la data. Machine learning 20: 197-243.
TE&ET'09 176
IESALC-UNESCO (2005). Datos para Kohonen, T. (1982). Self-organized formation
Colombia. SNIES, Ministerio de of topologically correct feature maps.
Educación Nacional. Colombia. Biological Cybernetics, 43: 59-69.
Kohonen, T. (1995). Self-Organizing Maps. SIU (2009). Sistema Inter Unversitario.
Springer Verlag Publishers. http://www.siu.edu.ar/. Pagina vigente al
Mansky, C. (1989): Anatomy of The Selection 4/05/09.
Problem. Journal of Human Resources Spady, W. (1970): Dropouts From Higher
24, 343-360. Education: An Interdisciplinary Review
Parrino, M. (2004): De la Reflexión a la And Synthesis. Intechange 1. Pp.64-85.
Acción Política para Disminuir los SPU (2009). Secretaria de Políticas
Procesos de Deserción Universitaria. IV Universitarias. Ministerio de Educación.
Coloquio Internacional sobre Gestión Argentina. http://www.me.gov.ar/spu/.
Universitaria en America Del Sud. Pagina vigente al 4/05/09.
Floreanopolis. Tinto (1975). Dropout From Higher
Quinlan, J. (1986). Induction of decision Education: A Theoretical Synthesis ff
trees. Machine Learning, 1(1): 81-106. Recent Research. Review of Educational
Quinlan, J. (1990). Learning Logic Research 45. Pp. 89-125.
Definitions from Relations. Machine
Learning, 5:239-266
TE&ET'09 177