Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Actas del III Taller Nacional de Minería de Datos y Aprendizaje, TAMIDA2005, pp.49-56
ISBN: 84-9732-449-8 © 2005 Los autores, Thomson
50 III Taller de Minería de Datos y Aprendizaje
sobre como los estudiantes aprenden en el centros de enseñanza a distancia tanto públicos
web, evaluar a los estudiantes por sus como privados, orientados a todos los niveles y
patrones de navegación, reestructurar los tipos de educación: primaria, secundaria, superior,
contenidos el sitio web para personalizar los especial, adaptada, etc. Cada uno de ellos utiliza
cursos, clasificar a los estudiantes en grupos, un sistema o plataforma de enseñanza basado en
etc. web [9] que puede ser: o bien un sistema propio
• Orientado hacia los estudiantes. Con el desarrollado específicamente por ellos mismos, o
objetivo de ayudar o realizar bien uno de los múltiples sistemas comercial
recomendaciones a los alumnos durante su existentes como: Web-CT, Virtual-U, TopClass,
interacción con el sistema de e-learning para etc. o de libre distribución como: ATutor, ILIAS,
poder mejorar su aprendizaje. Sus principales Moodle, etc. Estos sistemas proporcionan
aplicaciones son: sugerir buenas experiencias servicios útiles para la enseñanza a distancia como
de aprendizaje a los estudiantes, adaptación son herramientas para la comunicación sincronía y
del curso según el progreso del aprendiz, asíncrona, herramientas para la gestión de
ayudar a los estudiantes dando sugerencias y materiales de aprendizaje y herramientas para la
atajos, recomendar caminos más cortos y gestión, seguimiento y evaluación de los
personalizados, etc. estudiantes.
También es importante indicar que aunque el Un problema de la mayoría de los sistemas
área de la minería de datos aplicada a educación para la enseñanza basados en web anteriores es
es muy reciente, ya cuenta con un número que los cursos que proporcionan no son más que
importante de investigadores, y muestra de ello una red de páginas web estáticas a través de las
son las múltiples contribuciones publicadas en que navegan todos los estudiantes. Para solucionar
diferentes congresos internacionales (ICCE, este problema se han desarrollaron los Sistemas
ICALT, ITS, Elearn, PAKDD, GECCO, UM, AH, Hipermedia Adaptativos Basados en Web [8] que
WISE, ISDE, etc.) y revistas (IJEL, IEEE son un nuevo tipo de sistemas educativos que
Education, UMUAI, etc.), y que su número se está provienen de la evolución de los Sistemas Tutores
incrementando enormemente cada año, indicando Inteligentes (STI) y de los Sistemas Hipermedia
la gran importancia que esta teniendo y el interés Adaptativos (SHA), y que comparten con ellos
que está despertando. También indicar que aunque características tales como: aumento de la
la mayoría de las investigaciones se están interacción con los usuarios y adaptación de los
realizando dentro de las Universidades, ya se contenidos a las necesidades de estos. Para ello,
están comenzando a interesarse algunas empresas construyen un modelo del alumno y lo utilizan
(SPSS, TEMIS, Giunti Interactive Labs, etc.) dado durante la interacción con dicho usuario para
idea de su potencial aplicación comercial. adaptarse a sus necesidades. Algunos ejemplos de
El objetivo de este artículo es de presentar el Sistemas Hipermedia Adaptativos basados en
estado de la investigación en esta área, para ello, Web para educación [8] son: Interbook, DCG,
primero se realiza una introducción a la enseñanza ELM-ART, CALAT, AHA!, etc.
a distancia y a la minería de datos basada en web, Por último indicar también la existencia y el
a continuación se describe las principales técnicas incremento en la utilización de múltiples
de minería de datos aplicadas a e-learning y por estándares de e-learning [23]: IMS, ADL
último se presentan algunas conclusiones y las SCORM, AICC, IEEE LTSC, etc. que además de
líneas más actuales de investigación. permitir la interoperatibilidad entre distintos
sistemas, permiten la reutilización de contenidos
2. Educación basada en web educativos, y también facilitan la incorporación de
diferentes técnicas adaptativas.
El desarrollo de las nuevas tecnologías de la
educación y la comunicación han hecho posible la
utilización de Internet y más concretamente la
WWW (World Wide Web) en la educación a
distancia, dando lugar a la denonimada Educación
basada en Web o e-learning [14]. En la actualidad
existen por todo el mundo miles y miles de
III Taller Nacional de Minería de Datos y Aprendizaje, TAMIDA2005 51
similares al modelo probabilístico de Naive Bayes basándose en los historiales de acceso y mejorar el
para descubrir patrones que reflejan proceso de aprendizaje en línea. Concretamente
comportamientos de los usuarios. Su objetivo es utiliza minería de reglas de asociación para
utilizan la minería de datos para dar soporte a la entrenara al agente recomendador y construir un
tutoría en comunidades de aprendizaje virtual. modelo que representa el comportamiento de
La utilización conjunta de clustering con otros acceso o asociaciones entre actividades de
técnicas como secuenciación es realizada por Julia aprendizaje en línea. Otro trabajo que analiza los
Miguillón y Enric Mor [20] para analizar el ficheros log de entornos de aprendizaje web
comportamiento de navegación de los usuarios utilizando técnicas de minería de reglas de
para la personalización de e-learning. Utilizan asociación y filtrado colaborativo, es el realizado
clustering de estudiantes para intentar extender las por Feng-Hsu Wang [34] para descubrir patrones
capacidades de secuenciación de algunos sistemas de navegación útiles y proponer un modelo de
estándares de manejo de manejo de aprendizaje navegación. El modelo de navegación consiste en
como SCORM para incluir el concepto de dos tipos de relaciones: relaciones de asociación y
itinerario recomendado. Los autores Erkki Sutinen relaciones de secuencia entre documentos.
y otros [29] proponen un modelo híbrido que La utilización de métodos heurístico como
combina técnicas de minería de datos y de regresión lineal en combinación con reglas de
aprendizaje de máquinas para la construcción de asociación es propuesta por Freyberger y otros
una red bayesiana para describir el proceso de [10] para buscar buenos modelos de transferencia
aprendizaje de los estudiantes. Su objetivo es de aprendizaje de estudiantes a partir de los
clasificar a los estudiantes para poder ofrecerles ficheros logs de interacción de sistemas tutores
diferentes guías dependiendo de sus habilidades y inteligentes. El modelo de transferencia relaciona
otras características. Esta tarea se realiza con la preguntas con los componentes del conocimiento
categorización y clustering de los estudiantes necesarios para responderlas correctamente. Las
dependiendo de sus habilidades o conocimiento. reglas de asociación guían el proceso de búsqueda
Finalmente el trabajo realizado por Jing Luan [16] para encontrar modelos de transferencia que
utiliza técnicas de minería de datos en educación predicen el éxito de los estudiantes
superior y propone la utilización conjunta de También se están utilizando técnicas de
predicción y clustering dentro de una herramienta softcomputing, por ejemplo Pao-Ta Yu y otros
de soporte de decisiones permitiendo a la [36] proponen la utilización de reglas de
universidad anticiparse a las necesidades de los asociación difusas para descubrir relaciones entre
estudiantes. patrones de comportamiento de los estudiantes,
incluyendo el tiempo de acceso, números de
4.2. Reglas de asociación páginas leídas, preguntas contestadas, mensajes
leídos y enviados, etc. Mediante monitorización y
Las reglas de asociación [1] descubren relaciones análisis el sistema indicará mediante umbrales de
entre atributos de un conjunto de datos que alarma los resultados a los estudiantes y al
superan unos determinados umbrales. Su instructor. Un trabajo más orientado a los sistemas
aplicación más típica ha sido en los sistemas de hipermedia adaptativos es el de Romero y Ventura
comercio electrónico para informan sobre las [25] que utilizan minería de reglas como técnica
preferencias de compra de los clientes. Su de descubrimiento de información útil para los
aplicación a sistemas de e-learning permite autores de este tipo de cursos con el objetivo de
descubrir relaciones o asociaciones entre distintas poder realizar mejoras tanto del contenido, como
páginas Web visitadas. A continuación se de la estructura de los cursos y de su adaptación.
describen algunos trabajos de aplicación de Concretamente proponen la utilización de
minería de datos en e-learning que utilizan está algoritmos evolutivos multiobjetivo para el
técnica. descubrimiento de relaciones importantes a partir
Uno de los pioneros de la utiliza técnicas de de los datos de utilización (tiempos de acceso a
minería web en sistemas de e-learning es Osmar páginas, aciertos y fallos, y niveles de
Zaïne [38] y actualmente propone utilizar agentes conocimiento) de los estudiantes. Otro trabajo que
recomendadotes [37] para recomendar actividades también emplea algoritmos evolutivos es el
de aprendizaje en línea o atajos en un curso web realizado por Behrouz Minaei-Bidgoli y William
III Taller Nacional de Minería de Datos y Aprendizaje, TAMIDA2005 53
más fáciles e intuitivas de utilizar, orientadas [7] Becker, K.; Marquardt, C.G.; Ruiz, D.D. A
para ser utilizadas por personas no expertas Pre-Processing Tool for Web Usage Mining in
en minería de datos, sino en educación. the Distance Education Domain. pp. 78-87.
• Integración de algoritmos de minería de datos 2004.
dentro de las propias herramientas autor de [8] Brusilovsky, P. Adaptive and Intelligent
construcción y mantenimiento de los cursos, Technologies for Web-based Education.
para la mejora automática de los sistemas. Special Issue on Intelligent Systems and
• Integración de algoritmos de minería en los Teleteaching, Künstliche Intelligenz, 4, 19-25.
interfaces de usuario de los cursos y de las 1999.
plataformas dentro de sistemas agentes [9] Flate, M. Online education and learning
recomendadores, para realización de management systems. Global e-learning in a
sugerencias sobre rutas, actividades, etc. Scandinavian perspective. Oslo. NKI Forlaget.
• Desarrollo de algoritmos de minería de datos 2003.
específicos para problemas relacionados con [10] Freyberger, J.; Heffernan, N.T.; Ruiz, C.
la enseñanza y el aprendizaje a distancia Using Association Rules to Guide a Search for
utilizando entornos hipermedia adaptativos y Best Fitting Transfer Models of Student
sistemas tutores inteligentes basados en web. Learning. Int. Conf. on Intelligent Tutoring
• Aplicación de nuevas técnicas de minería de Systems. 2004.
datos como minería de semántica web, [11] GeiBler, S.; Vaccaro, R.; Automatic
minería de datos multimedia, minería de Information Extraction and Indexing in the
datos distribuida, etc. context of E-Learning Knowledge
Management. Int. conf. on Data Mining, Text
Mining and their Business Applications.
Agradecimientos Greece. 2005.
[12] Ha, S.H.; Bae, S.M.; Park, S.C. Web mining
Este trabajo ha sido financiado por el MCYT a for distance education. APAN Conference.
través del proyecto TIC2002-04036-C05-02 y de Beijing. 2000.
fondos FEDER. [13] Heraud, J.M.; A Web Adaptive Learning
Environment where the link structure is
Referencias generated by experience reuse. Int. Conf. on
Intelligent Tutoring Systems. Brazil. 2004.
[1] Agrawal, R.; Imielinski, T.; Swami, A. Mining [14] Horton, W. Designing Web-Based Training.
association rules between sets of items in John Wiley&Sons. 2000.
large databases. ACM SIGMOD Conference [15] Li, J.; Zaiane, O.R. Combining Usage,
on Management of Data. pp. 207-216. 1993. Content and Structure Data to Improve Web
[2] Agrawal, R;. Srikant, R. Mining sequential Site Recommendation. Int. Conf. on
patterns. Int. Conf. Data Engineering, pp. 3- Electronic Commerce and Web Technologies.
14. Taiwan. 1995. Spain. 2004.
[3] Arabie, P.; Hubert, J.; De Soete, G. Clustering [16] Luan, J. Data Mining, Knowledge
and Classification. World Scientific Management in Higher Education, Potential
Publishers. 1996. Applications. Workshop Associate of
[4] Arroyo, I.; Murray, T.; Woolf B.P.; Beal, C.R. Institutional Research International
Inferring Unobservable Learning Variables Conference. Toronto. 2002.
from Students' Help Seeking Behavior. Int. [17] Minaei-Bidgoli, B.; Punch, W.F. Predicting
Conf. on Intelligent Tutoring Systems. pp student performance: an application of data
782-784. 2004. mining methods with the educational web-
[5] Baker, R.S.; Corbett, A.T.; Koedinger, K.R. based system LON-CAPA. IEEE Frontiers in
Detecting Student Misuse of Intelligent Education. Pp 1-6. 2003.
Tutoring Systems. Int. Conf. on Intelligent [18] Minaei-Bidgoli, B.; Punch, W.F. Using
Tutoring Systems. Pp. 531-540. 2004. Genetic Algorithms for Data Mining
[6] Barnett, V.; Lewis, T.; Outliers in Statistical Optimization in an Educational Web-Based
Data. John Wiley & Sons. 1994. System. GECCO 2003: 2252-2263.
56 III Taller de Minería de Datos y Aprendizaje
[19] Mladenic, D.; Grobelnik, M.; Jermol, M. [31] Tang, T. Y.; McCalla, G. Evaluating A Smart
Exploiting Text Mining in Publishing and Recommender for an Evolving E-Learning
Education. Workshop on Data Mining System. Proceedings of Canadian Artificial
Lessons Learned. ICML. Pp. 34-39. 2002. Intelligence Conference. Canada. 2004.
[20] Mor, E.; Minguillón J. E-learning [32] Talavera, L.; Gaudioso, E. Mining student
Personalization based on Itineraries and Long- data to characterize similar behavior groups in
term Navigational Behavior. World Wide unstructured collaboration spaces. Workshop
Web Conference. pp. 264-265. New York. on Artificial Intelligence in CSCL. ECAI. pp.
2004. 17-23. 2004.
[21] Mostow, J. Some useful design tactics for [33] Ueno, M.; Online Outlier Detection System
mining ITS data. Workshop on Analyzing for Learning Time Data in E-Learning and Its
Student-Tutor Interaction Logs to Improve Evaluation. Pp. 248-253. 2004.
Educational Outcomes. Int. Conf. on [34] Wang, F. On Analysis and Modeling of
Intelligent Tutoring Systems. 2004. Student Browsing Behavior in Web-Based
[22] Pahl, C. Data Mining Technology for the Asynchronous Learning Environments. Int.
Evaluation of Learning Content Interaction. Conf. on Web-based Learning. Pp. 69-80.
International Journal on E-Learning IJEL. 2002.
2004. [35] Wang, W; Weng, J.; Su, J.; Tseng, S.
[23] Paramythis, A.; Loidl-Reisinger, S. Adaptive Learning Porfolio Analysis and Mining in
Learning Environments and e-Learinng SCORM Compliant Environment. IEEE
Standards. Electronic Journal of e-Learning, 2 Frontiers in Education Conference. 2004.
(1), pp. 181-194. 2004. [36] Yu, P.; Own, C.; Lin, L. On the Learning
[24] Perkowitz, M.; Etzioni, O. Adaptive web Behavior Analysis of Web Based Interactive
sites: Automatically synthesizing web pages. Environmnent. ICCE. 2001.
National Conference on Artificial Intelligence. [37] Zaïane, O.R. Building a Recommender Agent
WI. 1998. for e-Learning Systems. International
[25] Romero, C.; Ventura, S.; de Bra, P. Conference on Computers in Education. New
Knowledge Discovery with Genetic Zealand. pp 55-59. 2002.
Programming for Providing Feedback to [38] Zaïane, O.Z. Web Usage Mining for a Better
Courseware Author. User Modeling and User- Web-Based Learning Environment.
Adapted Interaction. Vol. 14. No. 5. 2005. Conference on Advanced Technology for
[26] Shen, R.; Han, P.; Yang, F. Data Mining and Education. pp 60-64. Alberta. 2001.
Case-based Reasoning for Distance Learning. [39] Zytkow J.; Klosgen W., Handbook of Data
International Journal of Distance Education Mining and Knowledge Discovery. Oxford
Technologies, Vol. 1(3), pp. 46-58. 2003. University Press. 2001.
[27] Scime, A. Web Mining: Applications and
Techniques. Idea Group. 2004.
[28] Srivastava, J.; Mobasher, B.; Cooley, R.
Automatic Personalization Based on Web
Usage Mining. Communications of the
Association of Computing Machinery. pp.
142-151. 2000.
[29] Sutinen, E.; Hämäläinen, W.; Suhonen, J.;
Toivonen, H. Data Mining in Personalizing
Distance Education Courses. Conference on
Open Learning and Distance Education. Hong
Kong. 2004.
[30] Tang, C.; Lau, R.; Li, Q.; Yin, H.; Li, T.;
Kilis, D. Personalized Courseware
Construction based on Web Data Mining. pp.
204-211. 2000.