Está en la página 1de 6

Facultad de Informtica DLSIIS

Trabajo de Investigacin: Web Mining

Tutora: Aurora Prez Prez Autor: Juan Francisco Pardo Pastrana

Sistemas Inteligentes de Gestin del Aprendizaje basados en Web Usage Mining


1 Introduccin
El uso de las tecnologas de la informacin como un medio para impartir formacin es un fenmeno en pleno auge. Bajo el trmino eLearning se pueden englobar una serie de tecnologas, tanto de tipo formativo como de plataformas para gestionar la imparticin de cursos, que permiten el acceso a la formacin a travs de Internet. Desde el punto de vista puramente formativo, herramientas como el aprendizaje basado en ordenadores o CBT (Computer Based Training) o los sistemas de tutora inteligentes o ITS (Intelligent Tutoring Systems) tratan de aprovechar las posibilidades que el uso de las tecnologas de la informacin puede aportar a campos como la enseanza a distancia y el aprendizaje adaptativo: Flexibilidad en el tiempo. Accesibilidad geogrfica. Interactividad . Formacin "Just in time". Ajuste a necesidades. Por otro lado, desde un punto de vista no puramente docente, han surgido un gran nmero de herramientas que se denominan sistemas de gestin del aprendizaje o LMS (Learning Management Systems), que se pueden definir como aplicaciones basadas en la Web para la gestin integral de entidades docentes y sus procesos formativos, y que han tenido un desarrollo mucho mayor que las primeras. Dichas herramientas se basan en que los denominados portales de Internet son un marco perfecto para la gestin de entidades educativas, ya que proporcionan un interfaz sencillo y cada vez ms extendido desde el que, por ejemplo, el personal administrativo puede gestionar los horarios, asignaciones de profesores y dems tareas administrativas, el profesorado puede publicar notas, apuntes, prcticas, atender a tutoras y responder a preguntas planteadas por sus alumnos y, por ltimo, proporciona al alumno una manera centralizada de gestionar integralmente todo su proceso formativo, permitindole el acceso a la informacin y noticias acerca de las asignaturas en las que est matriculado, la comunicacin con el profesorado, la entrega de prcticas, la consulta de resultados acadmicos, etctera.

Los sistemas inteligentes de gestin del aprendizaje

Los LMS son aplicaciones Web diseadas especficamente para la gestin de todas las tareas asociadas al proceso formativo, desde las puramente administrativas, hasta la propia imparticin de dicha formacin. Sin embargo, estos LMSs no incorporan la inteligencia de la que disponen, por ejemplo, los sistemas tipo ITS, que tratan de adaptar la experiencia formativa a cada alumno basndose en la informacin de que se dispone sobre l.

Para subsanar esta deficiencia, empiezan a surgir proyectos en lo que se ha denominado sistemas inteligentes de gestin del aprendizaje o iLMS (Intelligent Learning Management Systems), que tratan de aglutinar lo mejor de ambas tecnologas, proporcionando sistemas de gestin del aprendizaje que se adaptan a cada usuario. Estos sistemas tratan de adoptar las tcnicas de machine learning (ML), que han proporcionado resultados satisfactorios en otras reas, para realizar LMSs que se adapten a los diferentes tipos de usuarios.

Web Usage Mining

Cabe destacar que ninguno de los enfoques de los iLMSs hace uso de uno de los campos relacionados con la Web y el ML que mayor desarrollo est experimentando en los ltimos tiempos: Web Mining y, ms en concreto, Web Usage Mining. Se puede definir Web Mining como el proceso de extraccin de patrones potencialmente tiles e interesantes y de informacin implcita (Data Mining) de datos provenientes de la Web o, de manera ms sencilla, como la aplicacin de tcnicas de Data Mining a grandes repositorios de datos Web [1]. De las tres reas en las que se suele dividir el Web Mining (Content, Structure y Usage), la que ms xito ha tenido es Web Usage Mining, que se caracteriza por la aplicacin de tcnicas de Data Mining para la obtencin de patrones acerca de la utilizacin que los usuarios realizan de la Web.

Ventajas de Web Usage Mining en iLMS

Las tcnicas de Web Usage Mining han demostrado ser de gran utilidad en muchos entornos Web, como el comercio electrnico, por ejemplo, proporcionando mecanismos para clasificar a los usuarios por cmo navegan por un sitio Web, permitiendo adaptar los banners o anuncios del sitio Web segn el tipo de usuario, o posibilitando el ofertar a dicho usuario productos adaptados a sus gustos, etctera. Del mismo modo, en el entorno de los iLMSs, sera deseable poder recomendar a los alumnos, por ejemplo, la asistencia a una charla o una clase, o la lectura de contenidos que es ms probable que sean de su inters, y sera deseable que el portal se adaptase al tipo de usuario, facilitndole el acceso a las pginas a las que es ms probable que acceda. Estas funcionalidades pueden conseguirse de manera sencilla con la ayuda del Web Usage Mining analizando los accesos de los usuarios y as realizar las recomendaciones o adaptar la estructura del sitio Web de acuerdo con los datos obtenidos de dicho anlisis. Adems, es posible refinar el mecanismo aportando la informacin que se tiene de los alumnos y realizar el anlisis de accesos slo para aquellos alumnos que se parecen al alumno que est siendo tratado en ese momento. Por ejemplo, es ms probable que un alumno est ms interesado en documentos a los que acceden alumnos que estn matriculados en las mismas asignaturas que en aquellos que consultan alumnos que no tienen ninguna asignatura en comn con l.

Lo que se propone, por tanto, es aportar un nivel ms de inteligencia a los llamados sistemas inteligentes de gestin del aprendizaje. Ello se consigue mediante la aplicacin de tcnicas de Web Usage Mining, dando lugar a lo que se denomina Sistemas con Inteligencia Web para la Gestin del Aprendizaje o Web Intelligent Learning Management Systems. Para ilustrar este hecho se presentar un mecanismo para realizar recomendaciones a los alumnos sobre contenido formativo, que se basa tanto en la informacin que el sistema dispone sobre los citados alumnos como en el uso que stos hacen del sistema. Las recomendaciones sobre qu contenidos pueden resultar de su inters, personalizado para cada tipo de alumno es una de las herramientas ms comunes en los sistemas iLMS, por lo que se ha elegido como ejemplo. Para el desarrollo de este ejemplo se ha realizado una instalacin de dotLRN (lase dot learn, o punto aprender), que es una herramienta LMS de cdigo abierto, basada en la herramienta de gestin de portales openACS, que funciona sobre el servidor de http AOLserver y el gestor de bases de datos postgreSQL. Adems, se ha ampliado el modelo de datos de dicha herramienta con un Data Warehouse de accesos al servidor Web, proporcionado parcialmente por un mdulo de clickstream para AOLserver desarrollado por la Universidad de Waikato en Nueva Zelanda. Por ltimo, se ha utilizado Weka como herramienta de Data Mining, tambin de cdigo abierto.

Sistema de recomendaciones basado en Web Mining

El sistema propuesto de recomendaciones se basa en el hecho de que alumnos con asignaturas parecidas necesitarn, con toda probabilidad, acceder a documentos similares. Por ello, el primer paso es obtener una medida de cmo de parecidos son dos alumnos. Para ello, se obtendr un conjunto de datos en el que representaremos a cada alumno por una tupla, y a cada asignatura por una columna, siendo el contenido de cada celda un valor de VERDADERO (TRUE) si el alumno pertenece a dicha asignatura y FALSO (FALSE) en caso contrario. De este modo se obtiene un conjunto de datos con el mismo nmero de columnas para todas las filas, sobre el que se aplicar una tcnica de clustering, que agrupar a alumnos por similitud de asignaturas. Posteriormente, se calcular, para cada pareja de usuarios de cada cluster, el porcentaje de similitud, como el porcentaje de columnas de dicha tabla cuyo valor es el mismo. Como tercer paso, se obtendr de los datos de acceso de cada usuario un porcentaje de accesos del usuario que corresponden a cada documento. A continuacin, se calcular para cada usuario (Ui), la valoracin de cada documento como la suma, para los usuarios del mismo cluster (Uj), del porcentaje de accesos a ese documento multiplicado por el grado de similitud del usuario. Esto es: Vdi = djsij para los alumnos Uj que pertenecen al mismo segmento que Ui,, donde: Vdi es la valoracin del documento d para el usuario i

es el porcentaje de accesos a documentos del usuario j que corresponden al documento d sij es el grado de similitud entre el usuario i y el j

ddj

Con esto obtendremos una valoracin de cada documento para cada alumno, que se utilizar posteriormente para mostrar como las recomendaciones al usuario, en orden de valoracin.

Conclusiones

La mejora de los sistemas LMS mediante la aplicacin de tcnicas de Web Usage Mining y el anlisis de la informacin disponible de los usuarios del sistema hace posible dotar a dichos sistemas, y de una manera sencilla, del grado de inteligencia necesario para adaptarse a cada usuario, haciendo que el proceso formativo que se desarrolla en estos entornos se vea mejorado. Esta mejora permite la realizacin de sistemas inteligentes para la gestin de dicho proceso formativo, sistemas que empiezan a desarrollarse y que cambiarn el modo de entender y proporcionar la formacin en los aos venideros. Se ha mostrado un ejemplo prctico que permite vislumbrar cmo la aplicacin de tcnicas de anlisis de los datos de acceso a un portal de eLearning puede mejorar en mucho los resultados que se obtienen con los sistemas LMS (e incluso iLMS) actuales. Pero es evidente que no estamos ante un rea de investigacin maduro, sino que, por el contrario, se encuentra en constante desarrollo y proceso de mejora. Las nuevas tecnologas de Web Intelligence y la Web semntica, entre otras, tienen mucho que decir en el mbito de la formacin por medios electrnicos y aportarn nuevas posibilidades al eLearning, que debern analizarse, y que se incluyen entre las lneas futuras de esta investigacin.

Bibliografa

[1]Robert W. Cooley. Web Usage Mining: Discovery and Application of Interesting Patterns from Web Data. Ph. D. Thesis. University of Minnesota. May 2000. [2] Rafael A. Calvo, Ernie Ghiglione and Robert A. Ellis. The OpenACS elearning infrastructure. AusWeb 2003 Conference. July 2003. Disponible en: http://ausweb.scu.edu.au/aw03/papers/calvo2/paper.html [3] Vasudev Surath Uthayakumar. Web Traffic Analysis Tool. Undergraduate Thesis. University of Sydney. 2003. Disponible en: http://www.weg.ee.usyd.edu.au/projects/docs_2003/va.su/Vasudev_thesis.p df [4] Raymond Kosala, Hendrik Blockeel. Web Mining Research: A Survey. SIGKDD Explorations. ACM SIGKDD. July 2000. [5] Bamshad Mobasher. Web Usage Mining and Personalization. Captulo 4 de Practical Handbook of Internet Computing M.P. Singh, ed. CRC Press LLC. 2004.

[6] S. K. Madria et al. Research issues in web data mining. Proceedings of Data Warehousing and Knowledge Discovery, First International Conference, DaWaK 99. 1999. [7] J. Borges and M. Levene. Data Mining of User Navigation Patterns. Proceedings of WEBKDD99 Workshop on Web Usage Analysis and User Profiling. 1999. [8] Tim Berners-Lee, James Hendler, Ora Lassila The Semantic Web. Scientific American. 2001. [9] Rafael Calvo. User Scenarios for the design and implementation of iLMS. Proceedings of AIED2003. 2003. [10] Macromedia Inc. Getting Started with eLearning Standards. 2000. [11] Luis Felipe Paradela Gonzlez. eLearning: La Formacin a Distancia a travs de las Tecnologas de la Informacin. Boletic: boletn de la Asociacin profesional del cuerpo superior de sistemas y tecnologas de la informacin de la Administracin del Estado (ASTIC). 2003