Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Introducción
Con el rápido desarrollo de la sociedad basada en conocimiento ha crecido la im-
portancia que se le da a la creación colaborativa de conocimientos. En este contexto,
el Aprendizaje Colaborativo Soportado por Computadora (ACSC) se ha vuelto una
nueva forma de educación donde los estudiantes aprenden por medio de la interacción
con personas que pueden estar localizadas en marcos temporales y espaciales diferen-
tes [14]. Sin embargo, disponer de herramientas de software que soporten el aprendi-
zaje en grupo no garantiza que los estudiantes colaboren, puesto que factores tales
como: conocimiento insuficiente en el área de contenido, falta de acceso a recursos
apropiados, carencia de conocimiento en cómo usar recursos, déficit de habilidades, y
problemas con los materiales del curso, pueden obstaculizar el proceso de aprendizaje
de los estudiantes [6], [7], [8], [9], [15]. De acuerdo con Varvel [15] es responsabili-
dad de los e-tutores (docentes) identificar estos obstáculos en el aprendizaje grupal
para brindar asistencia en el momento adecuado y con los métodos apropiados.
En los entornos de ACSC se dispone de un registro completo de las actividades e
interacciones de los estudiantes. Un análisis posterior de este conjunto de actividades
e interacciones le tendría que permitir a los e-tutores reconocer la presencia de los
2 Modelo multi agente que personaliza el material de estudio en grupos colaborativos
obstáculos del proceso de aprendizaje antes mencionados. Pero, cuando se tiene una
cantidad considerable de interacciones el análisis manual es prácticamente inviable
debido al tiempo y esfuerzo que requiere [2], [10]. Además, la coordinación de discu-
siones supone para los e-tutores de ACSC una enorme demanda tanto temporal
como cognitiva, sobre todo cuando se tienen varios grupos trabajando en simultáneo
[11]. Si también se tiene en cuenta que los e-tutores podrían no ingresar al sitio del
curso por un largo tiempo debido a problemas de salud, viajes, problemas de cone-
xión, etc., queda claro que el proceso de aprendizaje grupal se vería ralentizado si los
estudiantes no fueran capaces de resolver por su cuenta los obstáculos que surjan a lo
largo de una actividad o curso [13].
En base a lo mencionado en el último párrafo, se propone un modelo multi agente
para tratar específicamente con el problema de conocimiento insuficiente en el área de
contenido. En el modelo propuesto, un agente se encargará de analizar las interaccio-
nes grupales con el fin de identificar temas o áreas de contenido donde los estudiantes
tengan dudas o dificultades. Detectada la falencia de conocimiento, otro agente suge-
rirá a los estudiantes los materiales de estudio (presentaciones power point, libros,
monografías, páginas web, videos, etc.) que podrían consultar para resolver su duda o
dificultad. En estos casos se alertará al docente para que asista a los estudiantes a fin
de lograr la completitud de la tarea o actividad.
Con este modelo multi agente se pretende aliviar la carga de trabajo de los docen-
tes, al igual que contribuir a que los estudiantes sean menos dependientes del docente.
Para los estudiantes el contar con un sistema que les recomiende los contenidos a
revisar les ayudaría a administrar mejor su propio tiempo ya que muchas veces están
limitados en este aspecto y no tienen la posibilidad de revisar todo el material de estu-
dio. Esta situación se agrava si se considera que muchos estudiantes universitarios
combinan sus estudios con trabajos de medio tiempo.
El reconocimiento de falencias en el conocimiento y la posterior recomendación
de los materiales de estudio no es tarea sencilla sobre todo cuando se trabaja con ma-
teriales escritos en más de un idioma. La búsqueda y recuperación de información
desde materiales escritos en múltiples idiomas es justamente el principal foco de aten-
ción de este trabajo. En el presente documento se hace la evaluación de la viabilidad
de utilizar Lucene como motor de búsqueda multilingüe dentro del modelo multi
agente de recomendación de material de estudio, en particular, libros.
El resto del documento se estructura como sigue. En la sección 2 se describe en
detalle el modelo multi agente de recomendación de material de estudio. En la sección
3 se presentan los métodos comúnmente usados para la búsqueda en documentos
multilingüe. En la sección 4 se describe el proceso de experimentación con diferentes
analizadores y filtros de Lucene. En la sección 5 se presenta la interfaz de usuario
sugerida para implementar el modelo multi agente propuesto. Finalmente, la sección 6
contiene algunas conclusiones.
estudio que puedan contribuir a rellenar esos vacíos en el conocimiento de los estu-
diantes.
plano con información del libro. Este campo se utiliza para acceder al número de
ISBN y al índice de contenidos cuando el usuario desee ver más detalles de algún
libro en particular. En tanto que, el campo idioma indica el lenguaje en el que está
escrito el archivo de texto plano. La Tabla 1 detalla las características de los campos
con información sobre los libros que forman parte del índice invertido.
Tabla 3. Precisión y recall para las búsquedas realizadas con Standard Analyzer
Campo Busqueda Precisión Recall
Autores 0,700925926 0,916667
Titulo 0,159775154 0,966667
ISBN 1 0,875
Palabra Clave 0,445478933 0,764238
Promedio 0,576545003 0,880643
1
http://tm.r-forge.r-project.org/
10 Modelo multi agente que personaliza el material de estudio en grupos colaborativos
ñol e inglés se pasó del 0.57 (SimpleAnalyzer sin stop words) al 0.63. A su vez, este
incremento en la precisión no tiene aparejada una disminución significativa del recall
(ver Figura 3).
Una revisión de las cifras incluidas en Tablas 4 a 9 pone en evidencia que mien-
tras la precisión para las búsquedas por el campo Título no supera el 0.19, en las bús-
quedas por el resto de los campos la precisión es siempre mayor al 0.44. Esto significa
que, las consultas para el campo Título son el talón de Aquiles para cualquiera de los
analizadores. Con el propósito de mejorar la precisión de las búsquedas por Titulo se
decidió emplear el algoritmo de stemming de Porter [3] en lugar de los algoritmos de
stemming usados por SnowballAnalyzer, EnglishAnalyzer y SpanishAnalyzer. Los
resultados de los nuevos experimentos se discuten en la próxima sección.
Las dos celdas sombreadas en la Tabla 10 señalan los valores más altos de preci-
sión y recall a los que se pudo llegar en las búsquedas por el campo Título. Como
puede verse la estrategia más conveniente para mejorar la efectividad de las búsque-
das por Título consiste en aplicar PorterStemFilter junto con StandardTokenizer y
StopFilter con stop words en español e inglés. El 0.28 de precisión en la celda resalta-
da representa un incremento del 47% si se tiene en cuenta que con el resto de los ana-
lizadores se había obtenido 0.19 como valor máximo para la precisión. Por su parte, el
recall se mantiene dentro de los valores alcanzados con los otros analizadores.
En un primer examen a la tercera columna de la Tabla 10 se pensó que Por-
terStemFilter junto con StandardTokenizer y StopFilter mejoraban la relevancia de los
resultados de las búsquedas, al menos por el campo Título, porque el índice invertido
que se había generado contenía mayor cantidad de términos que los índices construi-
dos al combinar PorterStemFilter con otros filtros. Sin embargo, en la Figura 4 se
aprecia claramente que no existe una relación directa entre el número de términos del
índice y la relevancia de los resultados de las búsquedas. La precisión puede tanto
mejorar como empeorar a medida que aumenta la cantidad de términos en el índice.
Fig. 4. Relación entre precisión y cantidad de términos del índice para las búsque-
das por Título
Si se compara a la Tabla 11 con las cifras de la Tabla 6, sale a la luz que: la rele-
vancia de los resultados de las búsquedas por Autor también mejoro; no hubo cam-
bios en las búsquedas por ISBN; y hubo un decrecimiento de la precisión de los resul-
tados para palabra clave que de cierto modo, se compensa con un pequeño incremento
en el recall. Los promedios de precisión y recall de la Tabla 11 son 3% superiores a
los conseguidos mediante SimpleAnalyzer (Tabla 6) por lo cual se podría concluir
que para procesar información de libros escritos en inglés y español conviene em-
plear: StandardarTokenizer, StopFilter con stop words en inglés y español, y Por-
terStemFilter. No obstante, el problema con esta combinación de recursos de Lucene
es que las búsquedas son case sensitive. Cuando se utiliza StandardarTokenizer,
StopFilter y PorterStemFilter no se convierte a minúsculas al texto de las consultas ni
al texto de los archivos con información de los libros. Esto implica que si un usuario
realiza una búsqueda por la palabra “Sommerville” y luego realiza otra consulta re-
emplazando la letra “S” por su equivalente minúscula, es decir “sommerville”, puede
obtener resultados completamente diferentes. De hecho, van a existir resultados para
la consulta “Sommerville” si la palabra “Sommerville” estaba presente en la colección
de documentos y en consecuencia en el índice invertido. Del mismo modo, para la
consulta “sommerville” se van a mostrar los libros que tienen la palabra “sommervi-
lle” pero no los libros donde figura la palabra “Sommerville”. SimpleAnalyzer no
sufre del inconveniente de las búsquedas case sensitive porque efectúa la conversión a
minúscula mediante LowerCaseFilter.
En base a lo expuesto en los párrafos precedentes es posible concluir que la estra-
tegia más conveniente consiste en procesar tanto los documentos (información de los
15 Pablo Santana Mansilla y Rosanna Costaguta
Sin bien hasta el momento no se han programado los tres agentes del modelo pro-
puesto, ni se ha implementado la interfaz de chat de la Figura 6, se ha creado una
aplicación que usa SimpleAnalyzer para realizar búsquedas de libros escritos en espa-
ñol e inglés. La interfaz de usuario de esta aplicación es la misma que usará el agente
Buscador de Materiales de Estudio y se describe a continuación mediante un ejemplo.
16 Modelo multi agente que personaliza el material de estudio en grupos colaborativos
Para buscar un libro el usuario tiene que indicar el texto a buscar (a la izquierda
del botón buscar) y seleccionar el campo por el cual realizar la búsqueda: Autor, Títu-
lo, ISBN o todos los campos. Esta última opción implica que se busca en Autor, Títu-
lo, ISBN y en el índice de contenidos simultáneamente. Suponiendo que el texto a
buscar en el conjunto de libros del Departamento de Informática fuese “java”, y que
se busca por todos los campos, los libros recuperados serían los que muestra la Fig.7.
Un click sobre cualquiera de las filas de la tabla que aparece en la Figura 7 mos-
traría detalles sobre el libro correspondiente. Suponiendo que se hubiera hecho un
click en la primera fila de la tabla de resultados de la Figura 7, se obtendría informa-
ción adicional sobre el libro “Estructura de datos y algoritmos en JAVA” tal como se
muestra en la Figura 8.
17 Pablo Santana Mansilla y Rosanna Costaguta
6. Conclusiones
El trabajo realizado no sólo permitió proponer un modelo multi agente aplicable a
grupos de estudiantes colaborativos que personaliza la recuperación de materiales de
estudio, teniendo en cuenta las necesidades de los mismos, sino que también permitió
experimentar con las facilidades disponibles en la herramienta Lucene para el análisis
y recuperación de documentos escritos en inglés y español.
Una de las primeras cuestiones en las que se debería seguir trabajando es en mejo-
rar la precisión de los resultados de las búsquedas por Título, ya sea que se utilice
SimpleAnalyzer o cualquier otro analizador. La precisión se mantiene siempre baja
debido a la forma en la que se construyó la consulta para buscar por el campo Título.
Cuando se hacen consultas por Título no sólo se recuperan los libros cuyo campo
Título coincida exactamente con la cadena de búsqueda, sino también los libros que
tengan en el campo Título alguna de las palabras que forman parte de la consulta.
Esto provoca que para cada consulta por título se les muestren a los usuarios mayor
cantidad de resultados de los que son realmente necesarios para satisfacer sus necesi-
dades de información. Así, por ejemplo, una búsqueda por el campo título con la ca-
dena “Administración de Sistemas Operativos” daría como resultado el libro cuyo
título sea “Administración de Sistemas Operativos” pero también los libros que ten-
gan las palabras “Administración”, “Sistemas” y “Operativos” como parte de su títu-
lo. La ventaja que tiene el no trabajar solamente con coincidencias exactas de la con-
sulta es que el buscador muestra resultados a los usuarios incluso cuando alguno de
los términos de la consulta tiene errores de ortografía.
Por otro lado, dos posibles modificaciones al proceso de búsqueda que quizás me-
joren la precisión y el recall son: detección automática del idioma de la consulta y
expansión de sinónimos para las consultas. Actualmente si un usuario realiza una
búsqueda por título con la cadena “Introducción a la Programación”, va obtener como
resultado el libro en cuyo título figure la cadena “Introducción a la Programación”.
Sin embargo, la colección de libros con la que se trabajó contiene un libro titulado
“Fundamentos de Programación. Algoritmos y Estructura de Datos”, con casi los
mismos temas que el libro “Introducción a la Programación”. En consecuencia, podría
18 Modelo multi agente que personaliza el material de estudio en grupos colaborativos
Referencias
1. Ballesteros., L., y Croft, W. Phrasal Translation and Query Expansion Techniques for Cross-
Language Information Retrieval. In Proc. 20th Annual International ACM SIGIR conference on Re-
search and development in information retrieval, pp.84-91, 1997.
2. Chen, W. Supporting teachers’ intervention in collaborative Knowledge building. Journal of Network and Computer
Applications, 29: 200-215, 2006.
3. Hatcher, E., y Gospodnetic, O. Lucene in Action. Manning Publications, USA, 2005.
4. Konchady, M. Building Search Applications - Lucene, LingPipe and Gate. Mustru Publishing, 2008.
19 Pablo Santana Mansilla y Rosanna Costaguta
5. Korra, R., Sujatha, P., Chetana, S., y Kumar, M. Performance Evaluation of Multilingual Information
Retrieval (MLIR) System over Information Retrieval (IR) System. In Proc.IEEE-International Confer-
ence on Recent Trends in Information Technology (ICRTIT 2011), pp. 722-727, 2011.
6. Olivares, O. Collaborative vs. Cooperative Learning: The Instructor’s Role in Computer Supported
Collaborative Learning. En: Orvis K. L. y Lassiter A. L.R (eds) Computer-Supported Collaborative
Learning. Information Science Publishing, pp. 20-39, 2007.
7. Onrubia, J., y Engel, A. The role of teacher assistance on the effects of a macro-script in collaborative
writing tasks. Int. Journal of Computer-Supported Collaborative Learning, 7(1): 161-186, 2012.
8. O'Rourke, J. Tutoring in open and distance learning: a handbook for tutors. The Commonwealth of
Learning, 2003
9. Orvis, K., y Lassiter, A. Computer-Supported Collaborative Learning: The Role of the Instructor. En:
Ferris S. y Godar S.H. (eds) Teaching and learning with virtual teams. Information Science Publishing,
pp. 158-179, 2006.
10. Rosé, C., Wang, Y., Cui, Y., Arguello, J., Stegmann, K., Weinberger, A., y Fischer, F. Analyzing collaborative
learning processes automatically: Exploiting the advances of computational linguistics in computer-supported collab-
orative learning. International Journal of Computer-Supported Collaborative Learning, 3 (3): 237—271, 2008.
11. Schwarz, B., y Asterhan, C. E-Moderation of Synchronous Discussions in Educational Settings: A
Nascent Practice. Journal of the Learning Sciences, 20 (3): 395-442, 2011.
12. Shishehchi, S., Banihashem, S., y Mat Zin, N. A Proposed Semantic Recommendation System for E-
Learning. A Rule and Ontology Based E-learning Recommendation System. In Proc. International
Symposium in Information Technology (ITSim), pp. 1-5, 2010.
13. Souali, K., El Afia, A., Faizi, R., y Chiheb, R. A New Recommender System For E-Learning Envi-
ronments. In Proc. Int. Conference on Multimedia Computing and Systems (ICMCS), pp.1-4, 2011.
14. Suh, H., y Lee, A. Collaborative Learning Agent for Promoting Group Interaction. ETRI Journal,
28(4): 461-474, 2006.
15. Varvel, V. Master Online Teacher Competencies. Online Journal of Distance Learning Administration, 10 (1), 2007.