Está en la página 1de 6

See

discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/268189688

Metodologas de anlisis de los big data en las


plataformas educativas

Conference Paper June 2014

CITATIONS READS

0 525

4 authors:

Rocio Martinez-Torres Daniel Gutirrez


Universidad de Sevilla Universidad de Sevilla
78 PUBLICATIONS 729 CITATIONS 58 PUBLICATIONS 200 CITATIONS

SEE PROFILE SEE PROFILE

S.L. Toral Federico Barrero


Universidad de Sevilla Universidad de Sevilla
249 PUBLICATIONS 1,908 CITATIONS 315 PUBLICATIONS 2,388 CITATIONS

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

EXTENSION OF THE SECURITY OPERATION AREA OF 5 PHASE INDUCTION MOTOR DRIVES View project

All content following this page was uploaded by Federico Barrero on 13 November 2014.

The user has requested enhancement of the downloaded file. All in-text references underlined in blue are added to the original document
and are linked to publications on ResearchGate, letting you access and read them immediately.
Metodologas de Anlisis de los Big Data en las
Plataformas Educativas
M. R. Martinez-Torres, D. G. Reina, S. L. Toral, F. Barrero
Universidad de Sevilla, Espaa

AbstractLa proliferacin de nuevas plataformas informacin no puede extraerse directamente, sino que es
educativas por Internet y el avance de la educacin online necesario aplicar metodologas como el anlisis de redes
ha abierto nuevas posibilidades de anlisis debido al gran sociales [3] o el procesamiento del lenguaje natural para
volumen de datos generados y almacenados en los materializar dicha informacin en datos procesables [4].
servidores. Los usuarios dejan trazas de su actividad, y esta El artculo se estructura de la siguiente forma: en primer
actividad posibilita nuevos anlisis del comportamiento de lugar, se parte de un anlisis de la informacin relevante
estudiantes y de los contenidos compartidos, difcilmente en las plataformas educativas. Se trata de determinar qu
realizables en la educacin cara a cara tradicional. Este informacin es relevante desde el punto de vista
trabajo aporta un resumen de las diversas metodologas educativo, y cules son los principales retos en la
aplicables a los grandes volmenes de datos generados por
extraccin de esta informacin. La siguiente seccin
las plataformas educativas, clasificables dentro de los Big
presenta las diferentes metodologas que permiten
Data, as como los diversos campos en los que podran
transformar la informacin relevante en datos
aplicarse y las mejoras que podran introducir en el
estructurados, as como las principales metodologas
desarrollo de las propias herramientas.
estadsticas relacionadas con el EDM. En lo que respecta a
Index TermsBig Data, metodologas de anlisis, la participacin de los usuarios, se muestra como modelar
participacin, contenido compartido. las interacciones de los usuarios como una red social, las
principales caractersticas topolgicas locales y globales
que pueden extraerse de dicha red y su aproximacin a
I. RESUMEN modelos de redes complejas. En la parte de conocimiento
compartido, se detallan las principales tcnicas de anlisis
El anlisis de los grandes volmenes de datos
semntico para analizar el conocimiento creado y
disponibles online se ha convertido en una ciencia
compartido. Finalmente, la seccin IV detalla los
emergente que suele aglutinarse bajo la denominacin de
principales retos futuros y la seccin V las conclusiones.
anlisis de los Big Data [1]. La captura de datos no
estructurados por la Web y su anlisis se ha convertido en
una herramienta clave y estratgica para la toma de II. INFORMACIN DISPONIBLE EN LAS PLATAFORMAS
decisiones y la asignacin de recursos en muchas reas, EDUCATIVAS
como la gestin empresarial, la inteligencia, los servicios La informacin disponible por las instituciones de
de defensa, o las decisiones de autoridades pblicas [2]. educacin superior a travs de sus bases de datos y,
Muchas compaas como Microsoft, IBM, Google, o fundamentalmente, a travs de sus plataformas educativas
Amazon realizan fuertes inversiones con el fin de generar y campus virtuales permite la realizacin de nuevos
valor a partir del anlisis de los Big Data. No obstante, en anlisis ms complejos, ms all de la informacin
el terreno educativo todava no han proliferado demasiado recopilada sobre la base de cuestionarios. Esta
este tipo de anlisis, a pesar de ser un mbito donde las informacin se caracteriza por ser abundante, accesible,
herramientas online y las plataformas de enseanza han pero en muchos casos no estructurada, lo que hace
tenido un rpido y temprano auge, mucho antes que en necesario un anlisis previo que transforme la informacin
otras reas mencionadas. en datos. A continuacin se distinguen cuatro tipos de
El anlisis de grandes volmenes de datos en el mbito fuentes de informacin sobre las que llevar a cabo estos
educativo suele denominarse EDM (Educational Data anlisis.
Mining) o LA (Learning Analytics), y su objetivo es
promover nuevos descubrimientos y avances en el terreno A. Perfiles de estudiantes
educativo mediante el uso de la informacin almacenada Las instituciones de educacin superior poseen en sus
online. Contempla mltiples dimensiones, i.e., social, bases de datos una amplia informacin sobre los perfiles
cognitiva, emocional, meta cognitiva, etc. y se centra en de los estudiantes, as como de toda su vida acadmica,
individuos, grupos de individuos o instituciones. En este desde que realizan su ingreso. Esta informacin se usa
contexto, el objetivo principal del trabajo es presentar las habitualmente a efectos de clasificacin y categorizacin.
principales metodologas aplicables en el terreno de los Por ejemplo, para clasificar los perfiles de los estudiantes
EDM y LA para transformar informacin en datos matriculados, o determinar las tasas de finalizacin o
estadsticamente analizables. Aunque gran parte de la abandono. No obstante, ms raramente suelen utilizarse
informacin relevante puede obtenerse directamente de estos datos para estimacin o prediccin. Por ejemplo,
los archivos de log de los servidores educativos o de las para predecir la tasa de abandono de alumnos, estimar el
bases de datos de usuarios registrados, existe otra nmero de matriculados [5]. Una aplicacin
informacin de gran inters en las plataformas educativas particularmente interesante consiste en determinar la
como es la interaccin entre los usuarios, sus patrones de probabilidad que un determinado perfil de estudiante
participacin o el conocimiento compartido. Esta ingrese en una u otra carrera, lo que servira apara
determinar el grado de aceptacin de una titulacin [6].
B. Informacin sobre el aprendizaje cabo agentes para la realizacin de acciones tutoriales
En la ltima dcada, la prctica totalidad de automticas, identificando de forma inteligente las
instituciones de educacin superior han incorporado preguntas del alumno [13]. Estas mismas tcnicas pueden
plataformas de gestin del aprendizaje (LMS, Lerning tambin utilizarse para evaluar a los alumnos, ms all de
Management Systems) como parte de sus campus respuestas tipo test. En general, es posible realizar estas
virtuales. Si bien el objetivo de estas plataformas es evaluaciones cuando se trata de respuestas cortas con
mejorar el rendimiento y la efectividad en el proceso de construcciones gramaticales sencillas [14].
enseanza y servir como apoyo al desarrollo de Otra aplicacin interesante del procesamiento del
asignaturas, tambin pueden proporcionar una gran lenguaje natural se refiere a la clasificacin de textos en
cantidad de informacin debido a la traza que los general, y el anlisis de sentimiento en particular. El
estudiantes dejan al utilizar sus recursos. Los archivos log anlisis de sentimiento es la deteccin y clasificacin de
de los servidores web permiten almacenar datos diversos textos atendiendo a un tipo de actitud, en su forma ms
sobre la actividad de los usuarios. Por ejemplo, el tiempo simple positiva o negativa, hacia el objeto de dicho texto
que el estudiante pasa realizando una determinada tarea, el [15]. Esto puede ser interesante para evaluar no ya las
aprovechamiento de ese tiempo segn las interacciones respuestas de conocimiento de los alumnos, sino los
que el estudiante haya realizado, el nmero de veces que comentarios compartidos en foros de discusin. En
el estudiante se conecta a la plataforma para la realizacin particular, analizar las actitudes positivas o negativas
de las tareas asignadas, etc. Estos datos permiten modelar hacia la materia o parte de ella, o hacia determinadas
el comportamiento de los estudiantes durante su herramientas o pruebas.
aprendizaje. A diferencia de los mtodos tradicionales,
que requieren de observacin directa o de una grabacin III. METODOLOGAS DE ANLISIS
en video, los datos anteriores pueden obtenerse fcilmente Las principales tcnicas relacionadas con la minera de
de los registros de los servidores y no son intrusivos. En datos educativos y anlisis del aprendizaje se describen a
esta lnea se han identificado aplicaciones de la minera de continuacin siguiendo la clasificacin propuesta en [16].
datos en la exploracin y anlisis de los datos alojados en
el LMS [7], identificacin de patrones [8], y evaluacin de A. Tcnicas estadsticas predictivas
la actividad del estudiante dentro de la plataforma para la
Las tcnicas estadsticas predictivas tienen como
identificacin de estilos de aprendizaje [9], entre otras.
objetivo predecir el comportamiento de un aspecto de los
Tambin permiten la visualizacin del aprendizaje en
datos (variable dependiente) como combinacin del resto
forma de curvas de aprendizaje, que representan las
de caractersticas (variables independientes). Las tcnicas
mejoras en el aprendizaje de una habilidad o aptitud del
predictivas se basan esencialmente en regresiones y
estudiante frente al nmero de oportunidades de entrenar
clasificaciones supervisadas. Normalmente estas tcnicas
esa habilidad o aptitud [10].
se aplican para predecir el rendimiento acadmico de los
C. Interacciones alumnos. Por ejemplo, establecer modelos predictores
sobre el ndice de aprobados de un curso, sobre su nota
Una de las principales ventajas de las plataformas de media, o predecir el tiempo que un estudiante tardar en
gestin del aprendizaje es que facilita de manera virtual completar una tarea. Relacionado con lo anterior son los
las interacciones entre los alumnos y de stos con el clasificadores y rboles de decisin, que tambin pueden
profesor. Estas interacciones tambin constituyen una utilizarse para clasificar grupos de alumnos o predecir su
fuente de informacin. En primer lugar, proporcionan nota final [17], [18]. No obstante, las tcnicas predictivas
informacin sobre el grado de participacin del alumno, tambin pueden utilizarse para predecir si el alumno posee
que puede usarse a efectos de evaluacin. Pero tambin una determinada aptitud o competencia. Esto es lo que se
permite descubrir patrones de comportamiento de los conoce como estimacin de conocimiento latente, llamado
alumnos y su organizacin informal modelando las as porque el conocimiento no es una variable
interacciones como una red social [11]. Mediante tcnicas directamente observable. En este caso, algoritmos como el
de anlisis de redes sociales, pueden descubrirse conocido Bayesian Knowledge Tracing tratan de
caractersticas locales de los usuarios y globales de la red. determinar en qu medida un estudiante conoce una
Por ejemplo, qu alumnos ocupan las posiciones ms determinada aptitud o habilidad a partir de su rendimiento
centrales, en qu medida las interacciones con otros pasado con esa habilidad [19]. Esta informacin resulta de
alumnos facilitan el aprendizaje, o cul es el grado de gran utilidad para determinar en qu medida una
cohesin dentro de un curso. plataforma educativa cumple con su objetivo, para
informar a los profesores o incluso para realizar acciones
D. Contenido correctoras pedaggicas de manera automtica.
Las interacciones de los alumnos normalmente tienen
lugar en forma de texto escrito, que queda almacenado en B. Descubrimiento de estructuras
los servidores para su posterior anlisis. Este texto se El objetivo en este caso es el descubrimiento de
puede analizar algortmicamente mediante tcnicas de estructuras y patrones en los datos capturados. Abarca los
procesamiento del lenguaje natural, integrando los diversos algoritmos de clustering y el anlisis factorial. En
resultados dentro de las propias plataformas o entornos el caso de los entornos educativos, los algoritmos de
educativos. Por ejemplo, existen numerosos trabajos clustering permiten clasificar a los alumnos segn una
enfocados a hacer herramientas de e-learning determinada caracterstica y ver la evolucin de su
personalizadas mediante la incorporacin de aprendizaje en el tiempo [20]. A diferencia de los
recomendaciones, acciones correctoras o resolucin algoritmos de clustering, que tratan de encontrar
automtica de preguntas analizando los contenidos agrupaciones dentro de una nube de puntos, el anlisis
generados por el alumno [12]. Tambin se han llevado a factorial se basa en realizar agrupaciones de variables para
determinar un conjunto reducido de variables latentes, clave para el buen desarrollo del trabajo, qu papel
obtenidas como combinacin lineal de las variables desempea el profesor dentro de la red o cul es el grado
originales. En general, se utiliza para reducir la de cohesin de los alumnos matriculados en un curso.
dimensionalidad del problema. Por ejemplo, es posible Las redes sociales tambin se estudian desde la
identificar muchas variables que caractericen el perspectiva de los modelos de redes complejas. Por lo
comportamiento de los estudiantes, o tener una taxonoma general, los foros en Internet se comportan como redes de
muy elevada de caractersticas que deben poseer las escala libre, donde las contribuciones de los usuarios
herramientas de e-learning. En lugar de trabajar con un siguen una distribucin en ley de potencias [27]. Esto
elevado nmero de caractersticas, estas pueden agruparse significa que la mayor parte de las contribuciones las
en unos factores latentes, reduciendo la dimensionalidad realizan un reducido nmero de usuarios, que es lo que se
del problema final [21]. conoce como desigualdad participativa [28].
C. Minera de relaciones E. Procesamiento del lenguaje natural
La minera de relaciones trata sobre el descubrimiento El procesamiento del lenguaje natural es un conjunto de
de las relaciones entre las variables dentro de un conjunto tcnicas algortmicas para analizar el lenguaje humano. La
extenso de datos. La forma ms simple de minera de aproximacin ms sencilla consiste en partir de un
relaciones son las correlaciones. Un paso ms all son las conjunto de trminos o palabras clave que representen una
relaciones de causalidad. La minera causal trata de taxonoma de un campo de conocimiento, y a partir de l
generar mtodos eficientes para descubrir las relaciones generar una matriz de incidencia trminos documentos,
causales en bases de datos observacionales. Las relaciones donde cada celda de la matriz contenga el nmero de
de causalidad son diferentes a las de prediccin ya veces que cada trmino aparece en cada documento. El
descritas. El hecho de que dos eventos covaren no modelo de espacio de vectores [29] considera un espacio
significa que exista una relacin causal entre ellos. Las de tantas dimensiones como trminos o documentos, y las
relaciones de causalidad intentan dar respuesta a preguntas similitudes de trminos o documentos se calculan
como qu comportamiento de los estudiantes causa el mediante la proximidad de los vectores fila o columna de
aprendizaje, o qu ocurre sin una accin tutorial matriz anterior (por ejemplo, mediante el coseno del
suministra algunas pistas tras un error [22]. La minera de ngulo entre dos vectores). El principal problema de esta
reglas de asociacin busca encontrar automticamente tcnica es que cuando se trabaja con muchos documentos,
reglas del tipo "if-then" dentro de grandes volmenes de la dimensionalidad es muy elevada, y la mayora de los
datos. Las reglas de asociacin implican causalidad, pero elementos de la matriz son ceros. Una alternativa consiste
sta puede ir en ambos sentidos. En entornos educativos, en reducir esta alta dimensionalidad proyectando los
puede servir para descubrir por ejemplo asociaciones entre trminos o los documentos en un subespacio en el que la
cursos que cursan los estudiantes, o asociaciones entre los estructura semntica resulta ms clara. En este subespacio
pasos que siguen para completar un problema. Como caso se pueden aplicar las mismas medidas de similitud de
particular de lo anterior, la minera de patrones trminos o documentos con resultados ms fcilmente
secuenciales es la minera de patrones que ocurren interpretables [30]. Uno de los algoritmos de reduccin de
frecuentemente relacionados al tiempo u otras secuencias. dimensionalidad ms populares es el conocido como
Por ejemplo, descubrir una secuencia temporal de anlisis semntico latente (LSA, Latent Semantic
acciones de los usuarios cuando interactan con una Analysis), que descompone la matriz trminos
herramienta de e-learning [23]. documentos mediante una descomposicin en valores
singulares, quedndose con las dimensiones
D. Anlisis de redes sociales correspondientes a los autovalores ms elevados [31].
El anlisis de redes sociales consiste en modelar una La clasificacin de textos es otra de las aplicaciones
comunidad como un grafo, donde los nodos representan a ms habituales en el procesamiento del lenguaje natural.
los usuarios identificados por un email o un alias y los La clasificacin consiste en asignar documentos a un
arcos las interacciones entre los usuarios. Mediante el conjunto predefinido de clases, normalmente, mediante
anlisis de redes sociales se puede modelar la algoritmos de aprendizaje supervisado. Un caso particular
participacin de los alumnos en una plataforma de de la clasificacin de texto es el anlisis de sentimiento,
aprendizaje, o los trabajos colaborativos entre ellos. Cada que consiste en detectar actitudes de los textos hacia
nodo como miembro de la red social posee una serie de objetos o personas, dentro de un conjunto pre definido de
caractersticas topolgicas, como el grado (nmero de clases. En su forma ms simple, el anlisis de sentimiento
arcos que inciden o salen del nodo), su centralidad (de identifica la actitud positiva o negativa de los textos.
intermediacin, cercana, de autovalor) o su coeficiente de
clustering [24]. La propia red considerada en su conjunto En el mbito educativo, el procesamiento del lenguaje
tambin posee caractersticas medibles, como su tamao natural tiene inters en el anlisis de las discusiones online
(nmero de nodos), el dimetro de la red o su ASP a travs de foros [32] as como el anlisis de los
(Average Shortest Path). Asimismo, las caractersticas sentimientos y emociones de los usuarios [33].
locales de los nodos se pueden promediar para toda la red
dando lugar a un grado, centralidad o coeficiente de IV. FUTUROS RETOS
clustering global de la red. Todas estas caractersticas La proliferacin y constante desarrollo de las
pueden utilizarse para detectar determinado perfiles de plataformas educativas en Internet esta cambiando no slo
usuarios o identificar grupos o subcomunidades dentro de el papel desarrollado por los alumnos o usuarios, sino
la red global [25], [26]. Por ejemplo, qu tipo de tambin el de los docentes. Los usuarios de estos sistemas
participacin desempea cada alumno en trabajos han pasado de ser simples espectadores a usuarios activos
colaborativos, cules son los que ocupan una posicin con capacidad de decidir sobre su propio aprendizaje. Al
mismo tiempo, estas interacciones de los usuarios con las semantic analysis", Behaviour & Information Technology, Vol.
plataformas educativas generan un elevado volumen de 32, Iss. 6, pp. 532-544, 2013.
informacin, que queda almacenado y disponible para su [5] S. Kotsiantis, K. Patriarcheas, M. Xenos, "A combinational
incremental ensemble of classifiers as a technique for predicting
posterior anlisis. La aplicacin de tcnicas de data students performance in distance education", Knowledge-Based
mining y de anlisis sobre estos datos posibilita la Systems, Vol. 23, Iss. 6, pp. 529535, 2010.
realizacin de nuevos descubrimientos sobre patrones de [6] Z. Kovacic, "Early Prediction of Student Success: Mining
comportamiento de los usuarios. Mediante ellos, los Students Enrolment Data", Proceedings of Informing Science &
docentes tambin pueden detectar y rastrear nuevos IT Education Conference (InSITE2010), pp. 647-665, 2010.
problemas y aplicar las posibles correcciones que podran [7] R. Mazza, C. Milani, Exploring usage analysis in learning
mejorar el proceso de enseanza/aprendizaje. systems: Gaining insights from visualisations. Workshop on
Usage analysis in learning systems at 12th International
En los prximos aos, el campo de anlisis de los Big Conference on Artificial Intelligence in Education, pp. 1-6. Nueva
Data en entornos educativos ir progresivamente York, 2005.
alcanzando su madurez, lo que a su vez plantea nuevos [8] L. Talavera, E. Gaudioso, Mining student data to characterize
retos. En primer lugar, los Big data educativos sern cada similar behavior groups in unstructured collaboration spaces. Proc.
vez mayores, lo que supondr modificar el 16th European Conf. Artificial Intelligence (ECAI), 2004.
almacenamiento y procesamiento computacional de los [9] E. Mor, J. Minguilln, E-learning personalization based on
datos. A diferencia de lo que ocurra con mtodos itineraries and long-term navigational behavior. Proceedings of the
tradicionales de anlisis mediante encuestas, los datos 13th international world wide web conference, 2004.
pasarn de ser un recurso escaso a un recurso abundante, o [10] S. Ritter, J. R. Anderson, K. R. Koedinger & A. Corbett,
incluso sobre abundante. Esto tambin significa que un "Cognitive Tutor: Applied research in mathematics education".
Psychological Bulletin & Review, Vol. 14, Iss. 2, pp. 249-255,
mayor nmero de investigadores comenzar a trabajar en 2007.
estos temas, al existir menos barreras de entrada. Desde un [11] C. Reffay, T. Chanier, Social Network Analysis Used for
punto de vista metodolgico, las tcnicas de prediccin e Modelling Collaboration in Distance Learning Groups, Intelligent
inferencia estadstica sern cada vez ms utilizadas, Tutoring Systems, Lecture Notes in Computer Science, Vol. 2363,
abordando no slo cuestiones tcnicas, sino tambin pp 31-40, 2002.
implicaciones sociales. Por ltimo, la interactividad cada [12] O. C. Santos, J. G. Boticario, D. Prez-Marn, Extending web-
vez mayor de las herramientas educativas y la popularidad based educational systems with personalised support through User
de las redes sociales provocarn que las tcnicas de Centred Designed recommendations along the e-learning life
cycle, Science of Computer Programming, doi:
anlisis de redes sociales y de procesamiento del lenguaje 10.1016/j.scico.2013.12.004, 2014.
natural sean cada vez ms populares. Por una parte, estas [13] K. S. Song, X. Hu, A. Olney, A. C. Graesser, A framework of
tcnicas permitirn el anlisis cuantitativo de elementos synthesizing tutoring conversation capability with web-based
intangibles como la participacin y el conocimiento distance education courseware, Computers & Education, Vol. 42,
compartido. Pero por otra parte, la utilizacin de datos e Iss. 4, pp. 375388, 2004.
informacin volcada por los usuarios tambin plantea [14] R. J. Mislevy, J. T. Behrens, K. E. Dicerbo, & R. Levy, Design
nuevos problemas ticos y de confidencialidad. and discovery in educational assessment: evidence-centered
design, psychometrics, and educational data mining. Journal of
Educational Data Mining, Vol. 4, Iss. 1, pp. 1148, 2012.
V. CONCLUSIONES
[15] A. Abbasi, H. Chen, A. Salem, Sentiment analysis in multiple
El objetivo del artculo es revisar las metodologas de languages: Feature selection for opinion classification in Web
anlisis de los Big Data en entornos educativos, partiendo forums, ACM Transactions on Information Systems, Vol. 26, Iss.
de las fuentes de informacin para a continuacin abordar 33, no. 12, 2008.
las tcnicas de procesamiento ms relevantes. El objetivo [16] R.S. Baker, K. Yacef, The State of Educational Data Mining in
2009: A Review and Future Visions. Journal of Educational Data
comn es poner en valor una informacin que ya existe Mining, Vol. 1, no. 1, pp. 3-17, 2009.
almacenada en los servidores, y con la que se puede [17] J. Mostow, J. Gonzlez-Brenes, & B. H. Tan, Learning classifiers
mejorar apreciablemente la efectividad de los procesos de from a relational database of tutor logs. Proceedings of the 4th
aprendizaje. international conference on educational data mining, pp. 149158,
2011.
ACKNOWLEDGEMENTS [18] J. Mccuaig, J. & Baldwin, Identifying successful learners from
interaction behaviour. In Proceedings of the 5th international
Este trabajo ha sido financiado por la Consejera de conference on educational data mining, pp. 160163, 2012.
Economa, Innovacin, Ciencia y Empleo, Junta de [19] Z. A. Pardos & N. T. Heffernan, Navigating the parameter space
Andaluca (Proyecto de Excelencia referencia P12-SEJ- of bayesian knowledge tracing models: visualizations of the
328). convergence of the expectation maximization algorithm. In
Proceedings of the 3rd international conference on educational
REFERENCES data mining, pp. 161170, 2010.
[20] R. Nugent, N. Dean, & E. Ayers, Skill set profile clustering: the
[1] S. Fiore, A. DAnca, C. Palazzo, I. Foster, D.N. Williams, G. empty kmeans algorithm with automatic specification of starting
Aloisio, Ophidia: Toward Big Data Analytics for eScience, cluster centers. Proceedings of the 3rd international conference on
Procedia Computer Science, Vol. 18, pp. 2376-2385, 2013. educational data mining, pp. 151160, 2010.
[2] H. Chen, R. H. Chiang, V. C. Storey, "Business Intelligence and [21] C. Patarapichayatham, A. Kamata, & S. Kanjanawasee, Evaluation
Analytics: From Big Data to Big Impact", MIS Quarterly, Vol. 36, of model selection strategies for cross-level two-way differential
no. 4, pp. 1165-1188, 2012. item functioning analysis. Educational and Psychological
[3] S. L. Toral, M. R. Martnez-Torres, F. Barrero, "Analysis of Measurement, Vol. 72, Iss. 1, pp. 4451, 2012.
Virtual Communities supporting OSS Projects using Social [22] B. Shih, K. Koedinger, and R. Scheines, Optimizing Student
Network Analysis", Information and Software Technology, Vol. Models for Causality. Proceedings of the 13th International
52, Iss. 3, pp. 296-303, 2010. Conference on Artificial Intelligence in Education, Los Angeles,
[4] M.R. Martnez-Torres, S. L. Toral, F. Barrero, D. Gregor, "A text California, USA, 2007.
categorisation tool for open source communities based on
[23] J. Sabourin, J. Rowe, B. Mott, J. Lester, When Off-Task in On- Linux, Journal of Universal Computer Science, Vol. 15, no. 3, pp.
Task: The Affective Role of Off-Task Behavior in Narrative- 648664, 2009.
Centered Learning Environments. Proceedings of the 15th [29] G. Salto, and M. J. McGill, An Introduction to Modern
International Conference on Artificial Intelligence in Education, Information Retrieval, McGraw-Hill, New York, 1983.
534-536, 2011.
[30] D. Cai, X. He, and J. Han, Document Clustering Using Locality
[24] M. R. Martinez-Torres, A Genetic Search of Patterns of Behaviour Preserving Indexing, IEEE Transactions on Knowledge and Data
in OSS Communities, Expert systems with applications, Vol. 39, Engineering, Vol. 17, Iss. 12, pp. 1624-1637, 2005.
no. 18, pp. 13182-13192, 2012.
[31] S. Deerwester, S. T. Dumais, G. W. Furnas, T. K. Landauer, and
[25] S.L. Toral, M.R. Martnez-Torres, F. Barrero, Analysis of Virtual R. Harshman,. Indexing by latent semantic analysis, Journal of the
Communities supporting OSS Projects using Social Network American Society of Information Science, Vol. 41, Iss. 6, pp. 391
Analysis, Information and Software Technology, Vol. 52, Iss. 3, 407, 1990.
pp. 296-303, 2010.
[32] G. Dyke, D. Adamson, I. Howley, & C. P. Ros, Enhancing
[26] S.L. Toral, M.R. Martnez-Torres, F. Barrero, Virtual scientific reasoning and explanation skills with conversational
Communities as a resource for the development of OSS projects: agents. IEEE Transactions on Learning Technologies, Vol. 6, Iss.
the case of Linux ports to embedded processors, Behaviour and 3, pp. 240247, 2013.
Information Technology, Vol. 28, Iss. 5, pp. 405-4119, 2009.
[33] S. K. D'Mello, S.D. Craig, A. W. Witherspoon, B. T. McDaniel,
[27] S. Valverde, G. Theraulaz, J. Gautrais, V. Fourcassie, R.V. Sole, and A. C. Graesser, Automatic Detection of Learners Affect from
Self-organization patterns in wasp and open source communities, Conversational Cues. User Modeling and User-Adapted
IEEE Intelligent Systems, Vol. 21, Iss. 2, pp. 36-40, 2006. Interaction, Vol. 18, Iss. 1-2, pp. 45-80, 2008.
[28] S.L. Toral, M.R. Martnez-Torres, F. Barrero, Modelling mailing
list behaviour in open source projects: the case of ARM embedded

View publication stats

También podría gustarte