当前位置: X-MOL 学术Arab. J. Sci. Eng. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Deep Learning for Discussion-Based Cross-Domain Performance Prediction of MOOC Learners Grouped by Language on FutureLearn
Arabian Journal for Science and Engineering ( IF 2.9 ) Pub Date : 2021-01-06 , DOI: 10.1007/s13369-020-05117-x
Ismail Duru 1 , Ayse Saliha Sunar 2 , Su White 3 , Banu Diri 4
Affiliation  

Analysing learners’ behaviours in MOOCs has been used to identify predictive features associated with positive outcomes in engagement and learning success. Early methods predominantly analysed numerical features of behaviours such as the page views, video views, and assessment grades. Analysing extracted numeric features using baseline machine learning algorithms performed well to predict the learners’ future performance in MOOCs. We propose categorising learners by likely English language proficiency and extending the range of data to include the content of comment texts. We compare results to a model trained with a combined set of extracted features. Not all platforms provide this rich variety of data. We analysed a series of a FutureLearn language focused MOOCs. Our data were from discussions embedded into each lesson’s content. Analysing whether we gained any additional insights, over 420,000 comments were used to train the algorithm. We created a method for identifying one’s possible first language from their country. We found that using comments alone is a weaker predictive approach than using a combination including extracted features from learners’ activities. Our study contributes to research on generalisability of learning algorithms. We replicated the method across different MOOCs—the performance varies on the model though it always remained over 50%. One of the deep learning architecture, Bidirectional LSTM, trained with discussions on the language learning 73% successfully predicted learners’ performance on a different MOOC.



中文翻译:

深度学习在 FutureLearn 上按语言分组的 MOOC 学习者的基于讨论的跨域性能预测

分析学习者在 MOOC 中的行为已被用于识别与参与和学习成功的积极成果相关的预测特征。早期的方法主要分析行为的数值特征,例如页面浏览量、视频浏览量和评估等级。使用基线机器学习算法分析提取的数字特征可以很好地预测学习者在 MOOC 中的未来表现。我们建议按可能的英语语言能力对学习者进行分类,并扩大数据范围以包括评论文本的内容。我们将结果与使用一组提取特征组合训练的模型进行比较。并非所有平台都提供如此丰富的数据。我们分析了一系列以 FutureLearn 语言为重点的 MOOC。我们的数据来自嵌入每节课内容的讨论。分析我们是否获得了任何额外的见解,超过 420,000 条评论用于训练算法。我们创建了一种方法来识别一个人可能来自他们国家的第一语言。我们发现单独使用评论的预测方法比使用包括从学习者活动中提取的特征的组合要弱。我们的研究有助于研究学习算法的通用性。我们在不同的 MOOC 中复制了该方法——模型的性能各不相同,但始终保持在 50% 以上。深度学习架构之一,双向 LSTM,通过讨论语言学习进行训练,73% 的人成功预测了学习者在不同 MOOC 上的表现。我们创建了一种方法来识别一个人可能来自他们国家的第一语言。我们发现单独使用评论的预测方法比使用包括从学习者活动中提取的特征的组合要弱。我们的研究有助于研究学习算法的通用性。我们在不同的 MOOC 中复制了该方法——模型的性能各不相同,但始终保持在 50% 以上。深度学习架构之一,双向 LSTM,通过讨论语言学习进行训练,73% 的人成功预测了学习者在不同 MOOC 上的表现。我们创建了一种方法来识别一个人可能来自他们国家的第一语言。我们发现单独使用评论的预测方法比使用包括从学习者活动中提取的特征的组合要弱。我们的研究有助于研究学习算法的通用性。我们在不同的 MOOC 中复制了该方法——模型的性能各不相同,但始终保持在 50% 以上。深度学习架构之一,双向 LSTM,通过讨论语言学习进行训练,73% 的人成功预测了学习者在不同 MOOC 上的表现。我们的研究有助于研究学习算法的通用性。我们在不同的 MOOC 中复制了该方法——模型的性能各不相同,但始终保持在 50% 以上。深度学习架构之一,双向 LSTM,通过讨论语言学习进行训练,73% 的人成功预测了学习者在不同 MOOC 上的表现。我们的研究有助于研究学习算法的通用性。我们在不同的 MOOC 中复制了该方法——模型的性能各不相同,但始终保持在 50% 以上。深度学习架构之一,双向 LSTM,通过讨论语言学习进行训练,73% 的人成功预测了学习者在不同 MOOC 上的表现。

更新日期:2021-01-06
down
wechat
bug