当前位置: X-MOL 学术J. Big Data › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Annotating and detecting topics in social media forum and modelling the annotation to derive directions-a case study
Journal of Big Data ( IF 8.1 ) Pub Date : 2021-02-27 , DOI: 10.1186/s40537-021-00429-7
B. Athira , Josette Jones , Sumam Mary Idicula , Anand Kulanthaivel , Enming Zhang

The widespread influence of social media impacts every aspect of life, including the healthcare sector. Although medics and health professionals are the final decision makers, the advice and recommendations obtained from fellow patients are significant. In this context, the present paper explores the topics of discussion posted by breast cancer patients and survivors on online forums. The study examines an online forum, Breastcancer.org, maps the discussion entries to several topics, and proposes a machine learning model based on a classification algorithm to characterize the topics. To explore the topics of breast cancer patients and survivors, approximately 1000 posts are selected and manually labeled with annotations. In contrast, millions of posts are available to build the labels. A semi-supervised learning technique is used to build the labels for the unlabeled data; hence, the large data are classified using a deep learning algorithm. The deep learning algorithm BiLSTM with BERT word embedding technique provided a better f1-score of 79.5%. This method is able to classify the following topics: medication reviews, clinician knowledge, various treatment options, seeking and providing support, diagnostic procedures, financial issues and implications for everyday life. What matters the most for the patients is coping with everyday living as well as seeking and providing emotional and informational support. The approach and findings show the potential of studying social media to provide insight into patients' experiences with cancer like critical health problems.



中文翻译:

在社交媒体论坛中注释和检测主题,并对注释建模以得出方向-案例研究

社交媒体的广泛影响影响着生活的各个方面,包括医疗保健部门。尽管医务人员和卫生专业人员是最终的决策者,但从其他患者那里获得的建议和建议却很重要。在这种情况下,本文探讨了乳腺癌患者和幸存者在在线论坛上发布的讨论主题。该研究考察了在线论坛Breastcancer.org,将讨论条目映射到多个主题,并提出了一种基于分类算法的机器学习模型来表征主题。为了探讨乳腺癌患者和幸存者的主题,大约选择了1000个帖子,并用注释手动标记。相比之下,数百万个帖子可用于构建标签。半监督学习技术用于为未标记的数据建立标签;因此,使用深度学习算法对大数据进行分类。带有BERT词嵌入技术的深度学习算法BiLSTM提供了更好的f1分数,为79.5%。这种方法能够对以下主题进行分类:用药评论,临床医生知识,各种治疗选择,寻求和提供支持,诊断程序,财务问题以及对日常生活的影响。对患者而言,最重要的是应付日常生活以及寻求和提供情感和信息支持。该方法和发现表明,研究社交媒体的潜力可提供对患者癌症经历(如严重的健康问题)的见解。使用深度学习算法对大数据进行分类。带有BERT词嵌入技术的深度学习算法BiLSTM提供了更好的f1分数,为79.5%。这种方法能够对以下主题进行分类:用药评论,临床医生知识,各种治疗选择,寻求和提供支持,诊断程序,财务问题以及对日常生活的影响。对患者而言,最重要的是应付日常生活以及寻求和提供情感和信息支持。该方法和发现表明,研究社交媒体的潜力可提供对患者癌症经历(如严重的健康问题)的见解。使用深度学习算法对大数据进行分类。带有BERT词嵌入技术的深度学习算法BiLSTM提供了更好的f1分数,为79.5%。这种方法能够对以下主题进行分类:用药评论,临床医生知识,各种治疗选择,寻求和提供支持,诊断程序,财务问题以及对日常生活的影响。对患者而言,最重要的是应付日常生活以及寻求和提供情感和信息支持。该方法和发现表明,研究社交媒体的潜力可提供对患者癌症经历(如严重的健康问题)的见解。这种方法能够对以下主题进行分类:用药评论,临床医生知识,各种治疗选择,寻求和提供支持,诊断程序,财务问题以及对日常生活的影响。对患者而言,最重要的是应付日常生活以及寻求和提供情感和信息支持。该方法和发现表明,研究社交媒体的潜力可提供对患者癌症经历(如严重的健康问题)的见解。这种方法能够对以下主题进行分类:用药评论,临床医生知识,各种治疗选择,寻求和提供支持,诊断程序,财务问题以及对日常生活的影响。对患者而言,最重要的是应付日常生活以及寻求和提供情感和信息支持。该方法和发现表明,研究社交媒体的潜力可提供对患者癌症经历(如严重的健康问题)的见解。对患者而言,最重要的是应付日常生活以及寻求和提供情感和信息支持。该方法和发现表明,研究社交媒体的潜力可提供对患者癌症经历(如严重的健康问题)的见解。对患者而言,最重要的是应付日常生活以及寻求和提供情感和信息支持。该方法和发现表明,研究社交媒体的潜力可提供对患者癌症经历(如严重的健康问题)的见解。

更新日期:2021-02-28
down
wechat
bug