当前位置: X-MOL 学术bioRxiv. Bioinform. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
bioRxiv预印本版图的语言分析
bioRxiv - Bioinformatics Pub Date : 2021-05-25 , DOI: 10.1101/2021.03.04.433874
David N. Nicholson , Vincent Rubinetti , Dongbo Hu , Marvin Thielk , Lawrence E. Hunter , Casey S. Greene

预印本可让研究人员在经过同行评审之前将其发现提供给科学界。关于bioRxiv中预印本的研究主要集中在文章元数据以及这些预印本在网上下载,引用,发布和讨论的频率。bioRxiv预印本存储库中包含的语言是尚待检查的缺失元素。我们试图将bioRxiv预印本中的语言功能与已发表的生物医学文本进行比较和对比,因为这是检查同行评审如何更改这些文档的绝好机会。最流行的功能似乎与排版和补充部分或其他文件的提及有关。除了文字比较之外,我们创建了从预打印训练的word2vec模型派生的文档嵌入。我们发现,这些嵌入能够解析出不同的科学方法和概念,链接未注释的预印本同行评审的文章对,并确定将语言相似的论文发表到给定的预印本的期刊。我们还使用这些嵌入来检查与发布第一张预印本到出现同行评审出版物之间所经过的时间相关的因素。我们发现,印有更多版本的预印本和更多的文本更改花费了更长的出版时间。最后,我们构建了一个Web应用程序(https://greenelab.github。



"点击查看英文标题和摘要"

更新日期:2021-05-26
down
wechat
bug