当前位置 : X-MOL首页行业资讯 › “别扭词组”揭示“问题文章”

“别扭词组”揭示“问题文章”

前不久在Nature 上看到这样一则新闻“‘Tortured phrases' give away fabricated research papers ”[1]本君觉得颇有意味,值得深思。


事件的起因是法国图卢兹大学的Guillaume Cabanac课题组在一些计算机科学类期刊中发现有的研究人员会使用一些读起来非常别扭的词组来表达或替代那些已经被广泛认可的专业术语。[2] 比如,用“counterfeit consciousness”代替“artificial intelligence”,用“colossal information”代替“big data”等。这话怎么说呢,当我们都对“人工智能”、“大数据”这些词耳熟能详的时候,突然有人跟你说“假冒意识”、“巨大信息”这样的词汇,你不觉得别扭吗?你不觉得有问题吗?你会不会骂一句“这是人话吗?”


怀疑不无道理,这文章还真可能不是人写的。


Guillaume Cabanac课题组表示,进一步调查发现这些别扭的词组很可能来自软件,可能是自动翻译也可能是为了掩饰抄袭痕迹人为修改。顺便提个醒,关于AI编写文章甚至SCI论文的报道早就屡见不鲜了 [3,4]。这些别扭词组是否出自AI还不得而知。作者总结了一下这些计算机科学领域的常见别扭词组如下表所示。

图片来源:Nature [1]


他们在数据库中对30多个别扭词组进行了检索,发现860多篇文章包含至少一个别扭词组,涉及数百本期刊。更触目惊心的是,有500篇左右都集中在一个期刊Microprocessors and Microsystems。进一步的分析显示,2021年2月之后发表的论文,从投稿到接受时间平均下来只有该日期之前那些论文的五分之一,这些论文中一部分还具有相同的提交、修订和接受日期,其中大部分出现在该期刊的特刊(special issue)中。由于对这期刊不甚了解,本君好奇之下就搜了一下,结果似乎窥探到了某些端倪。“主编收稿”、“1个月录用”……你们品,你们细品。


Microprocessors and Microsystems 所属出版商爱思唯尔公司已经对此事展开调查,目前尚无确切结论。7月中旬,爱思唯尔对该杂志的六个特刊中出现的400多篇论文表示了关切(expressions of concern),受影响的特刊中的论文正在一一被“独立重新评估”,一旦调查结束,该杂志将进一步更新其状态。此外,调查发现,这些作者很可能使用逆向翻译软件来掩饰抄袭,这可能造就了这些不是人话的别扭词组。


在此之前,学术论文中图片使用问题一直是各种学术不端现象爆雷的重灾区。Elisabeth Bik博士这些年来一直在甄别学术论文中的图片数据问题,其涉及的领域包括但不局限于生物医学领域。其创办的网站pubpeer.com对那些不严谨的论文作者简直有如“封神榜”般的存在,一旦自己的文章榜上有名,那可真是摊上大事儿了。

图片来自pubpeer.com


Elisabeth Bik博士一直致力于从图片找问题,哪怕是“图片误用”都难逃她的法眼。Guillaume Cabanac课题组则告诉我们从那些别扭词组也可能会寻得蛛丝马迹。这要是双剑合璧,可能会有更多的问题论文被曝光于天下。


要说这别扭词组怎么来的,估计大伙都明白。各位同学,本君在此强烈建议大家论文要自己写,包括背景综述、实验步骤乃至致谢,切莫大段拷贝、洗稿甚至抄袭。身处大数据时代,互联网有记忆,无论是研究论文还是毕业论文都会被记录下来,谁也不知道自己毕业十几年甚至几十年之后是否会成为领导专家、行业精英或公众人物,别到时候因为致谢雷同、综述重复给自己招惹是非。自己曾经的研究结论被岁月证伪并不可怕,科学总要进步,但要是论文数据或者内容被他人证伪证重才是真要命。


参考资料:

1.‘Tortured phrases' give away fabricated research papers. Nature2021596, 328-329, DOI: 10.1038/d41586-021-02134-0

https://www.nature.com/articles/d41586-021-02134-0 

2. Tortured phrases: A dubious writing style emerging in science. Evidence of critical issues affecting established journals

https://arxiv.org/abs/2107.06751 

3. Robo-writers: the rise and risks of language-generating AI

https://www.nature.com/articles/d41586-021-00530-0 

4. Language Models are Few-Shot Learners

https://arxiv.org/abs/2005.14165 


(本稿件有乐只君子供稿)


如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOLx-mol.com ), 未经许可,谢绝转载!

阿拉丁
动态系统的数学与计算机建模
热点论文一站获取
购书送好礼
天然纤维材料
口腔微生物
英语语言编辑翻译加编辑
材料学领域约200份+SCI期刊
定位全球科研英才
中国图象图形学学会合作刊
东北石油大学合作期刊
动物源性食品遗传学与育种
专业英语编辑服务
左智伟--多次发布
多次发布---上海中医药
广州
天大
清华
清华
北大
上海交大
中科院
南科大
ACS材料视界
down
wechat
bug