当前位置 : X-MOL首页行业资讯 › AI甄别AI,魔法打败魔法

AI甄别AI,魔法打败魔法

随着ChatGPT等人工智能(AI)大语言模型的迅猛发展,学术出版界面临着一个重要挑战,即如何甄别一篇学术论文是人类写的,还是人工智能(AI)写的?目前绝大多数期刊都不接受ChatGPT等代劳,因为AI的过度参与可能会带来很多风险。例如,“灌水”的手稿泛滥,因各种原因而过度引用某些文章,甚至出现无中生有、捏造事实的手稿。然而,对于能否打败AI生成文稿的“入侵”,学术界已经分裂为悲观派和乐观派,前者认为这是一场没有希望的“军备竞赛”,后者则对开发出有效的工具甄别AI生成文稿很有信心。


美国堪萨斯大学Heather Desaire团队就属于后者。近期,他们开发出了一种在科学学术写作内容中能够高效甄别AI生成文本的工具,并将其扩展到化学论文领域 [1-2]有趣的是,这种准确率达到99%以上的工具也是基于AI,可谓“用魔法打败魔法”。


Heather Desaire团队于今年6月首次公布了他们的这种检测器。当时,他们把检测器用于检测发表在Science 期刊上的perspective类文章和ChatGPT生成的内容,获得了超过99%的准确率。近日,他们进一步扩大检测范围,将该检测器应用于化学类学术期刊。他们挑选美国化学会出版的10种期刊中100个介绍段落训练该检测器,随后,让ChatGPT基于提示1(标题式提示,"Please write a 300 to 400 word introduction in the style of an ACS journal for an article with this title: (title here)")和提示2(摘要式提示,"Please write a 300 to 400 word introduction in the style of an ACS journal for an article with this abstract: (abstract here).")撰写类似的文章。他们将该检测器和网络上流行的AI检测器OpenAI和 ZeroGPT一起用于检测人类写作和AI生成的样本。结果显示,3种检测器在识别人类样本上都表现了类似的高效识别能力,但是,在识别ChatGPT(3.5、4.0版本,基于提示1、2)生成的样本上则表现了显著的差异,Desaire团队的检测器表现了100%的准确性,ZeroGPT和Open AI准确率则显著下降。

AI文本检测器的性能比较。图片来源:Cell Rep. Phys. Sci[2]


最后,Heather Desaire团队给他们的检测器安排了更艰巨的任务。他们引入了与训练集不同但本质类似的样本,这些样本来自另外3个化学期刊的150篇论文。结果显示,Desaire团队的检测器和ZeroGPT对这些人类写作内容表现了相似的高效识别能力。他们随后引入了ChatGPT(3.5、4.0版本)生成的300个样本进行测试,这些样本是基于更具迷惑性的提示生成的,例如"You are a chemist tasked to write a five paragraph introduction for your research with this abstract: (original human-written abstract provided)"。结果显示,Desaire团队的检测器依然表现出色,300个样本甄别出了298个,而ZeroGPT几乎丧失了甄别能力。

域外测试的性能比较。图片来源:Cell Rep. Phys. Sci. [2]


基于上述结果,Heather Desaire团队的自信是有底气的。他们提出了两个对抑制AI生成学术文稿持乐观预期的理由:(1)魔高一尺道高一丈,本实验显示AI检测器的发展能够跑赢AI生成文稿的技术更新迭代。本文中的检测器能够对付ChatGPT3.5和最新的4.0版本,也大概率能够应对未来的5.0版本,且优化的时间低于各种GPT技术升级时间;(2)不在线公布的AI检测器会形成威慑力。这样,想借助AI造假的作者无法琢磨出有效之策应对潜在的AI检测器,这柄悬在头上的“达摩克里斯剑”让他/她不得不考虑被甄别出的严重后果,然后三思而行。


著名的学术打假斗士Elisabeth Bik也高度评价了这一研究成果,她在接受Chemistry World采访时说:“这是一个受欢迎的新工具,可以极大地帮助科学期刊的编辑甄别计算机生成稿件,就像剽窃检测软件所做的那样”[3]


参考文献:

1. Desaire et al., Distinguishing academic science writing from humans or ChatGPT with over 99% accuracy using off-the-shelf machine learning tools. Cell Reports Physical Science20234, 101426, DOI: 10.1016/j.xcrp.2023.101426

2. Desaire et al., Accurately detecting AI text when ChatGPT is told to write like a chemist. Cell Reports Physical Science20234, 101672, DOI: 10.1016/j.xcrp.2023.101672

3. Fighting fire with fire: AI can detect phony AI-generated chemistry papers

https://www.chemistryworld.com/news/fighting-fire-with-fire-ai-can-detect-phony-ai-generated-chemistry-papers/4018441.article 


(本文由天生西南供稿)


如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOLx-mol.com ), 未经许可,谢绝转载!

阿拉丁
分享您的投稿习惯
经济学SSCI期刊
英语语言编辑翻译加编辑新
加速出版服务新
1212购书送好礼
Springer旗下全新催化方向高质新刊
动物学生物学
系统生物学合成生物学
专注于基础生命科学与临床研究的交叉领域
传播分子、细胞和发育生物学领域的重大发现
聚焦分子细胞和生物体生物学
图书出版流程
快速找到合适的投稿机会
热点论文一站获取
定位全球科研英才
中国图象图形学学会合作刊
大连
德国
多伦多
西安科技
多伦多
新加坡
浙江大学
中科院
上海中医
澳门
ACS材料视界
down
wechat
bug