当前位置 : X-MOL首页行业资讯 › AI甄别AI,魔法打败魔法

AI甄别AI,魔法打败魔法

随着ChatGPT等人工智能(AI)大语言模型的迅猛发展,学术出版界面临着一个重要挑战,即如何甄别一篇学术论文是人类写的,还是人工智能(AI)写的?目前绝大多数期刊都不接受ChatGPT等代劳,因为AI的过度参与可能会带来很多风险。例如,“灌水”的手稿泛滥,因各种原因而过度引用某些文章,甚至出现无中生有、捏造事实的手稿。然而,对于能否打败AI生成文稿的“入侵”,学术界已经分裂为悲观派和乐观派,前者认为这是一场没有希望的“军备竞赛”,后者则对开发出有效的工具甄别AI生成文稿很有信心。


美国堪萨斯大学Heather Desaire团队就属于后者。近期,他们开发出了一种在科学学术写作内容中能够高效甄别AI生成文本的工具,并将其扩展到化学论文领域 [1-2]有趣的是,这种准确率达到99%以上的工具也是基于AI,可谓“用魔法打败魔法”。


Heather Desaire团队于今年6月首次公布了他们的这种检测器。当时,他们把检测器用于检测发表在Science 期刊上的perspective类文章和ChatGPT生成的内容,获得了超过99%的准确率。近日,他们进一步扩大检测范围,将该检测器应用于化学类学术期刊。他们挑选美国化学会出版的10种期刊中100个介绍段落训练该检测器,随后,让ChatGPT基于提示1(标题式提示,"Please write a 300 to 400 word introduction in the style of an ACS journal for an article with this title: (title here)")和提示2(摘要式提示,"Please write a 300 to 400 word introduction in the style of an ACS journal for an article with this abstract: (abstract here).")撰写类似的文章。他们将该检测器和网络上流行的AI检测器OpenAI和 ZeroGPT一起用于检测人类写作和AI生成的样本。结果显示,3种检测器在识别人类样本上都表现了类似的高效识别能力,但是,在识别ChatGPT(3.5、4.0版本,基于提示1、2)生成的样本上则表现了显著的差异,Desaire团队的检测器表现了100%的准确性,ZeroGPT和Open AI准确率则显著下降。

AI文本检测器的性能比较。图片来源:Cell Rep. Phys. Sci[2]


最后,Heather Desaire团队给他们的检测器安排了更艰巨的任务。他们引入了与训练集不同但本质类似的样本,这些样本来自另外3个化学期刊的150篇论文。结果显示,Desaire团队的检测器和ZeroGPT对这些人类写作内容表现了相似的高效识别能力。他们随后引入了ChatGPT(3.5、4.0版本)生成的300个样本进行测试,这些样本是基于更具迷惑性的提示生成的,例如"You are a chemist tasked to write a five paragraph introduction for your research with this abstract: (original human-written abstract provided)"。结果显示,Desaire团队的检测器依然表现出色,300个样本甄别出了298个,而ZeroGPT几乎丧失了甄别能力。

域外测试的性能比较。图片来源:Cell Rep. Phys. Sci. [2]


基于上述结果,Heather Desaire团队的自信是有底气的。他们提出了两个对抑制AI生成学术文稿持乐观预期的理由:(1)魔高一尺道高一丈,本实验显示AI检测器的发展能够跑赢AI生成文稿的技术更新迭代。本文中的检测器能够对付ChatGPT3.5和最新的4.0版本,也大概率能够应对未来的5.0版本,且优化的时间低于各种GPT技术升级时间;(2)不在线公布的AI检测器会形成威慑力。这样,想借助AI造假的作者无法琢磨出有效之策应对潜在的AI检测器,这柄悬在头上的“达摩克里斯剑”让他/她不得不考虑被甄别出的严重后果,然后三思而行。


著名的学术打假斗士Elisabeth Bik也高度评价了这一研究成果,她在接受Chemistry World采访时说:“这是一个受欢迎的新工具,可以极大地帮助科学期刊的编辑甄别计算机生成稿件,就像剽窃检测软件所做的那样”[3]


参考文献:

1. Desaire et al., Distinguishing academic science writing from humans or ChatGPT with over 99% accuracy using off-the-shelf machine learning tools. Cell Reports Physical Science20234, 101426, DOI: 10.1016/j.xcrp.2023.101426

2. Desaire et al., Accurately detecting AI text when ChatGPT is told to write like a chemist. Cell Reports Physical Science20234, 101672, DOI: 10.1016/j.xcrp.2023.101672

3. Fighting fire with fire: AI can detect phony AI-generated chemistry papers

https://www.chemistryworld.com/news/fighting-fire-with-fire-ai-can-detect-phony-ai-generated-chemistry-papers/4018441.article 


(本文由天生西南供稿)


如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOLx-mol.com ), 未经许可,谢绝转载!

阿拉丁
动态系统的数学与计算机建模
热点论文一站获取
购书送好礼
天然纤维材料
口腔微生物
英语语言编辑翻译加编辑
材料学领域约200份+SCI期刊
定位全球科研英才
中国图象图形学学会合作刊
东北石油大学合作期刊
动物源性食品遗传学与育种
专业英语编辑服务
左智伟--多次发布
多次发布---上海中医药
广州
天大
清华
清华
北大
西安电子
中科院
南科大
ACS材料视界
down
wechat
bug