AI甄别AI，魔法打败魔法- X-MOL资讯

当前位置： X-MOL首页 › 行业资讯 › AI甄别AI，魔法打败魔法

AI甄别AI，魔法打败魔法

作者：X-MOL 2024-02-13

随着ChatGPT等人工智能（AI）大语言模型的迅猛发展，学术出版界面临着一个重要挑战，即如何甄别一篇学术论文是人类写的，还是人工智能（AI）写的？目前绝大多数期刊都不接受ChatGPT等代劳，因为AI的过度参与可能会带来很多风险。例如，“灌水”的手稿泛滥，因各种原因而过度引用某些文章，甚至出现无中生有、捏造事实的手稿。然而，对于能否打败AI生成文稿的“入侵”，学术界已经分裂为悲观派和乐观派，前者认为这是一场没有希望的“军备竞赛”，后者则对开发出有效的工具甄别AI生成文稿很有信心。

美国堪萨斯大学的Heather Desaire团队就属于后者。近期，他们开发出了一种在科学学术写作内容中能够高效甄别AI生成文本的工具，并将其扩展到化学论文领域 ^[1-2]。有趣的是，这种准确率达到99%以上的工具也是基于AI，可谓“用魔法打败魔法”。

文1-1.png

Heather Desaire团队于今年6月首次公布了他们的这种检测器。当时，他们把检测器用于检测发表在Science 期刊上的perspective类文章和ChatGPT生成的内容，获得了超过99%的准确率。近日，他们进一步扩大检测范围，将该检测器应用于化学类学术期刊。他们挑选美国化学会出版的10种期刊中100个介绍段落训练该检测器，随后，让ChatGPT基于提示1（标题式提示，"Please write a 300 to 400 word introduction in the style of an ACS journal for an article with this title: (title here)"）和提示2（摘要式提示，"Please write a 300 to 400 word introduction in the style of an ACS journal for an article with this abstract: (abstract here)."）撰写类似的文章。他们将该检测器和网络上流行的AI检测器OpenAI和 ZeroGPT一起用于检测人类写作和AI生成的样本。结果显示，3种检测器在识别人类样本上都表现了类似的高效识别能力，但是，在识别ChatGPT(3.5、4.0版本，基于提示1、2)生成的样本上则表现了显著的差异，Desaire团队的检测器表现了100%的准确性，ZeroGPT和Open AI准确率则显著下降。

文1-2.png

AI文本检测器的性能比较。图片来源：Cell Rep. Phys. Sci. ^[2]

最后，Heather Desaire团队给他们的检测器安排了更艰巨的任务。他们引入了与训练集不同但本质类似的样本，这些样本来自另外3个化学期刊的150篇论文。结果显示，Desaire团队的检测器和ZeroGPT对这些人类写作内容表现了相似的高效识别能力。他们随后引入了ChatGPT（3.5、4.0版本）生成的300个样本进行测试，这些样本是基于更具迷惑性的提示生成的，例如"You are a chemist tasked to write a five paragraph introduction for your research with this abstract: (original human-written abstract provided)"。结果显示，Desaire团队的检测器依然表现出色，300个样本甄别出了298个，而ZeroGPT几乎丧失了甄别能力。

文1-3.png

域外测试的性能比较。图片来源：Cell Rep. Phys. Sci. ^[2]

基于上述结果，Heather Desaire团队的自信是有底气的。他们提出了两个对抑制AI生成学术文稿持乐观预期的理由：（1）魔高一尺道高一丈，本实验显示AI检测器的发展能够跑赢AI生成文稿的技术更新迭代。本文中的检测器能够对付ChatGPT3.5和最新的4.0版本，也大概率能够应对未来的5.0版本，且优化的时间低于各种GPT技术升级时间；（2）不在线公布的AI检测器会形成威慑力。这样，想借助AI造假的作者无法琢磨出有效之策应对潜在的AI检测器，这柄悬在头上的“达摩克里斯剑”让他/她不得不考虑被甄别出的严重后果，然后三思而行。

著名的学术打假斗士Elisabeth Bik也高度评价了这一研究成果，她在接受Chemistry World采访时说：“这是一个受欢迎的新工具，可以极大地帮助科学期刊的编辑甄别计算机生成稿件，就像剽窃检测软件所做的那样”^[3]。

参考文献：

1. Desaire et al., Distinguishing academic science writing from humans or ChatGPT with over 99% accuracy using off-the-shelf machine learning tools. Cell Reports Physical Science, 2023, 4, 101426, DOI: 10.1016/j.xcrp.2023.101426

2. Desaire et al., Accurately detecting AI text when ChatGPT is told to write like a chemist. Cell Reports Physical Science, 2023, 4, 101672, DOI: 10.1016/j.xcrp.2023.101672

3. Fighting fire with fire: AI can detect phony AI-generated chemistry papers

https://www.chemistryworld.com/news/fighting-fire-with-fire-ai-can-detect-phony-ai-generated-chemistry-papers/4018441.article

（本文由天生西南供稿）

如果篇首注明了授权来源，任何转载需获得来源方的许可！如果篇首未特别注明出处，本文版权属于 X-MOL （ x-mol.com ），未经许可，谢绝转载！

点击分享

评论: 1