Foldit 是一个蛋白质设计游戏,经过十多年的改进,如今玩家们已经可以用它设计自然界中不存在的蛋白质,一些设计成果已经通过了科学家的实验检验,被证明可以稳定存在。由此诞生的首批研究成果于 6 月 5 日发表在 Nature 上。
图片来源:Institute for Protein Design/UW Medicine
来源 University of Washington Health Sciences/UW Medicine
翻译 刘悦晨
编辑 戚译引
Foldit 更新了新玩法,如今大众也可以帮助蛋白质研究人员创造新的疫苗、设计新的癌症治疗法了,这些玩家被称为“公民科学家”(citizen scientists)。
一群研究者们将他们的毕生所学做成了一个电脑游戏——Foldit。这款游戏的开发者们最初的希望是鼓励更多的人通过参与游戏的方式来参与合成蛋白质的研究。从这款游戏衍生出的首批研究成果于 6 月 5 日在 Nature 上发表。该研究由多家机构合作完成,由华盛顿大学医学院蛋白质设计研究所(Institute for Protein Design)主导。
“在现实中可能存在的蛋白质比宇宙中的原子还多。如今,几乎任何人都可以参与到对于蛋白质宇宙的探索当中,这件事真是让人兴奋不已!”这篇论文的高级合著者(senior co-author)、华盛顿大学医学院生物化学教授兼蛋白质设计研究所所长 David Baker 这样说道。
“我为参与到这项游戏当中的玩家们想象出来的蛋白质分子的多样性感到震惊!”论文第一作者、蛋白质设计研究所博士后研究员 Brian Koepnick 说,“这些被创造出来的蛋白质绝不逊色于拥有博士学位的科学家们制造出来的东西。”
Foldit 诞生于 2008 年,旨在将蛋白质研究游戏化。蛋白质是存在于每个生物体的每个细胞内的重要生物大分子。它们错综复杂的三维结构赋予了它们多种生物学功能,包括消化、伤口愈合、自身免疫等等。
通过 Foldit,玩家们帮助科学家们确定了 HIV 相关蛋白的结构,并改善了某些具有重要作用的酶的活性。但是直到最近,Foldit 玩家只能在已经存在的蛋白质上进行改动,无法自行设计新的蛋白质分子。
“设计自然界中并不存在的新的蛋白质分子,这长时间以来都是 Foldit 这款游戏的设计目的,”这篇论文的高级合著者、美国东北大学 Khoury 计算机科学学院助理教授 Seth Cooper 说,“这次发表的最新成果说明了这一思路是可行的。”
为了将 Foldit 变成一个真正的蛋白质设计平台,研究人员将生物化学知识编入游戏。这样,在 Foldit 中设计出的得分较高的分子更有可能在现实世界中按照预期折叠出来。
“我们没有给游戏玩家们进行任何形式的讲座,或告诉他们需要提前阅读任何内容。多年来,我们所做的只是不断调整游戏的源代码,”这篇论文的高级合著者、马萨诸塞大学达特茅斯分校计算机科学助理教授 Firas Khatib 说。
科学家在实验室中测试了 146 种由 Foldit 玩家设计出来的蛋白质,发现其中有 56 种结构稳定。这一结果表明游戏玩家的奇思妙想已经化为现实,他们创造了一些在现实中能够真实存在的蛋白质。研究人员收集了其中 4 种新的蛋白质分子的足量数据,证明它们的结构符合设计的意图。Khatib 说:“我从没想到玩家们能做得这么好,但是 Foldit 的玩家们总能产出让我们惊讶的奇思妙想。”
制作新的蛋白质,有点像尝试用比人类头发丝细一百万倍的绳索来打结,而且要打出从未见过的结。迄今为止,只有一小部分专家对生物分子的折叠方式有着深入的了解,并且这项极为复杂的任务仍然令他们感到困扰。大多数人的研究使用的是自动化分子设计算法,但是这些算法给出的计算结果大多数都是不成功的。
“我们总是在试图优化算法,但是实际上人的因素才是关键,”Khatib 说,“事实上,通过 Foldit 设计,玩家甚至发现了 Rosetta 能量函数的缺陷——那是我们目前最先进的蛋白质设计方法。”
蛋白质设计是一门新兴的学科。在过去的五年中,蛋白质设计研究所的专家和他们的同事创造了刺激免疫系统的蛋白质来对抗癌症,还有一些蛋白质成了疫苗的候选分子。4 月,蛋白质设计研究所通过由 TED 组织的慈善合作项目 The Audacious Project 获得了 4500 万美元的资金,用于蛋白质疫苗、药物和材料等项目的设计研发。
那么,游戏玩家们有可能创造下一个重磅药物吗?
“Foldit 的玩家们是蛋白质研究队伍当中的新成员,”Khatib 说,“他们虽然不是精锐部队,但他们仍然是这个研究队伍中一个了不起的资源。”
本文来自微信公众号“科研圈”。如需转载,请在“科研圈”后台回复“转载”,或通过公众号菜单与我们取得联系。原始文章信息请点击“阅读原文”。
论文信息
【标题】De novo protein design by citizen scientists
【作者】Brian Koepnick, Jeff Flatten, Tamir Husain, Alex Ford, Daniel-Adriano Silva, Matthew J. Bick, Aaron Bauer, Gaohua Liu, Yojiro Ishida, Alexander Boykov, Roger D. Estep, Susan Kleinfelter, Toke Nørgård-Solano, Linda Wei, Foldit Players, Gaetano T. Montelione, Frank DiMaio, Zoran Popović, Firas Khatib, Seth Cooper & David Baker
【期刊】Nature
【时间】05 June 2019
【DOI】10.1038/s41586-019-1274-4
【链接】https://www.nature.com/articles/s41586-019-1274-4
【摘要】Online citizen science projects such as GalaxyZoo1, Eyewire2 and Phylo3 have proven very successful for data collection, annotation and processing, but for the most part have harnessed human pattern-recognition skills rather than human creativity. An exception is the game EteRNA4, in which game players learn to build new RNA structures by exploring the discrete two-dimensional space of Watson–Crick base pairing possibilities. Building new proteins, however, is a more challenging task to present in a game, as both the representation and evaluation of a protein structure are intrinsically three-dimensional. We posed the challenge of de novo protein design in the online protein-folding game Foldit5. Players were presented with a fully extended peptide chain and challenged to craft a folded protein structure and an amino acid sequence encoding that structure. After many iterations of player design, analysis of the top-scoring solutions and subsequent game improvement, Foldit players can now—starting from an extended polypeptide chain—generate a diversity of protein structures and sequences that encode them in silico. One hundred forty-six Foldit player designs with sequences unrelated to naturally occurring proteins were encoded in synthetic genes; 56 were found to be expressed and soluble in Escherichia coli, and to adopt stable monomeric folded structures in solution. The diversity of these structures is unprecedented in de novo protein design, representing 20 different folds—including a new fold not observed in natural proteins. High-resolution structures were determined for four of the designs, and are nearly identical to the player models. This work makes explicit the considerable implicit knowledge that contributes to success in de novo protein design, and shows that citizen scientists can discover creative new solutions to outstanding scientific challenges such as the protein design problem.
▽ 精彩回顾 ▽