医学版俄罗斯方块:打通这个游戏,就可能获得下一个诺贝尔奖

本文作者:carollero
新冠疫情初期,科学家杂志(The Scientist)发布一篇报道,呼吁公民玩一款免费的在线游戏,帮助设计与新冠病毒突触结合的新蛋白质。
图片
Foldit 上最新游戏的一个示例,要求用户设计与冠状病毒刺突蛋白结合的蛋白(图源:The Scientist)
研究人员表示,全世界任何人都可以下载并在 Mac、Linux 或 Windows PC 上运行这款游戏。而他们将判断这些游戏产物是否可以起到识别作用,从而阻止冠状病毒的感染。
预测蛋白质结构,机器不如人?
让大众玩家设计新蛋白质,用于正经科研场景,这个行为怎么听都像是蛤蟆长毛,天方夜谭。
但要说这游戏是空口胡绉,华盛顿大学铁定要跳出来第一个不服:我们科学整活儿,怎么你们还不理性看待呢?
一切都要从游戏设计的初衷说起。
众所周知,蛋白质的生物合成机制相对清楚,但确定给定蛋白质的一级结构如何变为功能性三维结构,即蛋白质折叠过程的复盘,却是一个相对未知的领域,需要昂贵的 X 射线晶体学才能确定每种蛋白质数千个原子的排列。
图片
神秘的蛋白质折叠过程(图源:Youtube)
科学家们发现,蛋白质的天然结构总是比任何非天然构象具有更低的能量。
于是,华盛顿大学蛋白质研究专家贝克(David Baker)教授成立了一个名为 Rosetta 的研究项目。
这个项目利用特殊的计算机算法,从一段氨基酸序列出发,去做蛋白质设计、酶设计以及生物大分子和大分子复合物的结构预测,从而探索每种蛋白质的最低能量形状。
然而,就在这个过程中,一些 Rosetta 用户发现计算机算法对蛋白质进行的构形预测,总是存在或多或少的缺陷,不是「没对上」,就是「瞎对上」。用户旋即向贝克研究团队提出意见:「我看计算机不太行,让他来,不如让我来。」
贝克本就痴迷于解决蛋白质构型问题,他很快听取用户建议。他假设,如果将搜索的随机元素替换为人为决策,同时保留确定性的 Rosetta 算法作为工具,那么人类的全局性空间推理能力不但可以改善构象空间的采样,还可以增快速度
快马加鞭,贝克找到同一所大学的计算机科学教授佐兰(Zoran Popovic)和库珀(Seth Cooper),以期建立一种人机间交互程序。
妙就妙在,彼时库珀教授的程序员之魂可能正熊熊燃烧。得知贝克的需求后,这位计算机大神的脑海中忽地闪过「魔兽世界」等众多在线游戏,他不禁思考:为啥整交互,干脆整个游戏出来直接给这些用户玩,岂不妙哉?
好家伙,不愧是计算机系教授,脑回路属实特别。于是,一个新游戏 Foldit 横空出世。
三维版俄罗斯方块
库珀的思路是这样的:如果要通过多肽链的组合找到最适合的蛋白质结构模型,那就给玩家提供碎片
科学家会在 Foldit 平台上发布一些折叠不正确的蛋白质构象,玩家可以通过不断打乱、重塑这些多肽链,以寻找最恰当的结构。
图源:Nature
以上图为例,原始结构以蓝色显示,起始拼图为红色,而得分最高的结构预测为绿色。
在 a 的红色起始拼图有一个偏移,而得分最高的绿色结构预测正确地翻转和滑动 β 链。在上述相同的结构里,图形 b 是 Foldit 播放器通过重塑循环骨架,正确地将裸露的异亮氨酸埋在右下角的循环中。而图形 c 中,得分最高的 Foldit 预测则已经正确旋转了在起始拼图中放错位置的整个螺旋。
乍一听还是一脸懵,具体怎么做到这些,显然需要更多操作的细节。
为了使非相关专业的玩家轻松进行游戏,Foldit 中许多技术术语被更常用的术语代替。同时,科学家在编程的时候已经删除一部分已知的阻碍解决结构问题的蛋白质元素,并突出显示需要被解构、重塑的部分。
为了增加可视化区分,Foldit 设置了一些特定的视觉提示,例如侧链被疏水性着色,主链被能量着色,用不同的颜色分别描述疏水性(「暴露的疏水性」),原子间排斥(「碰撞」)和空腔(「空隙」)等。
图片
图源:Nature
以这个图为例,可视化效果包括了原子间的碰撞(箭头 1)、氢键(箭头 2)、具有黄色斑点的疏水侧链(已暴露,箭头 3)、亲水性侧链(箭头 4),以及由于高残留能量,主链的一部分呈红色(箭头 5)。
和其他游戏一样,玩家还可以通过引入各种外挂工具来进行辅助操作。比如,玩家可以通过修改连接增加自动化工具的约束(箭头 6),也可以通过冻结工具阻止自由度的改变(箭头 7)。界面还会显示玩家当前的状态信息,包括得分(箭头 8)、排行榜(箭头 9)以及和其他玩家开黑的共同得分等。
与 Foldit 预测本身一样有趣的是人工搜索过程的复杂性、变异性和创造力。
科学家认为与计算机相比,人类习惯使用多种多样的探索方法。比如有些玩家更喜欢手动调整侧链,而有些玩家会在游戏开始时放弃大量的持续最小化,但是会随着谜题的进行增加它的数量。
不同玩家根据谜题类型对整个谜题的使用不同的移动顺序,往往会带来意外之喜。
图片
当然,上图这种程度的游戏水平只会带来「意外失败」。(图源:某位菜鸡玩家自己截的 gif)
另外,Foldit 游戏还支持多人「开黑」。为了进行协作,玩家可以与小组成员共享结构,并通过游戏的聊天功能相互提供策略和技巧方面的帮助。这很大程度上增强了玩家的积极性。
而具象化到团队内部,通常存在分工。一些玩家擅长早期阶段的开放,其他则专注于中后期游戏的打磨。
总的来说就是,拼图、组合、得分、排行、开黑、battle——别人有的他都要有。
撬动生化医学的锚点
拥有这些个游戏基本技之后,Foldit 开始持续输出。
今年 8 月,Nature Structural & Molecular Biology发表文章称,Foldit 可以使蛋白质折叠中涉及的化学键可视化,帮助学生了解蛋白质的三维性质,有助于学生考虑蛋白质结构与功能的关系,效果远超平面教科书。
因此,美国部分教育团队已将这个游戏引入大学教学课堂。
但其实,比起作为一份教材,Foldit 更是早在生化领域混得风生水起。
2011 年,Foldit 玩家就帮助破译了一种涉及梅森-辉瑞猴病毒(M-PMV)逆转录病毒蛋白酶。
图片
梅森-辉瑞猴病毒/M-PMV(图源:Youtube)
先来看看前因:已知逆转录病毒蛋白酶(PRs)在病毒的成熟和增殖中具有关键作用,并且是强化抗逆转录病毒药物研发工作的重点。
因为所有先前确定的逆转录病毒蛋白酶的晶体结构都具有生物活性同二聚体形式,因此有专家提出:预防 PR 二聚化或许可以成为破坏 PR 活动的一种机制,也是抗逆转录病毒药物的药物设计途径。
但在这个机制提出后的十几年里,研究人员却一直无法使用任一同二聚体通过分子置换(MR)来解析 PR 的结构,实验只能被迫卡壳。
好在研究人员没有放弃,他们深谙「柳暗花明又一村」的道理:转头,咱走个「捷径」!
Foldit 就是那条「捷径」。研究人员转而把该单体拆解后的 114 个残基提供在官方游戏页面,试图获得一些新思路。
令人没想到的是,一组高级玩家通过打配合,竟然只花了 10 天就制作出该酶的 3D 模型,该模型足以精确地替代分子——这把游戏打的,不可谓不牛叉。
另一把堪堪可与之相较的游戏发生在 2012 年 1 月。Scientific American报道说,Foldit 游戏玩家通过添加 13 个氨基酸对一种酶进行改造,使其活性增加了 18 倍以上。这个酶随后应用于多种工业场景。
图片
获取成功连接后的祝贺界面(图源:Foldit 官网)
到这里,贝克的野心远远没有停止。他们宣布计划,要增加有机亚分组的化学构造集团,使得玩家甚至可以开始设计小分子。
研究人员认为,说不定未来的某天,Foldit 玩家制造的新分子还可能被研究应用于各大生物医药领域,为疾病诊疗提供新思路。(内容审核:gyouza)
致谢:本文经 清华大学化学系博士 孙亚飞 专业审核
题图来源:图虫创意
参考资料:
[1].https://www.the-scientist.com/news-opinion/scientists-use-online-game-to-research-covid-19-treatment-67230
[2].https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6914346/
[3].https://en.wikipedia.org/wiki/Foldit
[4].https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6701466/
[5].https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3705907/
[6].https://www.nytimes.com/2010/08/05/science/05protein.html
[7].https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2956414/
[8].https://www.eurekalert.org/pub_releases/2010-08/hhmi-pgt080310.php