计算蛋白设计师的奇妙世界
转自 生命奥秘 Jul 30, 2019
通过从头开始设计一种蛋白质,研究人员可以创造出在自然界中不存在的具有形式和功能的蛋白质。
蛋白质工程师发现,构建一个蛋白质的最佳方法是从头开始构建。
Cassie Bryan成功地构建出一种蛋白质,这种蛋白质按她预期的方式工作了很长一段时间。经过6年的漫长等待,她的研究终于获得成功。她来到酒吧,喝了啤酒庆祝——还表演一首Joan Jett的《恶名》(Bad Reputation)。
Bryan于2012年进入西雅图华盛顿大学(University of Washington)David Baker的蛋白质设计实验室攻读研究生。她的项目是设计一种能与PD-1——白细胞表面的一种抑制免疫系统活性的蛋白质——结合的蛋白质。
起初,Bryan采取了蛋白质工程师的通常做法:调整了现有的天然蛋白质的结构,使其与PD-1结合。但是,在项目进行两年后,她发现这种方法毫无进展。在这段时间里,人们对作为癌症免疫治疗靶点的PD-1的兴趣激增。与此同时,他们实验室越来越擅长采用不同的方法。Baker实验室从零开始构建新的蛋白质,而不是修改天然蛋白质以满足特定需求。
北卡罗莱纳大学(University of North Carolina)教堂山分校的蛋白质工程师Brian Kuhlman指出,与传统的蛋白质工程相比,从头开始(de novo)的蛋白质设计虽然比较困难,但是具有很多优点。2003年,他还是Baker实验室的博士后,领导了实验室的第一次从头开始的成功,这是一个由93个氨基酸组成的蛋白,名为Top7。天然蛋白质很难在整体结构不被破坏的情况下进行修饰。但是,通过从头开始制造蛋白质,研究人员可以设计出更宽容的蛋白质。他们可以利用不属于标准大分子工具箱的共因子和氨基酸,构建具有天然未知活性的酶。科学家可以基于此测试已有的生物学知识是否正确,以确保他们真正掌握基本原理。
Baker表示,他们正在从头做起。在实验室里这是一个非常严格的规则:你不能从自然界存在的任何事物开始,因为他们希望能够确保完全理解蛋白质工作原理,从而设计出具有功能的全新蛋白质。
在大多数情况下,这些人造蛋白质就是Baker所说的“岩石”,即非常稳定的蛋白质,如TOP7,其他研究人员也能自己合成TOP7。然而,在过去的几年里,科学家越来越擅长赋予这些新蛋白功能,创造了包括荧光分子、细胞信号蛋白和疫苗候选分子等在内的多种人造蛋白。但是目前这种从头设计还是非常小众的——Baker估计,95-99%的蛋白质工程“仍然是由随机突变和选择完成的”。从头开始的蛋白质工程通常需要数周的计算时间和数月的迭代。尽管如此,计算技术的进步和不断扩大的用户群会让这个过程变得越来越简单。
瑞士苏黎世联邦理工学院( Swiss Federal Institute of Technology, ETH)的蛋白质化学家、曾与Kuhlman合作创造了一种叫做酯酶的酶的Donald Hilvert指出,蛋白设计领域进入了黄金时代,计算、结构、分子生物学和详细的生物物理学测量的结合——所有这些都以如此美妙的方式结合在一起。
这很复杂
蛋白质折叠非常复杂。蛋白质是由氨基酸组成的长链,新形成的蛋白质迅速形成特定的折叠形状,而这种空间结构决定了蛋白质的功能。研究人员早就知道蛋白质的序列决定了它的形状。他们可以用X射线结晶学和低温电子显微镜来确定这种形状。他们做不到的只是从序列中预测形状。
这是因为蛋白质的结构是由多种彼此竞争的力决定的。蛋白质基本上是由碳、氮、氧和氢组成的一条长链,氨基酸侧链悬挂在分子手镯上,就像魔咒一样。然而,这种分子不能折叠成任何形状,因为蛋白质的不同部分相互竞争位置,在吸引力和排斥力之间维持微妙的平衡,所以这种可能性受到了限制。蛋白质折叠预测的诀窍是计算出这些作用力,从而计算出蛋白质键将要采用的精确角度。
华盛顿大学(University of Washington)的Cassie Bryan构建了一种蛋白质,它能与细胞表面蛋白PD-1结合。
Baker实验室使用一套名为Rosetta的分子建模和搜索工具,可以计算折叠蛋白质的能量,并搜索给定结构的最低能量序列,或给定序列的最低能量结构。Baker在20世纪90年代后期开发了Rosetta作为预测结构的工具。从那时起,他的实验室成员和由几百名用户组成的社区(名为Rosetta Commons)不断开发该软件,以提高其性能和功能。
例如,在一个项目中,为了设计一种叫做“大环”、具有抗生素和抗癌特性的短肽,Baker实验室博士后Parisa Hoseinzadeh、Gaurav Bhardwaj和Vikram Mulligan(他现在就职于纽约西蒙斯基金会(Simons Foundation in New York City))合作,升级了Rosetta,使其具有处理‘D’氨基酸的功能。‘D’氨基酸是细胞使用的‘L’残基的化学镜像,因此具有不同的性质。蛋白质设计师Neil King,一位仍就职于华盛顿大学的Baker实验室的前成员,对Rosetta做了调整,使其能设计具有自组装能力的蛋白质纳米颗粒。
尽管他的实验室里的每个新项目都是不同的,但是Baker说其实这些项目都遵循相同的基本策略。首先,决定一类理想的结构——他所说的“柏拉图式的理想”的形状。然后,使用Rosetta设计数万个潜在的主干构造以匹配该形状,用侧链残余物将其充实,并测试计算出的序列将折叠成所需的形式。最后,合成表达该设计的基因,测试、迭代,不断重复这个循环。
Baker表示,实际上,只有很小一部分可能的主干构造是可设计的。在选择合适的候选者之前,研究人员可能需要搜索数百万种可能性和几十种物理蛋白质。Baker实验室的前研究生、现就职于加州理工大学(California Institute of Technology)的Zibo Chen筛选了大约8,700万个主干,以确定2,251个能够与蛋白质相互作用的设计。设计过程在几百个处理器核心上运行,花费了大约六周。
受到DNA折叠(DNA分子被折叠成纳米结构)的启发,Chen想尝试氢键策略。基于该策略,他可以设计出完全正交的蛋白质对(仅与特定的人造伙伴相互作用,而不与其它类似的伙伴相互作用的蛋白质)。这样的蛋白质可用来制造新的生物传感器、基因回路或只是异想天开的形状。Chen加入实验室,部分原因是他想看看他是否能用蛋白质重现DNA纳米技术人员用核酸制造的东西:一张核酸构成的笑脸表情符号。今年早些时候, Chen迈出了第一步:一个自组装的2D阵列。C表示,他当时设定的目标过于幼稚。
Bryan设计了一种与PD-1结合的蛋白质,该蛋白质非常小,一共只有46个氨基酸,Bryan有望对其进行调节。她表示,这种蛋白质只是一个由单个杆状a–螺旋结构支撑的平面Ab板。在卡通形式中,它像一个用来熨衣服的老式熨斗。螺旋有点像把手,而实际的功能端是附着在受体上的铁离子。
Bryan首先尝试修改一种现有的蛋白质来假设这个形状,但她很快发现不能对天然蛋白质进行修饰来获得她想要的结构。因此,受PD-1与其天然配体PD-L2结合结构的启发,她确定了三个关键的残基,将它们的位置编码到Rosetta里,并指导软件构建一种支持它的蛋白质。她把一个必需的环延长了五个氨基酸,以改善与人类目标的结合。利用基于流式细胞术(一种细胞分析技术)和DNA测序的高通量筛选策略,她在每个位置测试每个氨基酸变体,以推动结构走向更强大的相互作用。在设计蛋白质的过程中,Bryan获得了学位,尽管经过三年的弯路,她意识到由于一些关键的糖修饰,她的工程化蛋白质不能与人体蛋白质相互作用。
最后,Bryan取得了突破:在流式细胞仪中,她设计的蛋白质与淋巴细胞能强有力地结合。她指出,经历了这么多的波折,Bryan对任何一个实验的成果都不抱太高期望。但是那些由她的免疫学同事提供的数据让她相信了。这些免疫学的合作者非常了解T细胞,他们告诉Bryan,在真正的人类T细胞上,他们从未见过其它分子能产生这么强的结合作用。
King设计了一种自组装的纳米颗粒,可以作为呼吸道合胞病毒的候选疫苗,他认为这简直就是科幻。他认为,就像在编故事一样。这简直是一场计算机通话,当它在现实世界中真正起作用时,简直就是奇迹。
所以Bryan就用啤酒和Joan Jett(的歌)来庆祝这场胜利。
功能设计
Baker表示,在这一点上,蛋白质工程师能做的非常多,至少在设计蛋白结构上是这样。但大多数蛋白质的存在并不仅仅是为了呈现一个特定的形状;重要的是它的功能。
Hosseinzadeh指出,功能,例如催化化学反应的能力,增加了蛋白质设计的难度,因为它为问题增加了新的变量。当她选择形状时,她唯一关心的是整体能量。但是,当你设计功能的时候,还有其它一些事情需要考虑——例如,这个分子是否与我想要瞄准的蛋白质表面有良好的接触?定位侧链是否放置在正确的位置?它是否覆盖了[相互作用]表面?
当Baker实验室的博士后Anastasia Vorobieva和加州斯坦福大学(Stanford University)的Jiayi Dou决定构建一种新的绿色荧光蛋白类似物时,这两位研究人员带着不同的课题来到这个项目。Vorobieva想构建一个b-桶,一个普通的结构基序,需要从头开始构造;而Dou想建立一种可以稳定一个小分子的蛋白质,如荧光团。
b-桶结构中,b-片的一个边缘与另一个边缘相连,形成一个中空的孔或口袋。但Vorobieva指出,该结构的制作特别困难,因为每个层面的残端都是粘性的;如果无法保留这种特性,该结构就毫无功能。
Vorobieva的目标是创造一个表面光滑弯曲的桶。但这一设计给肽骨架带来了意想不到的压力。一些适当位置的甘氨酸残基赋予了一个方正的横截面,但减轻了足够的压力,使设计能够成功。Vorobieva展示了这一点,她的晶体结构与她的想法非常吻合。她指出,这是最后一个最有力的实验,证明他们做的一切都是正确的。
为了使这种蛋白质发挥作用,Dou复制了Vorobieva最初的设计,但对稳定荧光分子有额外的限制。她与Baker实验室的研究科学家 Will Sheffler展开了合作。Sheffler正在设计一种新的Rosetta模块,对可能与一种蛋白质结合的小分子的结合构象进行取样。Dou通过把荧光团的位置限制在桶顶部来平衡稳定和功能,然后利用Sheffler开发的模块确定了2,102个候选设计,并合成了56个。56个钟有2个在有荧光基质的情况下,能发出荧光,Dou对其中一个进行进一步修改以使亮度最大化,并验证她的设计——这项工作涉及测试2,090个基因变体。
英国爱丁堡大学( University of Edinburgh)的蛋白质化学家Lynne Regan指出,蛋白质设计几乎总是涉及到选择和迭代。目前,研究人员还无法坐在电脑前设计出一种能与另一种分子结合的蛋白质,并且一次成功;他们必须制造出某种能在某种程度上起作用的蛋白质,然后对其进行迭代改进。
部分原因是研究人员仍在研究蛋白质折叠的细节。Baker指出,例如,Rosetta 依赖于它的“能量函数”,这是一个估算与每个结构相关的能量的模型。但仅仅程序预想的蛋白结构可能和实际有所差别。Kuhlman实验室的前研究生,生物技术公司Pairwise的蛋白质科学家Sharon Guffy表示,在创造金属结合蛋白时,她很难让Rosetta正确地解读锌的电性(及其对附近侧链的影响)。她认为,进行编码和故障排除“至少花了她一个月”。
在加州大学旧金山分校(University of California, San Francisco),蛋白质工程师William DeGrado实验室的研究生Marco Mravic将他的研究重点放在膜蛋白上,特别是将其组装成更大的复合物。他选择研究一种叫做phospholamban的心脏蛋白,该蛋白由五个相同的跨膜螺旋组成。Mravic想知道的是,是什么让这些螺旋如此精确地组装起来?
部分答案在于结构。实际上没有人知道phospholamban是什么样子的。Mravic对这种蛋白质进行了分子动力学模拟,发现复合物的一端张开,就像香蕉皮一样。Mravic指出,这个模拟看起来不太对劲,所以他就需要进入分子中去‘修复’它。
通过将两种亲水性氨基酸转化为更适合膜表面的残基,Mravic创造了一种更紧密的变体,他通过求解晶体结构证明了这一点。然后,他研究出了允许这种包装发生的特性,确定了他所说的“立体码”——螺旋表面的四种氨基酸的结构,使键侧链像拉链一样交错。然后,Mravic使用该代码来设计采用类似于phospholamban结构的合成衍生物。
结构基础
除了蛋白质折叠的细微差别外,从头开始的设计使研究人员能够突破蛋白质的作用范围。例如,在英国伯明翰大学(University of Birmingham),化学家 Anna Peacock研究金属肽——一种结合金属离子的微型蛋白质。在生物学中,这些分子通常结合锌、锰或铜,她表示,这些物质可在海水中溶解。但其它金属可能会产生不同的化学反应。
Peacock利用新生的蛋白质作为支架来制造能够结合钆的分子。钆的复合物通常被用作磁共振成像的造影剂。她也在制造结合铂或铱等金属的酶,从而探索自然界中没有的反应。她觉得,如果一种人工金属酶的功能和天然酶类没有啥差别,其实没有做的意义。
随着每个设计目标的实现,其他人更容易模仿它们。Baker实验室甚至开发了一个名为Foldit的Rosetta在线游戏界面,玩家(很少有人是科学家)在硅片中创造蛋白质。今年的一项分析结果显示,玩家们提供了一些有意义的设计。Baker指出,玩家们“完全从头开始”设计出了新颖的设计,其中包括一个从未见过的折叠。
当然,很少有科学家有时间或专业知识从头开始设计蛋白质;对他们来说,从头开始的设计是研究的基础。但在Baker实验室,设计工作仍在继续。每一次成功,实验室都会庆祝。Baker指出,对于从事这项工作的博士后和学生来说,这种兴奋“持续了很长时间”。对我来说,它会持续一两天,然后它会逐渐消失,我觉得,好吧,我们接下来要做什么?
原文检索:
Jeffrey M. Perkel. (2019) The computational protein designers. Nature, 571: 585-587.
张洁/编译
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。