诺贝尔奖通常授予几十年前的成就。但今年的化学奖在上周部分授予了最近刚刚开始开花结果的工作:利用人工智能AI)设计自然界不存在的蛋白质。蛋白质是生命的主力分子,自然界中存在着数百万种蛋白质,但新的蛋白质可能会改变医学和技术。这些新工具已经使研究人员能够大量生产用于疫苗和癌症治疗的设计蛋白,人工污染消化酶,以及能够播种矿物质生长的分子组装。斯坦福大学的蛋白质设计师Possu Huang说:“我们才刚刚开始学习我们可以构建什么。”

今年110万美元奖金的一半颁给了谷歌DeepMind的John Jumper和Demis Hassabis,以奖励他们设计AlphaFold的工作。AlphaFold是一个人工智能程序,几乎解决了令人生畏的蛋白质折叠问题:通过蛋白质的化学序列预测蛋白质的形状,从而预测蛋白质的功能。在2020年,Jumper和Hassabis展示了AlphaFold 2,在蛋白质结构及其氨基酸序列的庞大数据库上进行了训练,在许多情况下,它在预测蛋白质形状方面的表现与直接对它们成像的技术(如x射线晶体学)一样好。另一半的奖项颁给了华盛顿大学的David Baker ,因为他解决了一个相反的问题:从蛋白质的预期功能出发到设计氨基酸序列,使之能够折叠成一个能够完成这项工作的分子。

David Baker 说,按订单制造一种新型蛋白质的想法有点疯狂。但是在2003年,他和他的同事们用一种名为Rosetta的软件证明了这是可能的,该软件梳理了已知蛋白质结构的数据库,寻找可能对一种新的假设蛋白质有用的片段。

在早期的演示中,Rosetta吐出了一个由93个氨基酸组成的序列,理论上可以构成一种叫做Top7的蛋白质,这种蛋白质的形状不是生物学上使用的。为了证实这一设计,Baker 的团队合成了一个编码Top7的基因,并将其拼接到细菌中。他们收集了产生的蛋白质,并用x射线轰击它,以确定它的结构与预测的几乎一致。虽然Top7没有实现任何重要的功能,但其意义是革命性的。“我们现在几乎可以设计任何我们想要的蛋白质形状,”瑞士洛桑联邦理工学院的蛋白质设计师Casper Goverde说。

自从Baker 的早期实验以来,蛋白质设计软件已经融入了越来越强大的人工智能技术。例如,今年6月,Huang的团队报告了一个名为Protpardelle的模型,该模型不仅设计了蛋白质的一般“主链”,还设计了沿其边缘的特定原子簇——所谓的“侧链”,对功能至关重要。今年早些时候,由麻省理工学院计算机科学家Bonnie Berger领导的研究团队推出了一款名为OmegaFold的软件,该软件更擅长设计“孤儿”蛋白质,因为自然界中几乎没有近亲来指导设计过程。“现在事情发展得非常快。

疫苗是早期的回报。2020年,在COVID-19大流行开始后不久,威斯康星大学的研究人员设计了一种蛋白质,可以附着在SARS-CoV-2刺突蛋白的特定部分上,阻止病毒穿透人体细胞。识别出刺突蛋白的这一部分,使他们能够设计出一种疫苗,该疫苗将关键蛋白质部分的数十个拷贝排列在蛋白质核心周围,以训练免疫系统识别SARS-CoV-2上的相同结构并使其失活。在成功的人体试验之后,这种名为SKYCovione的疫苗去年被批准在韩国和英国使用,尽管由于大流行的减弱,生产现在已被搁置。华盛顿大学的研究人员正在研究其他疫苗,包括一种广谱流感疫苗,这种疫苗可能不需要每年注射一次,还有一种针对呼吸道合胞病毒的疫苗,呼吸道合胞病毒是婴儿和老年人的主要杀手。

设计人员还在开发能寻找并结合癌细胞表面独特分子的蛋白质,以便标记癌细胞、并通过设计的病毒样蛋白质容器自然地递送化疗药物进行破坏。但是肿瘤细胞,像所有细胞一样,被一层由不溶性蛋白质组成的脂膜包围着。这使得研究人员很难在溶液中测试药物——无论是化疗还是疫苗诱导的抗体——以便最好地攻击它们。今年6月,Goverde报告说,他重新设计了膜蛋白,使其可溶,同时保留了它们所有的原有功能。“然后我们可以用这些来找到针对真正的抗体。”

肿瘤并不是唯一的医疗目标。在五月份的一篇预印本中,Baker和他的同事们报道了一种设计蛋白,可以附着在眼镜蛇等蛇的毒液中的毒素上,阻止它们与神经受体结合。当注射到小鼠体内时,这种蛋白质通过中和毒素来保护动物免受通常致命剂量的毒液的伤害。设计的蛋白质很小,比传统的大蛋白质更稳定,传统的大蛋白质如果不冷藏就会迅速分解。研究人员设想了一种笔状注射器,在被蛇咬伤后立即携带使用。

非医疗应用也在兴起。例如,2018年,俄勒冈大学的Parisa Hosseinzadeh和她的同事报告说,他们设计了一种蛋白质催化剂,可以通过帮助捕获有毒金属原子来保护食品生产免受污染物的侵害。Hosseinzadeh的团队目前正在研究分解环境中的塑料的酶。去年,魏茨曼科学研究所的蛋白质设计师Sarel Fleishman和他的同事们试图通过制造新的酶来改善大自然,这种酶可以帮助将农业废物转化为生物燃料。他们寻找一种叫做木聚糖酶的天然酶的最佳成分,微生物利用这种酶来分解植物细胞壁,并将它们混合匹配,产生数千种新的木聚糖酶。Hosseinzadeh说:“我们将看到越来越多的努力使用蛋白质设计来定制酶来完成我们希望它们做的工作。”

人工智能蛋白质设计可以在其他方面对环境有益。Baker的团队已经证明,提高捕获二氧化碳的酶的效率是可能的,这一进步可能会导致更好的烟囱净化器来对抗气候变化。他说,他们现在正准备看看是否能设计出捕捉甲烷的酶,甲烷是一种更强的温室气体。

在更远的地方,Huang的团队已经开始考虑重新设计一种叫做肌凝蛋白的蛋白质,它可以驱动肌肉收缩,用光来代替人体正常的化学燃料ATP。如果成功,这一努力最终可能会产生光动力人造肌肉。“在这个阶段,这更像是科幻小说。”至少现在是这样。但以蛋白质设计的发展速度来看,也许不会持续太久。

提问-留言

Please enter your name.sad
Please enter a comment.

Sign up for D.C. Diagnosis
newsletter

A weekly insider's guide to the politics and policies of health care.