所有生物功能都依赖于不同蛋白质之间的相互作用。这些相互作用促进了从转录DNA、控制细胞分裂到复杂生物体的高级功能的一切过程。
然而,这些功能是如何在分子水平上协调的,以及蛋白质是如何相互作用的——无论是与其他蛋白质还是与自身的副本——一直是生物学研究的热点问题。
最近的研究表明,即使是不完整的蛋白质片段,其氨基酸短序列仍可以与目标蛋白质的界面结合,再现天然的相互作用。通过这种方式,它们可以改变蛋白质的功能或破坏其与其他蛋白质的相互作用。因此,蛋白质片段不仅可以增强蛋白质相互作用和细胞过程的基础研究,还可能具有治疗应用价值。
最近发表在《美国国家科学院院刊》(PNAS)上的一篇文章称,研究人员开发了一种基于现有人工智能模型的新方法,可以计算预测大肠杆菌中能够结合和抑制全长蛋白的蛋白质片段。从理论上讲,这种工具可以产生针对任何蛋白质的基因可编码抑制剂。
这项工作由生物学副教授、霍华德·休斯医学研究所研究员Gene-Wei Li的实验室与Jay A. Stein生物学教授、生物工程教授和系主任Amy Keating的实验室合作完成。
利用机器学习
研究人员开发的名为FragFold的程序利用了人工智能模型AlphaFold。近年来,AlphaFold因其在预测蛋白质折叠和相互作用方面的卓越能力而在生物学领域取得了重大突破。
该项目的目标是预测片段抑制剂,这是AlphaFold的新应用。研究人员通过实验证实,即使之前没有这些相互作用机制的结构数据,FragFold对结合或抑制的预测中有一半以上是准确的。
“我们的研究结果表明,这是一种可推广的方法,可以找到可能抑制蛋白质功能的结合模式,包括新的蛋白质靶点。你可以把这些预测作为进一步实验的起点。”Li实验室的博士后、共同第一作者Andrew Savinov表示,“我们真的可以将其应用于没有已知功能、没有已知相互作用,甚至没有已知结构的蛋白质,我们可以在我们正在开发的这些模型中增加一些可信度。”
其中一个例子是FtsZ,一种对细胞分裂至关重要的蛋白质。它被研究得很好,但包含一个本质上无序的区域,因此特别具有挑战性。无序蛋白质是动态的,它们的功能相互作用很可能转瞬即逝——发生得如此短暂,以至于目前的结构生物学工具无法捕捉到单个结构或相互作用。
研究人员利用FragFold来探索FtsZ片段的活性,包括内在无序区域的片段,以确定与各种蛋白质的几种新的结合相互作用。这一理解上的飞跃证实并扩展了之前测量FtsZ生物活性的实验。
“这是AlphaFold如何从根本上改变我们研究分子和细胞生物学的一个例子。”Keating说,“人工智能方法的创造性应用,比如我们在FragFold上的工作,开辟了意想不到的能力和新的研究方向。”
抑制和超越
研究人员通过计算每个蛋白质片段,然后模拟这些片段如何与他们认为相关的相互作用伙伴结合,来完成这些预测。他们将整个序列的预测结合图与这些相同片段在活细胞中的效果进行了比较,这些片段是通过高通量实验测量确定的,其中数百万个细胞每个产生一种蛋白质片段。
AlphaFold使用共同进化信息来预测折叠,并且通常在每次预测运行时使用称为多序列比对(MSA)的东西来评估蛋白质的进化史。MSA至关重要,但对于大规模预测来说是一个瓶颈——它们可能会占用大量的时间和计算能力。
在FragFold中,研究人员预先计算了一次全长蛋白的MSA,并使用该结果来指导对该全长蛋白的每个片段的预测。
Savinov与Keating实验室2023届校友塞Sebastian Swanson博士一起,预测除了FtsZ之外,还有多种蛋白质的抑制片段。在他们探索的相互作用中,脂多糖转运蛋白LptF和LptG之间的复合物是一个典型案例。LptG的一个蛋白质片段抑制了这种相互作用,可能破坏了脂多糖的传递,而脂多糖是大肠杆菌外细胞膜的重要组成部分,对细胞适应性至关重要。
“令人惊讶的是,我们可以如此准确地预测结合,事实上,我们经常预测与抑制相对应的结合。”Savinov说,“对于我们研究过的每一种蛋白质,我们都能找到抑制剂。”
研究人员最初将重点放在作为抑制剂的蛋白质片段上,因为一个片段是否可以阻断细胞的基本功能是一个相对简单的结果,可以系统地测量。展望未来,Savinov还对探索抑制之外的片段功能感兴趣,例如片段可以稳定它们所结合的蛋白质,增强或改变其功能,或触发蛋白质降解。
原则上的设计
这项研究是对细胞设计原理进行系统理解的起点,以及深度学习模型可以利用哪些元素来做出准确的预测。
“我们正在朝着一个更广泛、更深远的目标努力。”Savinov说,“现在我们可以预测它们,我们是否可以利用我们从预测和实验中获得的数据来提取出显著特征,以弄清楚AlphaFold实际上了解了什么是好的抑制剂?”
Savinov和合作者还进一步研究了蛋白质片段如何结合,探索其他蛋白质相互作用和突变特定残基,以观察这些相互作用如何改变片段与目标的相互作用。通过实验检查细胞内数千个突变片段的行为,一种被称为深度突变扫描的方法,揭示了负责抑制的关键氨基酸。在某些情况下,突变片段甚至比它们天然的全长序列更有效。
“与以前的方法不同,我们并不局限于在实验结构数据中识别片段。”Swanson说,“这项工作的核心优势是高通量实验抑制数据和预测结构模型之间的相互作用:实验数据引导我们找到特别有趣的片段,而FragFold预测的结构模型为片段在分子水平上的功能提供了一个具体的、可测试的假设。”
Savinov对这种方法的未来及其无数应用感到兴奋。
“通过创建紧凑的、基因可编码的粘合剂,FragFold为操纵蛋白质功能开辟了广泛的可能性。”Li同意道,“我们可以想象提供功能化片段,可以修改天然蛋白质,改变它们的亚细胞定位,甚至重新编程它们,为研究细胞生物学和治疗疾病创造新的工具。”