来自克利夫兰诊所和康奈尔大学的科学家们设计了一个公开可用的软件和网络数据库,以打破识别关键蛋白质-蛋白质相互作用的障碍,从而进行药物治疗。该计算工具被称为PIONEER(Protein-protein InteractiOn iNtErfacE pRediction,蛋白质-蛋白质相互作用界面预测)。在最近发表的一篇《Nature Biotechnology 》论文中,研究人员通过确定数十种癌症和其他复杂疾病的潜在药物靶点,展示了PIONEER的实用性。
克利夫兰诊所基因组中心主任、该研究的联合主要作者Feixiong Cheng博士说,基因组研究是药物发现的关键,但单靠基因组研究并不总是足够的。从发现致病基因到进入临床试验的平均时间是10-15年。理论上,基于基因数据制造新药是很简单的:突变的基因产生突变的蛋白质。我们试图通过阻止这些蛋白质与健康蛋白质相互作用来制造分子,阻止这些蛋白质破坏关键的生物过程,但实际上,说起来容易做起来难。在我们体内,一种蛋白质可以以许多不同的方式与数百种其他蛋白质相互作用,形成一个复杂的蛋白质相互作用网络,称为相互作用组。当致病的DNA突变被引入其中时,情况变得更加复杂。一些基因可以通过多种方式突变来引起相同的疾病,这意味着一种疾病可能与由一种不同突变的蛋白质产生的许多相互作用组有关。药物开发人员需要从数以万计的潜在致病相互作用中进行选择,而这只是在他们根据受影响蛋白质的物理结构生成清单之后。
Cheng博士试图制造一种人工智能(AI)工具,以帮助遗传/基因组研究人员和药物开发人员更容易地识别最有前途的蛋白质-蛋白质相互作用,并与康奈尔大学创新蛋白质组学中心主任Haiyuan Yu博士合作。该小组整合了来自多个来源的大量数据,包括:
来自近10万人的基因组序列,这些人要么出生时携带致病突变,要么在生命后期获得这些突变(通常是癌症)。
超过16,000种人类蛋白质的物理三维结构,以及DNA突变如何影响这些结构的数据。
已知的30万种不同蛋白质对之间的相互作用。
摘要
为了帮助将遗传发现转化为疾病病理生物学和治疗学发现,我们提出了一个集成深度学习框架,称为PIONEER(蛋白质-蛋白质相互作用界面预测),该框架预测人类和其他七种常见模式生物中所有已知蛋白质相互作用的蛋白质结合伴侣特异性界面,以生成全面的结构信息蛋白质相互作用组。我们证明PIONEER优于现有的最先进的方法,并通过实验验证了其预测。我们发现疾病相关突变集中在PIONEER预测的蛋白-蛋白互作界面中,并探讨了它们对疾病预后和药物反应的影响。我们通过对33种癌症类型的约11,000个全外显子组的分析,鉴定出586个携带PIONEER预测互作界面体细胞突变(称为oncoPPIs)的显著蛋白蛋白相互作用(PPIs),并显示出oncoPPIs与患者生存和药物反应的显著关联。PIONEER作为web服务器平台和软件包实现,可识别疾病相关等位基因的功能后果,并为多尺度交互组网络水平的精准医疗提供深度学习工具。
亮点
他们得到的数据库能够引导研究人员在从脱发到血管性血友病等10500多种疾病的相互作用组中探索。确定疾病相关突变的研究人员可以将其输入PIONEER,以获得导致疾病的蛋白质-蛋白质相互作用的排名列表,这些蛋白质可能作为药物靶点。科学家可以通过名称搜索一种疾病,以获得一份潜在致病蛋白质相互作用的清单,然后他们可以继续进行研究。PIONEER旨在帮助生物医学研究人员专门研究几乎任何疾病,包括自身免疫、癌症、心血管、代谢、神经和肺部。
该团队在实验室验证了他们的数据库预测,在那里他们对1000多种蛋白质进行了近3000次突变,并测试了它们对近7000种蛋白质-蛋白质相互作用对的影响。基于这些发现的初步研究已经在开发和测试肺癌和子宫内膜癌的治疗方法。该团队还证明,他们的模型的蛋白质-蛋白质相互作用突变可以预测:
各种癌症的存活率和预后,包括肉瘤,一种罕见但可能致命的癌症。
大型药物基因组学数据库中的抗癌药物反应。
研究人员还通过实验验证了NRF2和KEAP1蛋白之间的蛋白-蛋白相互作用突变可以预测肺癌的肿瘤生长,为靶向癌症治疗开发提供了新的靶点。
Cheng博士说:“进行相互作用组研究所需的资源对大多数遗传研究人员来说是一个重大的进入障碍。”“我们希望PIONEER能够克服这些计算障碍,减轻负担,让更多的科学家有能力推进新疗法。”