由意大利理工学院(IIT)首席研究员Gian Gaetano Tartaglia领导的一个研究小组开发了一种机器学习算法,用于研究细胞内蛋白质的行为,并预测它们引发神经退行性疾病(如肌萎缩性侧索硬化症(ALS)、帕金森氏症和阿尔茨海默氏症)的能力。该算法被称为catGRANULE 2.0 ROBOT,有助于确定进一步研究和治疗的分子靶点;最近发表在《基因组生物学》杂志上的一篇文章对此进行了描述。
神经退行性疾病是一项具有重大社会经济后果的重大健康挑战:在意大利,估计有100万人受到影响,一名典型患者的平均费用约为7万欧元。Tartaglia领导的小组正在研究与这些疾病发病有关的一些蛋白质的化学-物理行为。
在细胞环境中,这些蛋白质有能力产生生物分子凝聚物,高度纠缠的团块,在某些条件下,变得不溶于水。在未受影响的生物体中,这一过程在控制其他蛋白质的产生和对细胞应激作出反应方面具有功能,但冷凝机制的改变可能导致病理状态的出现:蛋白质团块变成固体结构,在细胞中积累并导致细胞死亡。这些毒性聚集体的例子有帕金森病的路易小体,与肌萎缩侧索硬化症有关的运动神经元中纤维的积累,以及与阿尔茨海默病有关的淀粉样斑块。
从健康状态到疾病的转变通常是由于蛋白质结构的变化:一种新的结构可能会改变固体聚集体中的生物分子凝聚物。在Tartaglia的指导下,印度理工学院博士后Michele Monti和Jonathan Fiorentino开发了一种名为catGRANULE 2.0 ROBOT(生物凝聚物细胞器类型中的核糖核蛋白组织的首字母缩写)的算法。这个机器学习工具探索了蛋白质结构突变与凝析物形成之间的联系;该软件可以追踪潜在的有害蛋白质,为进一步的研究和治疗确定分子目标。
“识别与神经退行性疾病相关的生化信号对于早期干预和减缓认知衰退至关重要,”研究协调员Gian Gaetano Tartaglia解释说,“我们已经训练了我们的系统来识别冷凝物的形成,这在许多情况下是形成有毒聚集体的第一步。这一事件的一个关键因素是蛋白质- rna的相互作用。”
导致生物分子凝聚体形成的物理化学机制是液-液相分离,一些蛋白质具有适合于这一过程的三维结构。RNA也调节这些团块的形成:它与蛋白质的相互作用促进或抑制相分离。
该研究小组将注意力集中在rna -蛋白质相互作用上,并训练了catGRANULE 2.0 ROBOT使用该参数来确定生物分子凝聚是否有可能发生。机器学习算法研究蛋白质的结构,分析其氨基酸序列并考虑其对RNA的亲和力。通过这种分析,研究人员可以确定蛋白质在进行相分离时是否会产生有毒的凝聚物。通过ROBOT方法,研究人员研究了突变对液-液分离的影响:如果结构的改变改变了蛋白质- rna的相互作用,它可以导致病理后果,因为它改变了凝聚物的形成。
这项研究是在IVBM- 4pap项目框架内进行的,由意大利理工学院协调,旨在开发体内布里渊显微镜(IVBM),这是一种识别神经退行性疾病治疗新靶点的工具。IVBM将在没有外部干预的情况下测量活细胞内蛋白质和凝聚物的特性。catGRANULE 2.0 ROBOT是研究联盟开发该项目的计算基础:它提供了哪些蛋白质和突变可能相关的理论预测。研究人员将使用显微镜来验证计算结果,观察细胞、蛋白质的实时行为及其与RNA的相互作用。
将算法的计算工作与显微镜下的实验活动相结合,研究人员有了一种工具来识别早期病理信号,并开发出新的治疗策略,减缓神经退行性疾病的进展。这一策略有助于减少它们的长期影响。
catGRANULE 2.0: accurate predictions of liquid-liquid phase separating proteins at single amino acid resolution