在最近发表在《自然医学》杂志上的一项研究中,研究人员开发了一种蛋白质组年龄时钟,使用血浆蛋白来预测生物年龄和相关的健康风险。他们发现,这个时钟准确地预测了年龄,并与不同人群患主要慢性疾病、多病和死亡率的风险有关。
衰老是心脏病、中风、糖尿病和癌症等慢性疾病发病的关键因素,尽管发病时间和严重程度因人而异。虽然实足年龄经常被用来估计生物衰老,但它可能不是一个准确的替代测量。这项研究意义重大,因为它是第一个在大型和多样化人群中验证蛋白质组年龄时钟的研究,为预测与年龄相关的疾病和死亡率提供了一个强大的工具。使用“组学”数据可以实现更准确的估计,这反映了个体的生物功能。生物老化影响慢性病、残疾和医疗保健需求的风险。尽管脱氧核糖核酸甲基化(DNAm)时钟之前已被用于测量生物年龄,但蛋白质水平可能会为衰老机制提供更直接的见解。尽管先前的研究已经开发出蛋白质组年龄时钟来预测疾病风险和死亡率,但没有一个研究在大规模、多样化的人群中做到这一点。因此,本研究的研究人员通过开发和验证不同人群的蛋白质组年龄时钟,并评估其对慢性疾病风险、死亡率和衰老相关特征的预测能力,解决了这一差距。
在本研究中,数据来自三个大型生物库队列-英国生物库(UKB),中国嘉道里生物库(CKB)和芬兰。研究人员通过Olink Explore 3072平台开发并验证了蛋白质组年龄时钟。生物钟可以根据特定蛋白质的表达水平来预测一个人的生物年龄,这可能与他们的实际年龄不同。这种差异被称为“ProtAgeGap”,研究人员分析了它与衰老、虚弱和疾病的关系。
共有45,441名参与者来自UKB(39-71岁,女性占54%),3,977名来自CKB(30-78岁,女性占54%),1,990名来自FinnGen(19-78岁,女性占52%)。对蛋白质组学数据进行处理并标准化,在质量控制后选择2897个蛋白质进行分析。采用了梯度增强模型(LightGBM),在预测实足年龄方面优于其他机器学习模型。递归特征消除有助于识别20个最重要的蛋白质,形成最小的预测模型(ProtAge20),保持了较高的准确性。该模型在UKB中使用五重交叉验证进行训练和验证,并应用于CKB和FinnGen队列来计算ProtAgeGap。统计分析包括使用线性或逻辑回归、Cox比例风险模型、功能富集分析、Shapley加性解释(SHAP)相互作用分析、Kaplan-Meier生存分析和蛋白质-蛋白质相互作用(PPI)网络可视化。
在11-16年的随访期间,CKB组、UKB组和FinnGen组的死亡率分别为10.6%、36%和1%。总共鉴定出204种与衰老相关的蛋白质,年龄与这些蛋白质之间的关系随着时间的推移而稳定。
发现ProtAgeGap与生物衰老标志物和临床结果相关。结果显示,它是多病、全因死亡率(风险比[HR] = 1.15 /年ProtAgeGap)和14种非癌症疾病(包括阿尔茨海默病(HR = 1.11)、慢性肾脏疾病(HR = 1.14)和2型糖尿病(HR = 1.13))风险的有力预测因子。此外,ProtAgeGap还显示与癌症风险相关,包括乳腺癌(HR = 1.12)、肺癌(HR = 1.09)和前列腺癌(HR = 1.08)。ProtAgeGap还被发现与各种生物衰老标志物(例如,端粒长度,胰岛素样生长因子-1)以及认知和身体功能的测量有关。包括非吸烟者和正常体重个体在内的敏感性分析证实了这些关联。
根据这项研究,蛋白质组年龄时钟主要受参与多种生物功能的蛋白质的影响,如细胞外基质相互作用、免疫反应和炎症、激素调节、生殖、神经元发育和分化。蛋白质组学时钟显示与dna时钟的重叠有限,突出了新的衰老相关蛋白质,并为衰老生物标志物提供了额外的见解。该研究通过使用梯度增强模型得到加强,该模型允许蛋白质之间的非线性关联和相互作用,与其他模型相比,提供了更好的通用性。然而,该研究受限于Olink Explore 3072平台的单独使用,限制了蛋白质覆盖范围,并且缺乏与DNAm年龄时钟直接比较的DNAm数据。
总之,本研究中开发的蛋白质组年龄时钟为生物衰老提供了一个强大的预测系统,可以深入了解与年龄相关的疾病、虚弱和死亡机制。该研究表明,血浆蛋白质组学是测量生物年龄的可靠方法,从而指导药物靶点、新的干预措施或生活方式的改变,从而潜在地减少过早死亡,延缓主要与年龄相关的健康状况的发生。