非编码DNA对于我们了解人类基因调控和复杂疾病至关重要,而测定进化序列限制有助于确定调控元件的功能相关性。尽管人类基因组与其他哺乳动物基因组的比较揭示了大量的受限基因和调控元件,但由于灵长类动物之间进化距离较短,确定灵长类特有的受限序列元件特别具有挑战性。

近日,Illumina人工智能实验室、贝勒医学院、西班牙庞培法布拉大学等机构的研究人员通过比对239种灵长类动物的基因组序列,确定了灵长类动物中受限序列元件(CSE)的特征。这项研究成果于11月29日发表在《Nature》杂志上。

共同通讯作者、Illumina人工智能实验室的首席研究员Kyle Kai-How Farh表示:“我们发现了数十万个在最近的进化过程中才出现的调控元件,它们是灵长类动物和人类所特有的,在其他哺乳动物中不存在。”

研究人员此次比对了239种灵长类动物的基因组,其中187种动物的基因组是最近组装的。他们检测到111,318个DNase I超敏位点和267,410个进化受限的转录因子结合位点,挖掘了人类等灵长类动物有别于其他哺乳动物的受限调控元件。

他们认为,灵长类的受限顺式调控元件(CRE)是独特的进化记录,“通过它能观察到导致我们物种形成的近期扩展适应的机制,扩展适应(exaptation)是指改变序列初始功能的适应”。

这项研究的结果与之前的工作一致,即非编码DNA比蛋白编码序列进化得更快。“我们发现许多之前没有序列受限证据的人类CRE实际上只在灵长类动物中受到限制,大大增加了人类基因组中已知的受限非编码元件的数量,”作者报告说。

研究人员特别指出,以往的GWAS研究发现的与人类复杂性状或常见疾病相关的遗传风险变异往往出现在进化受限的位点上,而GTEx研究中发现的数量性状位点往往出现在灵长类动物中最近才开始受限的调控元件位点上。

“这项研究加深了我们对非编码基因组中疾病相关变异的了解,”Farh谈道。“非编码DNA比蛋白编码序列进化得更快,我们发现人类常见疾病背后的遗传变异也往往集中在这些新进化的调控序列上。”

根据这项研究的结果,Illumina计划通过Illumina Dragen、Emedgene、Connected Insights和Illumina Connected Analytics工具向客户提供全基因组保守度评分。

此外,随着未来对更多灵长类动物的测序、组装和分析,受限序列元件数据库有望进一步增加和完善。

“我们的研究结果凸显了调控序列元件的近期进化在区分灵长类动物(包括人类)与其他哺乳动物中的重要作用,”作者总结道。

原文检索

Kuderna, L.F.K., Ulirsch, J.C., Rashid, S. et al. Identification of constrained sequence elements across 239 primate genomes. Nature (2023). https://doi.org/10.1038/s41586-023-06798-8


提问-留言

Please enter your name.sad
Please enter a comment.

Sign up for D.C. Diagnosis
newsletter

A weekly insider's guide to the politics and policies of health care.