DNA元件百科全书(Encyclopedia of DNA Elements,ENCODE)项目是一项全球性的工作,旨在了解人类基因组的功能。随着最新阶段的完成,ENCODE项目报道了人类和小鼠基因组中数百万个候选DNA“开关”,这对于解释遗传密码,了解基因何时何地打开至关重要。同时这一项目还提供了新的可视化工具,帮助科研人员使用ENCODE的大型数据。
目前科学家们在表征蛋白质编码基因方面已经取得了重大进展,这些基因仅占人类基因组的2%。研究人员对剩下的98%的基因组了解得很少,包括其中的哪些部分执行了什么功能。ENCODE可以帮助填补这一重要的知识空白。
ENCODE 3最新结果发表在Nature杂志以及其它主要期刊上,这10多篇论文汇总了20多年来的重要成就,将有助于揭示遗传变异如何塑造人类健康和疾病的。
NHGRI所长,医学博士Eric Green表示:“ ENCODE 3的主要作用之一是开发能与更多的研究团体共享数千个ENCODE实验数据的技术方法,帮助扩大我们对基因组功能的理解。 ENCODE 3搜索和可视化工具帮助促进了开放科学。”
为了评估不同DNA区域的潜在功能,ENCODE研究人员分析了通常与调节基因的开关相关的生化过程。这种生化分析方法是快速而全面地探索整个基因组的有效方法,有助于在DNA中定位“候选功能元件”的区域。研究人员根据这些生化特性预测功能元件的DNA区域,然后可以在进一步的实验中测试候选元件,鉴定和表征其在基因调控中的功能。
ENCODE项目负责人Elise Feingold博士说:“ENCODE面临的主要挑战是不同的基因和功能区域在不同的细胞类型中具有活性。这意味着我们需要测试大量多样的生物样品,建立基因组中候选功能元件的目录。”
在最新完成的ENCODE第三阶段中,研究人员进行了近6,000次实验,包括人体实验4,834次,小鼠实验1,158次,希望能阐明基因及其各自基因组中潜在调控因子的细节。
在人类和小鼠中进行的这些实验是在几种生物学背景下进行的。研究人员分析了DNA的化学修饰,与DNA结合的蛋白质和RNA如何相互作用以调节基因。 ENCODE 3的结果也有助于解释蛋白质编码区以外的DNA序列变异如何影响基因的表达,甚至是特定变异远距离影响基因。
UCONN Health遗传与基因组科学系教授兼主席Brenton Graveley博士说: “该项目为以前的数据类型(例如DNA结合蛋白和染色质标记),以及新的数据类型(例如长距离DNA相互作用和蛋白质-RNA相互作用)增加了极大的分辨率和清晰度。”
同时,ENCODE 3研究人员还创建了一种资源,详细介绍了不同种类的DNA区域及其对应的候选功能。这种名为SCREEN的工具帮助研究人员可视化支持解释数据。