最新动态
Information & News

【科研成果】进化所原生动物学团队高珊课题组在四膜虫大核基因组注释方面取得新进展

发布时间:2024-12-11浏览次数:38

  一个完整且注释精准的基因组是解析生物学功能和调控机制的核心基石。基因注释包括编码蛋白基因的编码区(CDS)、非编码区(UTR)、转录起始位点(TSS)和转录终止位点(TES)、非编码RNA,以及基因的可变剪切亚型等关键特征的识别的标注。只有通过高质量的基因注释,才能将基因组序列转化为具有生物学意义的信息。

  嗜热四膜虫(Tetrahymena thermophila广泛应用于基础生物学研究的单细胞模式真核生物,曾因酶和端粒酶的研究分别斩获1989年诺贝尔化学奖和2009诺贝尔生理或医学奖。四膜虫大核基因组已历经多次组装和注释,其中包括2020年由海洋生物多样性与进化研究所原生动物学团队高珊教授课题组率先完成的端粒到端粒的完整基因组组装[1]。然而,现有的基因注释仍存在诸多不足,例如基因错误注释、TSSTES位置不准确,以及UTR信息缺失等。近日,高珊教授课题组过整合大规模的转录组数据和表观遗传学数据运用机器学习模型、人工核对和实验验证,深度优化了嗜热四膜虫大核基因组注释,相关成果Comprehensive genome annotation of the model ciliate Tetrahymena thermophila by in-depth epigenetic and transcriptomic profiling2024129在线发表于Nucleic Acids Research 杂志上。

研究团队收集了四膜虫不同生长阶段(生长、饥饿和接合生殖)的大规模RNA-seq数据,结合纳米孔直接RNA测序(Nanopore DRS)、链特异性RNA-seq等技术,对基因模型进行了全面校正和重注释。与此同时,还引入了H3K4me3H2A.Z6mA、核小体等表观遗传标记,使用机器学习算法进一步优化了基因注释。通过对表观组和转录组数据的整合(图1),团队成功预测了24351TSS,并基于Cap-seq数据验证了这些TSS的准确性。最终,优化后的基因组新增了2481个基因,并对23936个基因模型进行了修订,其中包括外显子改变、基因合并、基因拆分以及基因方向反转等。此外,研究团队首次注释26047个基因UTR,并鉴定5500个基因的8,339种可变剪切亚型这些优化显著提升了四膜虫基因组注释的完整性和准确性,不仅强化了四膜虫作为遗传工具在生物学研究中的实用价值,还为其他真核生物的基因组注释提供了有益的借鉴。

  团队同时鉴定了5525个天然反义转录本(NATs),并发现约20%的蛋白编码基因存在反义转录。NATs通常较短且低表达,但在四膜虫的有性(接合)生殖阶段,其表达水平显著升高。进一步分析表明,大部分NATs与其正义蛋白编码基因呈现互斥的时间特异性表达模式,可能通过与正义基因相互作用,调控其转录或翻译。这一发现为揭示四膜虫的转录调控机制提供了新的视角。

1. 整合转录组和表观遗传数据优化基因模型示意图

  海洋生物多样性与进化研究所原生动物学团队高珊教授为文章的通讯作者。博士生叶飞、山东大学陈晓教授和博士毕业生李源为共同第一作者。硕士鞠艾利、博士毕业生盛亚岚、博士生段丽丽、张佳晨和张喆,以及美国布拉德利大学Naomi A. Stover副教授等对本文亦有重要贡献。该工作得到海洋生物多样性与进化研究所超算集群、崂山实验室高性能科学计算与系统仿真平台和中国海洋大学高等海洋研究院海洋大数据中心等计算资源的资助

 原文链接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkae1177/7919455

研究团队

第一作者——叶飞

参考文献:

1.Sheng,Y., Duan,L., Cheng,T., Qiao,Y. and Gao,S. (2020) The completed macronuclear genome of a model ciliate Tetrahymena thermophila and its application in genome scrambling and copy number analyses. Sci. China Life Sci., 63, 1534–1542.

2.Rosa,S., Duncan,S. and Dean,C. (2016) Mutually exclusive sense–antisense transcription at FLC facilitates environmentally induced gene repression. Nat. Commun, 7, 13031.