中大新闻网讯(通讯员卢建国)脊椎动物进化中的基因复制事件普遍存在,它们在获得新基因和新性状方面发挥着重要作用。而全基因组复制(WGD)可以通过增加基因组的灵活性和复杂性为自然选择提供重要原料,是基因复制的重要来源之一。此外,WGD也是脊椎动物进化的驱动力,对物种,特别是具有复杂WGD模式的鱼类物种多样性有很大贡献(图1)。
图1 鱼类脊椎动物种类及其基因组复制格局
近年来,测序和组装技术的进步使得鱼类物种的全基因组数据呈现出快速增长的趋势。近5年来(2017-2021),NCBI数据库中的真骨下纲 (Teleostei) 鱼类的基因组装配(Assembly)数量已从136个增长到1455个,增幅近970%。在数据大爆发的背景下,现有的分析工具和平台已经无法满足研究者日益增长的鱼类基因组和多倍体化的分析需求。
最近,中山大学海洋科学学院卢建国副教授研究团队成功构建了基因-基因组共线性和WGD研究DupScan数据库和一站式分析平台(https://dupscan.sysumeg.com/)。该数据库通过整合106个染色体高质量基因组,实现了基因和基因组尺度的共线性区域的可视化分析。此外,DupScan还搭载了全基因组浏览器和BLAST功能基因染色体定位,支持包括VGD2(Vertebrate Genome Duplication2)、Ars3R(Acipenser ruthenus specific 3R)、Pss3R(Polyodon-spathula specific 3R)、Ts3R(Teleost specific 3R)、Ss4R(Salmon specific 4R)以及Cs4R(Comon carp specific 4R)等共5类WGD事件分析。用户可以使用该平台实现106种全基因组序列的共线性和WGD模式在线分析和预测,为60,000多种世界脊椎动物基因组复制格局提供了高效的在线分析工具(图2)。
图2 DupScan数据库的架构与核心功能
所建立的DupScan库具有数据规模大、质量高、便捷性和可拓展性好等特点,它不仅可服务于脊椎动物基因组进化和全基因组复制事件研究,而且也可广泛应用于其他涉及脊椎动物基因组,如染色体结构变异、同源区域(基因)查找、基因家族预测、基因组浏览以及KaKs/4DTV查询等工作。同时,DupScan数据库不仅可以加深我们对生物进化驱动力、倍性与生物性状之间以及基因拷贝数与竞争力之间的关系等方面的理解,还可以为经济鱼类分子遗传育种和品种培育工作提供重要数据平台。
以上研究成果于2022年8月10日发表在期刊Nucleic Acids Research,题目为“DupScan: Predicting and visualizing vertebrate genome duplication database”,中山大学海洋科学学院卢建国副教授为论文第一作者和通讯作者,硕士研究生黄沛霖为第二作者,南开大学计算机学院刘健教授为共同通讯作者。该研究得到了国家自然科学基金项目和南方海洋科学与工程广东省实验室(珠海)创新团队建设项目的支持。