◎本报记者 赵汉斌 实习生 杨紫娟
竹类植物是竹亚科植物的总称,与水稻、小麦、大麦和燕麦同属于禾本科bop分支,具有重要的经济、生态和文化价值。有效整理盘活海量的竹类组学和分类学信息数据,更好地服务竹类植物的系统进化和功能研究,已经成为研究人员和相关产业的迫切需求。
近日,中国科学院昆明植物研究所研究员李德铢团队基于长期研究成果,搭建并公布了一个竹类组学和分类学信息平台(bamboobase),相关论文在线发表于国际期刊《分子植物》。
这一信息平台收录了竹类植物18个不同版本的基因组、476个转录组和16个表观基因组的数据,以及135个属的分类学信息。研究团队基于序列相似性和基因共线性信息,构建了竹亚科物种基因组及亚基因组间的同源基因数据集。
该平台提供了丰富的生物信息学工具,方便用户对不同竹类植物基因以及基因同源关系进行查询、分析和可视化。“竹类组学和分类学信息平台用户界面友好,是一个集成竹类多组学和分类学资源的信息平台,可为全球从事竹类相关研究的人员提供一站式数据支持。”李德铢介绍。
在演化进程中,竹类植物经历过多次异源多倍化事件,各主要分支间形成复杂的网状演化关系,同源基因的鉴定比较困难。该平台选择水稻作为外类群,以亚基因组为单位,通过整合序列相似性和基因共线性信息,将13个基因组27个亚基因组的基因聚类划分到16.63万个共线直系同源基因簇。与仅使用序列相似性信息聚类方法获得的基因簇相比,同源基因簇在区分直系同源基因和旁系同源基因方面表现更优。
“此外,相较于严格要求基因拷贝数符合染色体倍性的‘完美拷贝’方法,共线直系同源基因簇提供了更灵活和更全面的直系同源基因数据集。”中国科学院昆明植物研究所副研究员刘云龙介绍,平台用户可以从目标基因出发,查询其所在同源基因簇的所有基因列表和基因树。
竹类组学和分类学信息平台为每个基因建立一张“卡片”,记录包括基因注释、各类组织和不同发育阶段表达量等基本信息。研究人员还可以从该卡片链接到基因组可视化和同源基因等模块以及相关外部数据库。此外,平台还提供了丰富的查询、分析和可视化工具,如微观和宏观尺度(亚)基因组共线性、序列搜索比对、引物设计、同一竹种不同拼接组装版本的基因id转换、功能基因富集和共表达网络分析等。
除了多组学数据外,平台的竹类系统发育工作组版块集中介绍了全球竹亚科已知的3个族135属的主要分类学信息,包括每个属发表时的原始文献、异名、模式种、形态学描述和地理分布等。同时,该平台还提供了一些主要属的相关研究文献、标本及活体照片和所含物种等信息。