日前,由中国农业科学院作物科学研究所牵头,联合国际水稻研究所、上海交通大学、华大基因、深圳农业基因组研究所、安徽农业大学、美国亚利桑那大学等16家单位,历时7年共同协作攻关完成的“3000份水稻基因组计划”结出硕果。该研究对来自全球89个国家的代表了78万份核心种质约95%遗传多样性的3010份水稻进行了重测序和大数据分析,针对水稻起源、分类和驯化规律进行了深入探讨,剖析了水稻核心种质资源的基因组遗传多样性;揭示了亚洲栽培稻的起源和群体基因组变异结构;建立了基于水稻基因组信息的数据库和应用平台,推进传统“经验育种”向现代“精准育种”跃升。相关研究成果于2018年4月25 日以长文形式在线发表在国际顶级期刊《自然( Nature )》杂志上。
水稻是全世界最重要的粮食作物之一,预计到2050年,全球的稻米产量必需增加1倍以满足未来人口增加的需求。而且,在全球气候变化的趋势下,如何培育优质、高产、广适的水稻新品种一直是育种家面临的巨大挑战。过去20多年,全球科学家已经克隆了多个水稻基因,然而,如何将这些功能基因组的研究成果转化为育种家所能利用的分子设计育种信息,则必须对水稻种质资源的基因组信息进行充分了解。“3000份水稻基因组计划”正是在这样的背景下应运而生,利用新一代基因组测序技术和高性能的计算机平台对水稻种质资源进行大规模的基因组重测序和大数据分析,解析水稻种群基因组多样性的本质,对于高效挖掘水稻有利基因、实现基于全基因组信息的水稻分子设计育种具有重大的理论和实践意义,是关系着国家乃至全球粮食安全的重大战略问题。
国内外“大联合”—“大协作”—“大共享”
2011年9月,中国农业科学院、国际水稻研究所和华大基因共同启动“全球3000份水稻核心种质资源重测序计划”(3K Rice Project),拉开了水稻核心种质资源全基因组测序和基因组分析的序幕。2014年5月,3010份水稻基因组测序数据于“世界饥饿日”公开发布于NCBI、DDBJ、GigaScience、阿里云等数据库,于全球共享。同时,基于测序结果建立了若干重要数据库和资源:SNP和表型数据库(Rice SNP-Seek Database);3K 泛基因组数据库(RPAN: Rice Pan-genome Browser);另外,泛基因组和结构变异原始数据将发布在Nature旗下的Scientific Data杂志上。同时,该项目从国际水稻研究所引进了2400份水稻核心种质,极大丰富了我国的水稻遗传多样性。目前3010份水稻种质已经发放给中国科学院、武汉大学、华中农业大学等40家科研单位、高校和育种单位,发放超过4万份次,用于大规模发掘影响水稻高产、抗病虫、抗逆、优质新基因和育种应用,全面开始推进水稻全基因组分子育种。
巨量的多态性基因组信息数据库推进传统“经验育种”向现代“精准育种”跃升
水稻种群的基因有着丰富的多样性和复杂的作用机制,是水稻育种改良的遗传基础。长期以来,全球科学家一直致力于阐明水稻基因组所有基因的功能及其等位基因多样性与重要农艺性状的关联,并将研究成果运用到水稻遗传改良中。以基因技术为核心的分子设计育种,让水稻育种周期更短、更有针对性,代表了水稻育种的发展方向。
该研究共检测到32M的高质量SNPs和Indels,对亚洲栽培稻群体的结构和分化进行了更为细致和准确的描述和划分,由传统的5个群体增加到9个,分别是东亚(中国)的籼稻、南亚的籼稻、东南亚的籼稻和现代籼稻品种等4个籼稻群体,东南亚的温带粳稻、热带粳稻、亚热带粳稻等3个粳稻群体、以及来自印度和孟加拉的Aus和香稻;首次揭示了亚洲栽培稻品种间中存在的大量微细(>100bp)结构变异(SVs,包括易位、缺失、倒位和重复);构建了亚洲栽培稻的泛基因组,包括12,770个(62.1%)核心(core)基因家族和9,050个(37.9%)分散式(distributed)基因家族。发现了1.2万个全长新基因和数千个不完整的新基因。核心基因比较古老,大多数的新基因表现更年轻和长度偏短。
3010份水稻基因组测序的完成仅仅是一个开端,随着分析的深入和更多数据的产生,包含水稻全部优良基因多样性的数据库必将更加庞大与精细,人们可以从中找到与任何性状相关的关键基因并应用到育种实践中。这将为开展水稻全基因组分子设计育种提供足够的基因来源和育种亲本精确选择的遗传信息,为培育优质、高产、广适水稻新品种奠定基础。
亚洲栽培水稻起源的新观点和命名恢复
在我国,亚洲栽培水稻中“籼”、“粳”(gěng)两大亚种早在2000多年前的汉代已被人们所认知,但籼、粳稻的起源和命名在国际上一直存有争议。日本学者加藤茂范于1928年将“籼”、“粳”称为indica(Oryza sativa L. subsp. indica Kato)和 japonica(Oryza sativa L. subsp. japonica Kato),并一直沿用至今。从拉丁文标注可以看出,两个亚种用“印度”和“日本”来命名,带有很深的殖民主义烙印,也错误地反映了籼、粳的亲缘关系、地理分布和起源。我国老一辈著名水稻专家丁颖先生把籼稻定名为籼亚种,粳稻定名为粳亚种(O. sativa L. subsp. keng Ting)。在维基百科中(http://zh.wikipedia.org/wiki/粳稻)也标注了粳(geng)稻(学名Oryza sativa subsp. keng)。本研究通过对大量重要进化相关基因的单倍型和泛基因组分析发现,籼稻携带的很多基因不存在于粳稻中,粳稻的很多基因也不存在于籼稻中。此外,不同地理来源的水稻农家品种群体都带有特异的基因家族。根据这些结果首次提出了籼、粳亚种的独立多起源假说,并恢复使用籼(Oryza sativa subsp. xian)、粳(Oryza sativa subsp. geng)亚种的正确命名,使中国源远流长的稻作文化得到正确认识和传承。
此项成果将推动水稻规模化基因发掘和水稻复杂性状分子改良,提升全球水稻基因组研究和分子育种水平,加快优质、高产、广适水稻新品种培育。该研究是国内外水稻研究专家大协作取得的成果,体现了中国在水稻基因组研究方面居于世界领先位置,并扩大了我国水稻功能基因组研究国际领先优势。在国家扩大开放的大背景下,重大数据共享和重大项目合作,将为我国乃至全球农业研究水平带来更大的飞跃。
作科所王文生副研究员等12人为该篇论文的第一作者。作科所黎志康研究员等7人为该篇论文的通讯作者。作科所为该成果的第一完成单位。该研究得到了科技部“863”计划、“十三五”国家重点研发计划、比尔及梅琳达盖茨基金、中国农业科学院科技创新工程、深圳孔雀团队等项目的资助。该项目是由中国科学家主导的,世界范围内的一次大规模、高水平的科研合作,项目产生的所有数据和测序材料已经通过多个途径对外公开分享。