动植物基因组de novo

不依赖于任何参考序列信息就可对某个物种进行全基因组测序和拼接组装,构建该物种的全基因组序列图谱与基因组数据库,为后续基因挖掘、功能验证提供DNA序列信息。

基因组Survey

基于小片段文库的低深度测序数据,通过K-mer分析,有效评估基因组大小、GC含量、杂合度高低及重复序列含量等信息,为后续的组装策略的制定提供理论依据。

基因组辅助组装

在已有二代或三代数据组装的基因组前提下,通过Bionano光学图谱或10x Genomics Linked-reads或Hi-C技术进一步组装,以获得更高质量的基因组序列。

纯三代动植物基因组de novo

利用纯三代数据进行基因组组装,然后利用二代数据进行纠错,能对高重复序列、转座子区域与高度变异区等基因组的复杂区域进行高水平组装。

文章案例

利用基因共表达网络精确筛选与大豆开花时间相关的GWAS/QTL区间中的候选基因

PacBio+Bionano+Hi-C助力高质量中国大豆基因组发布

大豆是重要的粮食经济作物,在引种和改良过程中产生了遗传瓶颈效应,使得来自不同主产区的大豆品种间具有显著的遗传变异。中国科学院遗传与发育生物学研究所联合中国科学技术大学、江苏省农业科学院种质资源与生物技术研究所和万博manbetx官网信息分析工程师张海宽、邢世来进行了一项研究,该研究团队结合PacBio Sequel单分子实时测序(SMRT)、Bionano Saphyr单分子光学图和高通量染色体构象捕获技术(Hi-C),对Zhonghuang 13品种的基因组进行从头组装,最终得到1.025 Gb的基因组序列,包含20条染色体和1条叶绿体,此外,该团队整合大量转录组数据为Gmax_ZH13基因注释基因构建了一个完整的基因共表达网络。通过已报道控制大豆开花时间的基因与新定位的QTL或GWAS区间内候选基因的共表达关系,对新定位区间内控制该性状的基因进行更精确地筛选,得到26个可能控制大豆开花时间的基因,并利用自然群体遗传变异和表型差异的关联对其中部分基因进行了验证,这为重要农艺性状基因的挖掘提供了新的思路。

参考文献:Shen et al., De novo assembly of a Chinese soybean genome. Sci China Life Sci, 2018.