基于Nanopore平台的Ultra long测序能够产生N50超过100Kb的超长数据,能够轻松跨越基因组中连续重复或大片段重复区域。在基因组组装过程中加入适量 Ultra long 数据,可显著提升基因组组装质量。那么采用纯Ultra long reads组装基因组能够达到什么样的效果呢?
希望组科技服务自去年8月实现单张芯片测序读长N50突破100Kb以来,已经完成了多个不同物种、不同大小基因组的纯Ultra long reads组装。下面组学君就通过两个实际项目案例给大家展示纯Ultra long reads组装基因组的结果吧~
案例一 10Gb基因组纯Ultra long reads组装 | |
---|---|
物种 | 某单子叶植物 |
基因组大小 | 约10Gb |
超长测序数据产出 | 约1200Gb |
平均读长N50 | 51.9Kb |
最长单Cell reads N50 | 143.3Kb |
组装、校正软件 | NextDenovo、NextPolish |
组装连续性 | Contig N50=93Mb |
组装完整性 | BUSCO评估97.75% |
组装准确性 | 二代数据比对率99.75%, 单碱基准确度超99.99% |
某基因组大小约10Gb的单子叶植物,采用平均N50超过50Kb的Ultra long数据,利用NextDenovo对进行纯Ultra long reads组装。随后依次使用原始三代数据和二代数据应用Nextpolish软件对基因组进行校正,得到校正后的基因组(Polish Genome)。最终组装基因组大小为10.76Gb,contig N50 达到了93.26Mb!基因组组装完整性评估BUSCO达到97.75%,准确性评估二代数据比对率为99.75%!
案例一 纯Ultra long reads组装结果
大型动植物基因组往往高重复,或多倍体或发生过多倍化事件,导致其从头测序和序列组装成为世界性难题。案例一表明采用纯Ultra long reads数据组装大型基因组,能够获得高连续性、高完整性和高准确性的基因组,是解决大型基因组组装难题的利器!
案例二 Reads N50 >100Kb,Contig N50 >200Mb! | |
---|---|
物种 | 某植物 |
基因组大小 | 约2Gb |
超长测序数据产出 | 约600Gb |
最长单Cell reads N50 | 129.3Kb |
用于组装reads N50 | 大于100Kb |
组装、校正软件 | NextDenovo、NextPolish |
组装连续性 | Contig N50=220.12Mb |
组装完整性 | BUSCO评估95.29% |
组装准确性 | 二代数据比对率95.27%, 单碱基准确度99.9989% |
选取纯超长且过滤使得N50大于100Kb的数据,利用NextDenovo进行纯Ultra long reads组装。依次使用原始三代数据和二代数据应用Nextpolish软件对基因组进行校正,校正后的基因组大小为2.15Gb,仅有47条Contig,Contig N50达到惊人的220.12Mb!BUSCO评估显示在该组装中可以找到约95.29%的完整基因元件,反映组装结果真实可靠。进行基因组单碱基错误率的统计,该组装基因组的单碱基准确率在99.9989%以上!
案例二纯Ultra long reads组装结果
希望组科技服务自2017年底正式推出ONT Ultra long测序服务,多年的技术积累迎来实力的爆发,目前已经能够稳定产出高质量的Ultra long测序数据,多个纯Ultra long Reads组装项目已成功交付。第一批吃螃蟹的人已经心满意足而去,还不抓紧时机赶快上车!
Ultra long 直通电话:153 8703 7487,邮件联系sales-support@grandomics.com或您身边的科技顾问。
扫描左方二维码或搜索:648147005进入三代测序组学QQ群,获取Ultra long Reads最新研究资讯。