PacBio研究专题
二代测序读长偏短,环境宏基因组样品研究受到了很大限制。作者通过三代测序对来自地中海的冬季混合海水样本进行宏基因组测序。利用PacBio Sequel II平台的超长读长明显可以提升宏基因组的组装质量,又能显著提升MAGs质量。研究人员通过比较PacBio Sequel II平台CCS(HiFi)模式及传统的illumina NGS的组装指标,证实了上述结论:
研究者利用SPAdes 3.14、Flye v2.7和HiCanu v2.0等不同软件组装CCS数据,同时与NGS常规流程进行比较:PacBio组装结果的contig N50可达到5.35-5.95 Mb;是NGS的几十倍,其中最长的contig达到了2.6Mb,正好是NGS的十倍。从基因的平均长度来看,PacBio提供了更可靠的结果。
(A) 本研究(LR)中中等质量MAGs(>50%完整,<5%污染)与NGS结果的比较(分别为蓝色柱图与红色柱图)。
(B) 小提琴图显示了窗格中描述的MAGs的平均连续大小和完整程度.
结论:
1) 利用三代测序的long reads可以直接获得完整的基因,避免基因组装造成的误差。
2) 三代测序的HiFi reads有助于重建更完整的元基因组(MAGs),特别是针对具有高度多样性的微生物。
3) 利用三代测序重建的MAGs完整性更高,包含更多自适应基因,可用于生物技术潜能挖掘。
4) 基于PacBio测序的CCS模式获得的序列,错误率更小,更适用于针对复杂微生态样本的MAGs研究。
联系客服