打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
PacBio平台获得高度准确的长reads

如今,人类基因组的测序已经达到群体规模,但仍需要结合不同的测序技术(短读长和长读长),才能覆盖各种类型的遗传变异。这无疑增加了测序项目的成本和复杂度。为此,Pacific Biosciences公司的研究人员开发出一种方案,能够在Sequel测序平台上生成高度准确的长reads。



在PacBio、Google、NIST等机构的共同努力下,研究人员对人类男性HG002样本进行了测序,覆盖度达28倍,平均读长为13.5 kb,且准确性高达99.8%。这项成果于本周发表在预印本网站bioRxiv上。PacBio公司的David Rank和Michael Hunkapiller为共同通讯作者。


“一项具有长读长和高准确性的测序技术将让研究人员在单次实验中全面发现变异,”作者在文中写道。他们证实了这种方案在检测小片段和大片段变异以及基因组组装和单体型定相上媲美甚至超越现有技术。



研究团队以环状一致测序(CCS)为基础开发出一种方案。CCS通过反复通读环化模板而获得一致序列,从嘈杂的subreads中产生准确的reads。“最近SMRT测序的读长增加和经过优化的DNA模板制备为高准确性和长读长的统一提供了机会,”他们写道。


研究人员通过测序和分析人类男性HG002样本来评估这个方案的表现。HG002样本是瓶中基因组(GIAB)联盟的基准样本之一。GIAB提供了物理参考材料以及样本基因组的详细鉴定,定义了“高度可信的区域”和“高度可信的变异”。


他们在PacBio Sequel测序平台上开展了基因组测序,覆盖度达到28倍。读取准确性达到99.8%,与通常的短读长测序准确性不相上下。他们补充说,这些reads的从头组装产生了高度连续和准确的基因组,contig N50超过15 Mb,一致性为99.998%。


研究人员还分析CCS reads,以检出SNV、插入缺失和结构变异,并开展单体型定相。对于变异的检测,CCS的表现与30倍的短读长测序相当。其中,SNV的检出率为99.91%,插入缺失为95.98%,而结构变异达到95.99%。正如作者所说,几乎所有的变异都定相到单体型,这进一步改善了变异检测。


此方案不仅仅有出色的质量结果,还具备许多其他的优点。具体包括样本制备过程更轻松(因为不需要超长的基因组DNA),计算时间缩短,以及能够使用专为准确reads而设计的熟悉工具GATK。


作者认为,未来的改进 – 包括时间缩短和通量增加 – 将促进快速的群体规模基因组分析,并改善人类健康。除了人类基因组学方面的应用,这种方案也有望应用在宏基因组学以及动植物基因组的组装。


原文检索


Highly-accurate long-read sequencing improves variant detection and assembly of a human genome


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
三代测序时代的临床科研
Q40 准确率将掀起一场测序革命!
原创解读 | 三代测序在群体水平上的研究进展
干货!全面解读MinION纳米孔测序技术及应用 – SEQ.CN
比对到hg19和hg38对somatic变异的寻找影响很大
Genome Med | 灵敏检测所有类型de novo突变!仅HiFi长读长测序即可生成全面的WGS数据
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服