打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
短序比对工具简介
短序比对工具简介bowtie vs BWA vs Subread vs SOAP vs NovoAlign
8 七 2013   |程序员 Tags:生物信息学 ·软件
有趣的是,大部分的short read比对工具都是由中国人写出来的。因此可以说华大基因(BGI, Beijing Genomics Institute, Chinese Academy of Science)是中国NGS测序技术的摇篮。
速度上较有优势的short read(短序)比对工具最早出现的是SOAP(表1)。它很好地解决了一个问题,那就是如何在小内存(4G)的机器上将短序比对至人类基因组这样的大数据上去。我们都知道,人类基因组的大小为3.2G(表2),光把这样大的数据读入内存都是一件不太容易的事情。所以SOAP对NGS的贡献是值得我们记住的。SOAP在设计之初是针对single-end reads, 所以对paired-end的支持不被大家看好。它的成功也逐步被后起之秀所掩盖。
表1:时代表
软件发表年代PMID
SOAP200818227114
Maq200818714091
BWA200919451168
Bowtie200919261174
NovoAlign2009
Subread201323558742
表2:基因组大小(数据来源Ensenbl, release 72)
物种碱基数基因数
人 homo sapiens3.3G~21K
小鼠 mus musculus3.5G~23K
大鼠 rattus norvegicus2.6G~23K
果蝇 Drosophila melanogaster169M~14K
线虫 Caenorhabditis elegans103M~21K
之后先后出现了两个重要的比对软件, MAQ/BWA以及Bowtie。MAQ/BWA是Heng Li发表的。Li是从华大基因走出来的人,后来去了Wellcome Trust Sanger Institute, 现在在哈佛Broad Institute。MAQ的引用率非常高,并成为了Li的成名作。之后写作的BWA以准确率高而闻名,是SNP分析的首选比对软件。
而Bowtie借着其算法上的优势,在运算速度上一举成名。如果对速度的要求高于准确率的时候,bowtie就成了不二选择。bowtie被广泛地应用于ChIP-seq, RNA-seq的分析当中。
NovoAlign是一款商业软件,但是如果只是科研用途的话,可以直接从其网站上下载到编译好的程序(只支持unix/linux/mac)。它也有MPI版本。但是因为在单机上运行效率问题以及商业化的原因,它的应用并不象BWA和Bowtie那样广泛。
Subread是最新出现的比对软件。作者Wei Shi在文章中声称subread在速度和准确率上都较之前的主流软件有优势。并且它还有R/Bioconductor版本。但是在SEQanswers的讨论中,他与BWA的作者Heng Li打起了口水战,他们都声称自己的软件才是准确率最高的。甚至两人还给出了截然相反的两组比较数据(下图)
Wei Shi的比较结果
Heng Li的比较结果
由于公说公有理,婆说婆有理,加上subread还需要时间来考验,所以现在还无从判断谁的更具有优势。由于选择变多了,人们往往会变得无所适从。就我个人经验而言(其实是对研究机构前人脚本学习和接受),对于ChIP-seq, RNA-seq,多使用bowtie2,因为它快速,下游结合cufflinks等结果验证率很高。对于SNP, Indels, methylation分析,使用BWA,下游结合GATK可能会好一点。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
自学CHIP-seq分析第四讲~必要软件安装以及文章结果下载
【直播】我的基因组(五):测试数据及参考基因组的准备
一篇文章学会miRNA-seq分析
基因组的那些事儿(四)-质量控制与初步比对
bulk RNA
随机宏基因组测序数据质量控制和去宿主的分析流程和常见问题
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服