张彤教授团队不仅在环境分子生物学技术、宏基因组学技术等方面积累了丰富经验,在耐药领域,张彤教授团队开发了ARGs-OAP耐药基因检测分析工具,用于环境样品宏基因组测序数据中耐药基因的多维信息挖掘。在张彤教授、殷晓乐博士帮助下,我们已将ARGs-OAP 2.0成功部署到微生物数据分析云平台(https://analysis.mypathogen.org),分析云平台的小伙伴们不仅可以在ARGs-OAP耐药基因的检测分析平台(http://smile.hku.hk/SARGs/)进行耐药基因的检测,也可以通过微生物数据分析云平台进行耐药基因分析啦!
Detection_for_antibiotic_resistance_genes
ARGs-OAP2.0耐药基因检测分析工作流
以宏基因组原始测序结果为起点,以耐药基因的结构化数据库为依托,进行环境样品中耐药基因的多维信息挖掘,包括定性分析:耐药基因的分类鉴定;定量分析:耐药基因的丰度测量,并且附加宏基因组中细胞数的鉴定以及16S rRNA拷贝数鉴定,进一步对不同表型、基因型的耐药基因丰度进行划归;可视化分析:和多种已知环境样品进行统计学分析,得到聚类信息。
目前该工作流支持1~20个环境样品宏基因组测序数据的同时分析,用户仅需提交一个分析任务,便可获得各个样本的耐药基因检测结果,以及样本间耐药基因差异信息。
为使用户可以快速应用该工作流,我们将输入文件名前缀定义为SampleName.Group_1和SampleName.Group_2格式,通过用户输入文件名称生成meta-data.txt文件,然后用于PCoA绘图。以便于简化用户手工操作,省略用户编辑、输入meta-data.txt文件过程,同时避免meta-data.txt文件的错误格式导致分析失败情况。如果用户未使用指定文件名格式可能会出现PCoA图上点没有图例情况。
注:目前仅支持双端测序数据分析,输入文件要求如下:
(1)forward:Forward sequence (R1) of pair-end Illuminasequencing data in fastq format ,The suggested file name format is SampleName.Group_1.fq
(2) reverse:reverse sequence (R1) of pair-end Illumina sequencing data in fastqformat ,The suggested file name format is SampleName.Group_2.fq
此外,该工作流提供5个参数,开发者已为用户设置最优分析参数值,用户不仅可默认已配置参数直接分析,也可根据自己数据情况灵活调控参数,玩转耐药基因检测工具。
参数说明:
(1)evalue:evalue filtering default 1e-7
(2)length:length filtering default 25 aa
(3)identity:identity filtering default 80 (it isrecommended to use 75% of the raw reads length)
(4)threads:number of threads used for analysis, value 1~4
(5)tag:Output prefix
开发者:香港大学张彤教授课题组Yin X, Jiang X T, Chai B, et al. ARGs-OAP v2.0 with an Expanded SARG Database and Hidden Markov Models for Enhancement Characterization and Quantification of Antibiotic Resistance Genes in Environmental Metagenomes.[J]. Bioinformatics, 2018.
原文链接:
https://doi.org/10.1093/bioinformatics/bty053
联系客服