打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
技术贴 | 16S专题 |基于QIIME2 dada2插件的16S扩增子测序数据的分析流程详解(上)

导  读

自推出QIIME2以后,QIIME1就不再更新和维护了。QIIME2融入了16S扩增子微生物研究最前沿的分析方法,同时也保留了旧版QIIME1的特性;研究者对关键步骤有更多个性化选择的同时,又将很多繁杂的分析步骤合并为QIIME2里简短的命令就能实现的流程化分析。强烈推荐领域内研究者学习和使用QIIME2。而QIIME2 dada2插件就是集序列质控、去除引物、去除barcodes、OTU聚类、挑选代表序列、去除嵌合体、生成OTU丰度表的功能于一身的分析插件。但要想使用好这一插件,对新手来说,却也着实不易,尤其在参数控制上。本篇我们先安装QIIME2,并拿几个简单的shell命令练练手,如果你对这一块已经很熟悉,可以跳过,下一篇我会开始详解qiime2 dada2插件。

QIIME2的安装

windows系统里安装QIIME2,要通过VirtualBox(虚拟机)的方式。步骤如下:

  1. 进入https://s3-us-west-2.amazonaws.com/qiime2-data/distro/core/virtualbox-images.txt,查看QIIME2最新版本(目前最新版本是2018.6)的镜像下载地址,以及要求的虚拟机版本。

  2. 根据镜像下载地址下载最新版本QIIME2镜像压缩包(很大,大概5G),解压。

  3. 根据虚拟机版本要求在https://www.virtualbox.org/wiki/Download_Old_Builds选择相应的版本或最新版本https://www.virtualbox.org/wiki/Downloads,这个安装很简单,一路点确认就行。

  4. 打开QIIME2镜像压缩包解压文件里,类型为“Open Virtualization Format”(后缀为.ovf)的文件(这个过程会自动帮你打开虚拟机,但以后想使用QIIME2,要先打开虚拟机),出现图1窗口,根据自己电脑的配置修改内存大小和CPU个数,最好留2G内存和2CPU以免电脑死机,然后点击导入,等待。

    图 1 

  5. 导入完成后,虚拟机左侧会出现设置好的装有QIIME2的虚拟电脑开关选项(图2),每次想打开QIIME2,都要先打开虚拟机,然后选择这个QIIME2虚拟电脑选项,点击启动。

    图 2

  6. 启动过程中需要输入密码时,输入“qiime2”后enter即可(如果是命令行里输入密码,密码是不可见的,千万不要以为自己没有输入)。打开虚拟电脑后,界面应类似图3

    图 3 

  7. 第一次打开虚拟电脑,需要做一些必要的设置,首先,“设备->安装增强功能->Run”(密码还是qiime2,安装结束后按enter确认),能使你的虚拟电脑拥有一些必要的特性;“设备->共享粘贴板->双向”,让你能够把Windows里的代码复制到命令行;“设备->共享文件夹->点击右侧'文件加号图标’->选择要共享的文件夹”,如图4所示,共享文件夹需要点选“自动挂载”和“固定分配”,然后点ok,这个步骤能够让你的虚拟电脑访问和使用自己电脑的指定文件以及里面的数据;完成所有设置后“控制->重启”,重启虚拟电脑,安装过程就结束了。

    图 4

Shell命令行的基本操作

Shell命令行是linux操作系统的主要操作界面,囊括了文件夹管理、文件管理、网站访问、文件下载、调用软件(如Rpython等)、调用脚本等功能,同时,shell本身也是一门强大的语言,一些基本的循环、条件、判断、字符操作、数学运算、函数等都可以在shell里实现。在我们安装好的虚拟电脑里,shell环境中已经有QIIME2pythonR等软件。可以直接在虚拟电脑shell终端里使用qiime2的命令。

  1. 打开shell终端。由于虚拟电脑是Linux的操作系统,所以在里面使用shell命令是没有问题的。在桌面左侧,有一个“>_”图标,点击它就行。它是一种交互式的操作形式(用户输入命令,然后entershell执行相应程序,并返回进程相关信息)。

  2. 更改当前工作目录。工作目录就是命令行当前的工作环境,工作目录里的文件可以被直接调用而不用加路径,命令的输出文件默认保存在工作目录里。当前工作目录会显示在命令行开头“:”和“$”之间,“$”后面是你写的命令。“”表示根目录,“~”表示用户目录,在虚拟电脑里,“~”相当于“/home/qiime2/”,注意斜线的方向,不要和windows系统混淆。更改工作目录命令为cdcurrent directory缩写),以想进入的文件路径为参数,之前我们创建了一个共享文件夹,这个共享文件夹被虚拟电脑放在了根目录media文件夹下,并在原名字前加了“s_”。例如我建的共享文件夹名称为weishengtai,所以在虚拟机里,我的共享文件夹路径应该是“/media/s_weishengtai”,要进入共享文件夹里,输入图5$后面白色部分)命令,enter即可。输入命令是要严格区分大小写,空格分隔,在英文状态下输入。

    图 5

  3. 查看当前目录里有哪些文件。命令为ls

  4. 创建文件夹。mkdir [文件夹名称],如图6,我现在共享文件夹里创建myfile1myfile2myfile3三个文件夹,然后使用ls查看。

    图 6

  5. 删除文件夹。rm -d [文件夹名称],其中,“-d”是参数名,是diretory(目录)的缩写,后面可接相应参数值,如图7,我先删除myfile1,再查看。

    图 7

  6. 查看帮助文档。在相应命令后添加--help参数即可,如图8,我想查看qiime dada2 denoise-paired命令的帮助文档

    图 8

  7. 命令换行。命令太长的时候,为了方便阅读和检查,我们会考虑换行。一般情况下,一条shell命令是不能换行的(除一些有固定格式的语句外,如for循环、条件判断等),按enter就表示执行命令。但如果在行尾加上了“\”,换行后命令不会执行,而是等待你接着输入命令内容,行尾没有“\”的情况下按enter,命令就会执行。如图9,我们先进入myfile2文件夹,然后创建dir1dir2dir3文件夹。

    图 9

  8. 写命令时自动补全。在shell终端里输入命令时,提供了自动补全功能,在输入命令、文件夹名、文件名时,只需要输入一部分甚至一个字符,按tab键就能帮你自动补全,特别省时省力。

  9. 输入已输过的命令或字符。按向上,向下键可以在已经输入过的命令间切换,这个在命令调试时候很实用。

  10. 复制粘贴快捷键。复制是Ctrl + Shift + C  组合键,粘贴是Ctrl + Shift + V  组合键,不要与windows系统混淆。

  11. shell终端调用R或者python。在虚拟电脑终端命令行里,直接输入Renter调用R软件,Ctrl +Z组合键退出。直接输入python后按enter进入python软件编程环境,Ctrl +Z组合键退出(命令执行到一半,不想执行了,也可以Ctrl +Z中断进程)。

到这里,你的shell语言已经入门了,想了解更多,可以参考http://www.runoob.com/linux/linux-shell.html

本文由Bayegy原创,由董小橙、江舜尧编辑。





本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
扩增子分析还聚OTU就真OUT了,试试unoise3
扩增子分析软件QIIME2 必知必会
MPB:北林袁峥嵘组-​16S扩增子分析中常用软件及数据库应用现状
LotuS2:新一代扩增子数据分析神器(更快、更准、更稳定)
建立一个别人既无法进入又无法删除的文件夹 隐藏文件 隐藏文件夹 - 电脑技术 - 涛涛's...
刘永鑫:想学菌群生物信息分析?21分钟带你入门!
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服