今天给大家介绍一款绘制系统进化发育树的软件--GraPhlAn,该软件是由哈佛大学的Huttenhower Lab开发,绘制图片十(很)分(高)漂(大)亮(上)。详情请点击阅读原文。
先来看看,这款软件的一个例子:
该图有进化树,以及物种丰度信息,还有分组来源,信息量非常大。图中间的圈图为物种进化分析,不同颜色分子代表了不同门分类水平(由右上角的颜色标注);灰色标注的是属的分布情况。次外圈的热图表示不同组的物种丰度(组名在圈内6点钟方向),用不同的颜色表示不同的组,颜色深浅表示相应物种的丰度。最外圈的柱状图则为相应的物种在不同组的最大丰度,颜色用具有最大丰度的组的颜色表示。
下面来讲解下具体绘制步骤:
1、我们需要有LEfSe的输入格式的文件,格式如下图。(PS:由qiime的biom格式即可转成如下格式。具体请戳https://github.com/gditzler/biom2lefse)
(其中的第一行为每个样品对应的分组来源,第一列为对应的物种分类,数值为相对丰度。)
2、利用上述输入文件构建简单发育树文件,操作如下。
主要是为了输出.tree树文件。
3、还是利用上述输入文件构建.annot文件。该文件格式如下。
其中title:定义图片标题。
title_font_size: 定义标题文字大小。
total_plotted_degrees:定义进化树的环形角度。
annotation系列参数:定义的是左边legend的文字大小等属性。
ring系列参数:定义的是圆圈热图的颜色,边的粗细以及分组标签等属性。
下面的物种参数,如g__un_f_Micrococcaceae:定义了该物种在各个分组的相对丰度,在哪组中最高以及点的形状等。
4、利用graphlan_annotate.py对生成的.tree树文件以及.annot注释文件处理,输出.xml文件。
5、最后用graphlan.py对.xml文件进行可视化。
联系客服