系统发育进化树 (Phylogenetic tree): 一般也叫系统进化树,进化树。是指以树状结构表示各个节点的进化关系,枝点可以是物种、同一物种的样本、基因等单元。
在细菌基因组和宏基因组(如肠道菌群)的研究中,系统进化树的构建都是生物信息分析中非常重要的一部分。
关于进化树的构建和绘制,目前已经有很多成熟的工具,比如Mega、clustalw等等。构树工具和参数的选择是一个非常复杂且长的故事了,今天这篇小文暂时不介绍。
今天笔者想用多图实操的方式和大家分享一个超级棒的工具iTol,让自己的进化树能够表达更多的信息。
iTol网址:https://itol.embl.de/
01
美化第一步:准备进化树nwk格式的输入文件
nwk文件可以通过多种软件获得,例如MEGA。为了演示,我们这里提供一个含有5个样本的测试文件。
(A,((B,C),(D,E))))
在iTol网站(https://itol.embl.de/upload.cgi)点击upload上传该nwk文件后,获得基本的tree图。
02
美化第二步:给进化分支增加颜色。
假设5个样本中,B和C为1组,D和E为另一组,我们希望通过颜色标注分组情况。
此时,我们可以准备如下文档
TREE_COLORS
SEPARATOR TAB
DATA
A range #a1d8b1
B range #edfcc2
C range #edfcc2
D range #f88aaf
E range #f88aaf
# 注意DATA后面为需要我们根据自己的数据调整的部分。
# 每一行为一行样本
# 第一列为样本名称(nwk文件里的名称),第三列为颜色代码,可以根据自己的喜好随意修改。
将建立的文件的拖拽到iTol的进化树上,我们可以看到此时的tree已经拥有了色彩。
03
美化第三步:增加色条
假设A和B采样于同一个地区,C、D和E样本来源于另一个样本,我们希望在进化树上利用色条的方式标注。此时,我们可以按如下格式新建文件,并拖拽到进化树上。
DATASET_COLORSTRIP
SEPARATOR TAB
DATASET_LABEL COLORSTRIP
DATA
A red
B red
C blue
D blue
E blue
# 注意DATA后面为需要我们根据自己的数据调整的部分。
# 每一行为一行样本
# 第一列为样本名称(nwk文件里的名称),第二列为颜色名称或颜色代码,可以根据自己的喜好随意修改。
04
美化第四步:将柱状图和Tree相结合
假设ABCDE五个样本的基因数目分别为100,200,300,400,500,我们希望在tree上进行标注。此时,我们可以准备如下文档,并将其拖拽到itol的tree上。
DATASET_SIMPLEBAR
SEPARATOR TAB
DATASET_LABEL SIMPLEBAR
COLOR orange
MARGIN 5
WIDTH 200
DATA
A 100
B 200
C 300
D 400
E 500
# 注意DATA后面为需要我们根据自己的数据调整的部分。
# 每一行为一行样本
# 第一列为样本名称(nwk文件里的名称),第二列为数值
# 柱状图的颜色可以根据第4行的COLOR参数修改
05
美化第五步:增加特殊标记
假设有4个基因,我们希望在ABCDE5个样本上标注这4个基因的有无情况,我们可以通过增加特殊标记来实现。方法同样为准备如下文档,并拖拽到iTol的树上。
DATASET_BINARY
SEPARATOR TAB
DATASET_LABEL BINARY
FIELD_SHAPES 2 4 5 1
FIELD_LABELS gene1 gene2 gene3 gene4
FIELD_COLORS #ff0000 #00ff00 pink #0000ff
DATA
A 1 0 -1 0
B 0 1 -1 0
C 0 1 0 1
D 1 0 0 1
E 0 -1 1 -1
# 基因的颜色和形状通过FIELD_COLORS和 FILED_SHAPES两个参数来控制
# 注意DATA后面为需要我们根据自己的数据调整的部分。
# 每一行为一行样本,每一列为1个基因。-1不显示。0代表空心图形。1代表实心图形。
06
美化第六步:增加指示箭头
假设我们发现有一个元素(比如毒力基因)从样本B转移到了样本E,此时我们希望能在tree上增加一个箭头来标记这种关系。我们同样的可以创建一个文件,然后拖拽到树上。
DATASET_CONNECTION
SEPARATOR TAB
DATASET_LABEL CONNECTION
CURVE_ANGLE -50
DATA
B E 1 pink dashed
# Data后为我们需要准备的部分。第一列为箭头起始样本,第二列为目标样本,第三列为width,第四列为颜色,第五列定义虚线或实线
iTol还提供了更多美化方式,比如增加heatmap、比对序列、箱式图、protein domains、更改名称、散点图、图形标记等等等等。同样也是可以通过修改文件后实现,这里仅展示美图。
联系客服