打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
分子钟校正进化树发方法简述
分子钟是使用生物分子的突变率来推论两个或多个生命形式不同时的史前时间。用于这种计算的生物分子数据通常是DNA,RNA的核苷酸序列或蛋白质的氨基酸序列。确定突变率的基准通常是化石或考古年代。
分子时钟只能得到一个相对时间,而非具体日期。我们通常需要根据有关日期的独立证据(例如化石记录)对分子钟进行校准,有两种使用化石数据校准分子钟的通用方法:顶点tip校准和节点node校准。还有合并两种方法的总证据校准。本文仅介绍节点校准的分析方法,通过BEAST或r8S完成。
节点校准是一种通过将化石约束放置在节点上进行的系统发育校准的方法。节点校准化石是该进化枝最古老的代表,用于限制其最小年龄。由于化石记录的分散,很可能永远找不到真正的进化枝的共同祖先。为了在节点校准分析中考虑到这一点,必须估计最大进化枝年龄。确定最大进化枝年龄是一项挑战,因为它依赖于负面证据-该进化枝中没有较早的化石。有多种方法可以使用出生死亡模型可以建立发散时间的先验概率,并将其用于校准时钟。有几种先验概率分布,包括正态,对数正态,指数,伽玛,均匀等,可用于表示相对于化石年龄的真实发散年龄的概率。校准节点在树上的放置会无约束节点的放置,从而在整个系统发育上给出发散日期估计。时钟校准的历史方法只能利用单个化石约束条件(非参数速率平滑,而通过BEAST和r8s 分析则允许使用多个化石来校准分子时钟。仿真研究表明,增加化石约束的数量可以提高发散时间估计的准确性。
BEAST全称为Bayesian evolutionary analysis by sampling trees,之前的推送中我们介绍过如何用贝叶斯方法构建进化树,这里的贝叶斯树原理一致,但由于对数据会加入几个化石节点,因此数据拓扑结构相应改变,所以要借助一个model找到这个进化树的最适合模型来进行时间演算。
BEAUti是用Java编写并随BEAST一起分发的软件包,它提供了图形用户界面,用于为多种简单模型组合生成BEAST XML输入文件。
首先打开Beauti 导入alignment,格式必须为无bayesian参数设定的Nexus格式。
前文提及的校准方法,我们在这里选择tip date。
Tipdate 是相对来说容易的方法,因为你只需要查找相关文献来某个物种的fossil age即可,node date 采用时候通常要提前看好亲缘关系。也可以参考这个数据库http://fossilworks.org/选择某个化学标记点,但是参考文献的好处在于,文献通常会准确描述mean SD值,可以直接套用。如果没有这些参考数值,那么选择的点就要极其准确。
之后,我们来确定数据模型。
Model的选择可以用MegaX 或Jmodeltest进行,选择BIC最小模型即可。我们这里概述一下各种model。
GTRGTR是最通用的中立,独立,有限位置,时间可逆的模型。
JC69JC69是最简单的替代模型。有几个假设。假设基本频率相同和相等的突变率。因此,此模型的唯一参数是总替换率。如前所述,当我们将平均率归一化为1时,此变量变为常数
HKYHKY可以认为是结合了Kimura80和Felsenstein81模型中的扩展。即,它可以使用κ参数区分转换和转换的速率,并允许不相等的基频。
TN93TN93位区分两种不同类型的过渡模型。它假定所有转换都以相同的速率发生,但是该速率可以与两种转换速率不同
接下来选择时钟模型。
StrictclockStrictclock模型假设系统发育树中的每个分支都以相同的进化速率进化。因此,这是一个1参数模型,其参数表示分支长度和进化时间之间的转换率。
RelaxedclockRelaxedclock使系统发育树的每个分支都有自己的进化速率。这些时钟称为“不相关”时钟,因为一个分支的进化速率不取决于任何相邻分支的速率。这意味着跨分支的进化速率可以突然改变,即从快速变慢或从慢速突然变快,而不需要在多个相邻分支上稳定地增加或减少。这种模型含有两种数据分布,指数或对数。具体选择计算参考文献doi: 10.1093/sysbio/syp072
随机本地时钟随机本地时钟允许一棵树上进化速率的变化量大于严格时钟(无变化),但小于宽松时钟(每个分支的速率不同)。他们通过提出一系列局部分子钟来工作,每个局部钟都延伸到整个系统发育的一个子区域。系统发育中的每个分支(包含进化枝)都是将速率从一个本地时钟更改为一个新时钟的可能位置。因此,更改次数可以为零(在这种情况下,结果时钟是严格时钟),或者可以等于分支的数量(在这种情况下,结果时钟是宽松时钟),或者它可以是两者之间。这完全取决于数据,因为MCMC链会在更改数量及其在树上的位置上进行采样(Heled & Drummond, 2015)。
当数据模型足够好时候,可以选择relaxed clock,当数据评估结果ucld.stdev >> 1(误差值)时,说明不适合relaxed clock。我们通常希望建树后ESS(Effective sample size)足够大,而stdev标准误或标准差足够小,而且模型的选择可能会影响prior的适配度。
接下来我们设置Prior。
两种常用的树先验模型是Yule模型和BirthDeath模型(BD)模型。Yule模型是一组连续时间分支过程中最简单的一个。它有一个参数λ,它是树的瞬时每谱系物种形成率,在整个树中是恒定的。BD模型也是一个连续的过程,但是包括血统将灭绝的可能性(因此不会留下任何后代)。因此,该模型具有两个参数λ和µ,即每个物种的瞬时物种形成和消灭速率(两者在整个树中都是恒定的)。在实践中,许多方法分别使用r =(λ– µ)和ε=(µ /λ)来重新参数化模型。通常,r的估计值比ε的精度更高。当使用BEAST时,必须根据对树的优先选择,在λ或r和ε上指定先验分布(Sarver et al., 2018)。
TheCoalescent Bayesian Skyline模型假设该序列代表了在Wright-Fisher动力学作用下进化的单倍体种群的一个小样本。该模型通过在此假设下计算树的概率来工作。从本质上讲,这可以归结为反复问一个问题:两个谱系在给定时间内合并(有一个共同祖先)的可能性有多大。
其它模型为这三种根据数据分布模式的衍生模型,不做赘述。
最后一步为MCMC链计算设计,请参考之前推送(贝叶斯进化树构建方法https://mp.weixin.qq.com/s/KnPxsgRcVxcNsfBTIBqhdQ)。
最后xml文件保存后要打开BEAST进行运算即可。
或者上传到CIPRES进行云端计算(参考之前推文https://mp.weixin.qq.com/s/XZOb5--RvBLFzFSy0OcTQw)。
得到的raw tree按照贝叶斯方法介绍中方式进行总结,然后通过软件打开,注意node/branchdisplay要选择time选项表示的才是进化时间。默认显示后验概率。
上图所示实例里面单位为Mya, 由于我选用了一个最近的fossil calibration point Arabidopsis5.6mya所以最小节点为5.6.
关于model,prior选择内容非常复杂,在使用BEAST时要谨慎考量多次尝试,构建出来的树才为最适模型。
参考文献
1.https://en.wikipedia.org/wiki/Models_of_DNA_evolution2.Heled, J., & Drummond, A. J. (2015). Calibratedbirth-death phylogenetic time-tree priors for Bayesian inference. SystematicBiology, 64(3), 369–383. https://doi.org/10.1093/sysbio/syu0893.Sarver, B. A. J., Pennell, M. W., Brown, J. W., Keeble, S., Hardwick, K.M., Sullivan, J., & Harmon, L. J. (2018). The choice of tree prior andmolecular clock does not substantially affect phylogenetic inferences ofdiversification rates. BioRxiv. https://doi.org/10.1101/358788相关系列第二期请戳:MegaX进化树构建与分析方法介绍相关系列第一期请戳:贝叶斯统计法构建进化树步骤详解
END
微科享,享科学
微科享是微生太旗下专注于学术知识免费分享平台,内容主要包括学术资讯、学术直播以及干货分享。
微科享仅用于学术成果分享与交流,不涉及商业利益。严禁他人将本公众号的内容用于商业运营。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Nature Reviews Genetics | 基因组时代的系统发育树的构建
基于beast2软件的分化时间分析
地球上最重要的进化革新
新的DNA研究动摇了长期以来所有人类物种起源于非洲的学说
关于人类起源,科学家有新见解
一文读懂进化树
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服