科研 | Microbiome：微生物群落功能预测的准确性与样本类型和功能类别的关系

编译：红皇后，编辑：小菌菌、江舜尧。

原创微文，欢迎转发转载。

导读

尽管近些年测序的成本不断的下降，鸟枪宏基因组测序的价格依然要远高于16S rRNA扩增子测序，因此研究人员开发了多种基于微生物群落分类学组成来预测其功能图谱的方法。在本研究中，作者比较了3种常用的微生物群落功能预测工具 (PICRUSt、PICRUSt2和Tax4Fun) 对于不同环境微生物群落功能预测的表现。

作者选择了7个分别来源于人类、非人类动物和环境(土壤)的样本，这些样本均在公共数据库中可以查到16S rRNA扩增子和鸟枪宏基因组序列。

与作者的预期一致，基于16S rRNA扩增子预测到的功能基因组成与宏基因组得到的功能基因相对丰度的Spearman相关性非常好，但是这种相关性在不同样本间基因的丰度进行变化之后同样存在。因此，本研究中，作者使用了基于样本metadata的推论模型评估了PICRUSt、PICRUSt2和Tax4Fun三种工具的实际表现，结果发现这些功能预测方法对于人类样本的数据，特别对对其中与“housekeeping”相关的功能的预测具有非常好的效果，但是对于人类之外其它样本的预测效果就要差很多。

论文ID

原名：Inference-based accuracy of metagenome prediction tools varies across sample types and functional categories

译名：基于推论模型的方法分析微生物群落功能预测的准确性与样本类型和功能类别的关系

期刊：Microbiome

IF：10.465

发表时间：2020.4

通信作者：Shan Sun

通信作者单位：北卡罗莱纳大学

实验设计

样本来自7个不同的微生物群落数据集，其中包括2个人类的、一个大猩猩的、一个鼠的、一个鸡的和2个土壤。这些数据集均具有16S rRNA扩增子测序结果和宏基因组测序结果。作者分别使用PICRUSt、PICRUSt2和Fax4Fun对这些数据集的16S rRNA扩增子数据进行功能预测，之后使用Spearman相关性分析评估预测结果与宏基因组注释结果之间的相关性。

为了更准确的分析，作者进一步开发了一个基于推论模型的方法，其根据数据集的metadata，使用Wilcoxon test分别同一数据集不同组样本功能预测结果的差异和宏基因组注释结果的差异，之后使用Spearman相关性分析评估功能预测差异检验p值和宏基因组差异检验p值的相关性，以消除直接使用Spearman分析的误差。

最后作者对微生物功能进行了分类，分别评估了不同功能分类基因丰度预测结果和宏基因组实际测试结果的相关性，评估了功能预测对于不同功能类别基因预测的准确性。

结果

1 Spearman相关性无法可靠的评估功能基因预测的准确性

作者使用Spearman相关性方法分析了PICRUSt、PICRUSt2和Fax4Fun基于16S rRNA扩增子结果预测的功能基因与样本使用宏基因组测序得到的实际功能基因丰度之间的相关性，结果显示相关系数在0.53至0.87之间 (图1a)。例如在一个土壤样本中，PICRUSt的结果与宏基因组测序的结果相关性达到了0.85 (图1b)，但是作者同时发现，如果将不同样本的功能基因丰度进行替换，对PICRUSt与宏基因组测序结果的相关性分析并不会产生实质的影响 (图1c)。作者进一步详细比较了不同样本间真实的相关性结果与功能基因丰度变化后虚拟数据的相关性结果，发现无论在哪种样本中，这两个结果之间都没有明显的差异(图1d、e、f)。对这一现象的可能解释是不同样本之间宏基因组功能图谱的变化要明显弱于其物种分类学组成结构的变化 (图2)。

图1 功能预测结果与宏基因组测序结果之间的Spearman相关性。(a)不同样本间功能基因丰度的置换；(b)和(c)一个真实数据和变化后虚拟数据相关性结果的比较。(d-f)PICRUSt、PICRUSt2和Fax4Fun预测结果与真实数据和置换后虚拟数据相关性分析结果的比较。

图2 研究样本的物种分类学组成(a)和功能基因图谱(b)。

2 基于推论的方法显示功能基因预测在人类样本中与宏基因组测序结果一致性较高

作者根据测试数据集的metadata，使用Wilcoxontest分别计算了功能预测结果和宏基因组测序结果中每一个功能基因在同一数据集不同组样本中的差异，分别得到了两组p值，之后对这两组p值进行Spearman相关性分析。与直接进行相关性分析相比，这种方式对于样本间功能基因丰度的置换非常敏感，在真实的样本数据中能够检测到明显的相关性，而在置换后的虚拟数据中，相关性的结果几乎都为零(图3)。

图3 基于推论的方法对未置换和置换数据的相关性结果，图中红色圆点为未置换的真实数据相关性结果，蓝色圆点为100次置换数据的相关性结果。

基于推论的方法显示，基于16S rRNA扩增子测序的功能预测结果与宏基因组测序得到的功能基因丰度在人类样本之间具有非常高的相关性，但是在人类以外的样本中，其相关性很差(图4)。作者进一步分析了数据集中样本的个数对分析结果的影响，结果表明数据集中样本的个数并不会影响功能预测的准确性。

图4 不同数据集中3种功能基因预测工具结果与宏基因组测序结果基于推论方法的相关性分析。

3 宏基因组预测准确性与功能基因类型的关系

分别对不同类型的功能基因进行基于推论方法的分析，结果显示，在人类肠道样本中，对于遗传信息过程相关的功能例如复制和修复，翻译，折叠、排序和讲解以及聚糖生物合成与代谢、核酸代谢、氨基酸代谢等代谢相关的功能基因，基于16S rRNA扩增子测序的功能预测的准确性较高。而对于次级代谢、外源物质降解与代谢、信号传导、膜转运、细胞生长与死亡等功能基因的预测准确性较差(图5)。大部分无法被预测到但在宏基因组测序中检出的功能基因属于信号传导、信号分子和相互作用以及遗传信息过程相关的功能，而大部分在宏基因组测序中没有检出但是被预测到的功能基因属于信号分子和相互作用、萜类和聚酮类物质代谢以及外源物质降解与代谢功能。

图5 基于推论的方法分析功能预测与宏基因组测序结果中不同功能类型基因的相关性。

讨论

相比于微生物群落的分类学组成结构，其功能谱图的变化通常比较小，这可能是由于功能基因中存在着大量的核心或管家功能基因。本研究中，作者发现由于不同样本间功能图谱变化较小，导致了宏基因组测序结果与功能基因预测结果间不准确的相关性。由于特定环境中微生物群落功能图谱相对稳定，因此，功能基因预测的方法更适合评估一个类型环境的平均功能基因丰度，而不适合分析生境内部微生物功能的变化。正是由于常规的Spearman相关性并不能得到准确的分析结果，作者使用了基于推论模型的方式分析功能基因预测结果与宏基因组测序结果之间的真实相关性，并得到了相对准确的分析结果。

本研究评估了3种常见的功能预测方法，PICRUSt、PICRUSt2和Tax4Fun，结果表明3种分析方法并没有哪一种具有明显的优势，3种分析的结果大多比较一致，只是在少数样本类型中具有差别，其中PICRUSt2对于鸡相关的样本具有较高的预测效果，但是对于鼠相关的样本预测准确性较差。如果想要对特定环境微生物群落得到更准确的功能基因预测结果，最好是开发环境特定的分析工具，例如CowPI数据库，其专门针对牛瘤胃提供微生物功能的推断。

基于16S rRNA扩增子测序的功能预测作为研究经费有限时的一种补充方法被广泛的使用，但是其预测结果的准确性也一直备受质疑，甚至有些研究人员完全不相信如PICRUSt等功能预测工具的结果。根据本文的结果，不同的功能预测软件的结果准确性其实并没有本质的区别，只需选择其中一个使用即可，并且如果是针对非人类样本的研究，功能预测结果的使用要格外谨慎。此外，如果文章中使用了功能预测的结果，建议只进行描述，可以稍加讨论，但不要基于功能预测的结果下任何的结论。

你可能还喜欢

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。