打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
文献解析 | 深度学习驱动的BioNavi-NP天然产物生物合成路径导航文章

为大家解读一篇由中山大学巫瑞波课题组在《Nature Communications》期刊上发表的题为“Deep learning driven biosynthetic pathways navigation for natural products with BioNavi-NP”的研究工作,因此,该研究提出了一个基于深度学习的生物合成途径导航工具,BioNavi-NP,它可以克服这些局限性,并提高预测的准确性、速度和泛化性。

1

研究背景

大多数天然产物的完整生物合成途径是未知的,因此进行计算机辅助生物逆合成预测是有价值的。

在这里,一个可导航的和用户友好的工具包,BioNavi-NP,被开发用于预测NP和NP样化合物的生物合成途径。首先,通过端到端的变压器神经网络使用一般的有机和生物合成反应来训练单步生物逆合成预测模型。基于该模型,通过基于与或树的规划算法,可以从迭代的多步生物逆合成路线中有效地采样合理的生物合成途径。

广泛的评估表明,BioNavi-NP可以识别368种测试化合物中90.2%的生物合成途径,并以72.8%的测试集恢复报告的构件,比现有的常规基于规则的方法精确1.7倍。

该模型进一步表明,确定了从最近的文献中收集的复杂纳米粒子的生物学上看似合理的途径。该工具包以及精选的数据集和学习模型可免费获得,以促进阐明和重建NPs的生物合成途径。

图一BioNavi-NP的动机和概况。

图一

a-迄今为止报道的大量天然产物和罕见的生物合成途径。天然产品收集自DNP1并被TMAP形象化73(左)。从MetaCyc收集生物合成反应5,KEGG6和MetaNetX7,并通过细胞图显示网络74(对)。该结构由节点表示,并且相似的结构收敛。生物合成网络中的边和箭头代表结构转化。来自AA/MA途径的脂肪酸和其他物质被染成黄色。来自MVA/MEP途径的萜类化合物和类固醇被染成蓝色。来自CA/SA的类黄酮和其它物质被染成红色。生物碱和其他来自AAs途径的物质被染成绿色。其他的,如核酸和一些杂交源化合物,被染成黑色。

b-BioNavi-NP方案探索目标天然产物的生物合成途径。我们通过结合生物合成和有机反应来训练变压器神经网络,并且用不同超参数训练的四个模型形成集合模型,其最终用于进行单步预测(参见方法中的细节,补充图。1和2).

图二内部测试集的分布和性能。

图二

a-每个核动力源类别和构件中内部情况的化学空间。TMAP实现了化学空间的聚类和可视化73使用结构分子指纹75。节点表示结构,并且相似的结构会聚并聚集在同一分支上。补充图提供了训练集、内部案例和外部案例的化学空间比较。

b-BioNavi-NP在每个NP类别中的性能。源数据作为源数据文件提供。

图三BioNavi-NP web server的界面和输出。

图三

a-BioNavi-NP网络服务器的输入界面。

b-BioNavi-NP预测的两个实例(sterhirsutin J和戊二酸)的选择途径。此处,为了清楚起见,重新绘制了输出(补充图中提供的原始输出)。27和33),以及一些在末尾附加了等级顺序的候选路径,顶部1路径用红色标出。已知的中间体和反应用黄色突出显示。还有一个选项可以选择要突出显示或显示的路径。每个反应步骤的成本由置信度得分反映(预测成本越小意味着反应概率越高,见方法),路径的总成本默认用于网络排名。

2

研究结果

总之,这项工作结合了transformer模型和Retro* search算法,开发了一个前沿的生物合成导航器(BioNavi-NP),它可以列举不同的生物合成途径,并追溯天然产物到生物上看似合理的构建模块。

BioNavi-NP在生成生物合成路线和搜索NP的构建模块方面取得了很高的成功率。因此,它对于天然生物发生分析、生物合成途径重建和合理设计是有希望的。


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
Nat. Rev. Drug Discov. | 药物发现中的天然产物:进展与机遇
Nature | 全球海洋微生物组的生物合成潜力
微生物药物的合成生物学研究进展
天然产物的合成生物学研究
Nature:首次发现将硒整入到微生物小分子中的生物合成途径
【LorMe周刊】植物天然次级代谢产物的微生物发酵工艺
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服