打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
GraphNVP | 用于分子图生成的可逆流模型

分子生成

具有理想药理特性新分子的发现是计算药物发现中的关键问题。传统上,这项任务是通过临床合成候选化合物并对其进行实验来完成的。但是,由于化学空间是巨大的,合成分子并对其进行广泛的实验是非常耗时的任务。从头设计药物不是在分子中寻找具有所需特性的空间,而是设计具有我们感兴趣特性的新化合物。

事实证明,深度学习的最新进展,尤其是深度生成模型在从头药物设计中具有不可估量的价值。

分子表征

将深度学习应用于分子生成的重要步骤是如何表示化合物。早期的模型依赖于SMILES的基于字符串的表示形式  。基于RNN的语言模型或变分自动编码器(VAE)用于生成SMILES字符串,然后将其转换为分子。使用SMILES的一个主要问题是,尽管相应的SMILES几乎相似,但它们对SMILES的细微变化并不稳健,从而导致分子截然不同。这些问题促使最近的研究依靠分子的更具表现力的图形表示。因此,这个问题被称为  分子图生成。

分子由无向图表示,其中原子和键分别表示节点和边缘。分子的结构由邻接张量表示和节点特征矩阵 X 用于表示原子的类型(例如,氧,氟等)。分子生成问题简化为可以表示有效分子的图的生成,可以利用诸如GAN或VAE之类的深度生成模型的问题。可以根据以前的工作如何生成图形将其分为两类。一些模型顺序生成分子图   ,从而以逐步的方式添加节点(原子)和边缘(键)。替代方法很简单,只需一步  即可以与图像生成模型类似的方式生成图形  。

可逆性的重要性

与上面介绍的VAE和GAN相比,使用可逆流的模型的优势在于可以直接使可能性最大化。

精确的优化 对于药物的分子生成至关重要,因为它们对单个原子(节点)的微小替换高度敏感。流模型的另一个优点是,由于它们是设计可逆的,因此可以保证完美的重构,并且不需要耗时的过程。只需在潜在矢量上运行模型的相反步骤,即可生成分子图。此外,GAN模型中缺少编码器,这使操作样本生成具有挑战性。例如,使用GAN模型生成类似于查询分子的分子(例如,用于药物发现的前导优化)并不容易,而基于流的模型则很容易。

模型

GraphNVP

GraphNVP是第一个基于可逆流的图形生成模型,该模型遵循一次生成策略。引入了两种潜在表示,一种用于节点分配,另一种用于邻接张量,以分别捕获图结构及其节点分配的未知分布。使用两种新类型的耦合层:邻接耦合 和 节点特征耦合, 以获取这两个潜在表示。在图生成过程中,首先生成邻接张量,然后使用图卷积网络生成节点特征张量  。

结果

从训练集中随机选择一个分子并将其编码为潜在载体 ž0 使用提出的模型。然后,选择两个彼此正交的随机轴。解码位于这两个轴跨越的二维网格上的潜点 ž0 作为起源。下面的可视化表示所学习的潜在空间是平滑的,因此相邻的潜在点对应于具有微小变化的分子。

参考资料

  • https://arxiv.org/abs/1905.11600

  • https://github.com/pfnet-research/graph-nvp

作者&编辑丨王建民

研究方向丨药物设计、生物医药大数据

DrugAI

( 扫描下方二维码订阅获取最新消息!)

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
智药公开课第1期回顾|AI药物设计的前沿思路、进展与未来
ChatGPT,背后的核心是什么?| 联合发布
机器学习必知必会的 6 种神经网络类型
风靡朋友圈的妙鸭相机,到底用了哪些底层技术?
【分子动力学】基于神经网络获得量化精度的动力学数据
什么是人工智能领域的 GAN
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服