打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
MLST | GraphINVENT: 基于GNN的分子生成平台

今天给大家介绍的是瑞典知名制药公司阿斯利康,查尔姆斯理工大学等合作开发的一个基于图神经网络的分子生成平台GraphINVENT,GraphINVENT使用分层的深度神经网络架构以一次产生一个单键地方式概率的生成新分子。在GraphINVENT中实现的所有模型都可以快速学习构建类似于训练集分子的分子,而无需对化学规则进行任何明确的编程。该模型已使用基于MOSES平台(分子生成的基准平台)的指标进行了基准测试,显示了GraphINVENT模型与最新的生成模型的比较结果。这项工作是最早的仅利用图神经网络进行分子设计研究工作之一,并且说明了基于GNN的模型如何在未来成为分子发现的有利工具。

1

背景

目前设计新型药物的目标在于满足所需类药物分子的所有标准。当利用生成模型生成新的分子时,模型的输入通常是基于字符串和基于图的表示方法。虽然基于字符串的方法可以利用目前发展较为成熟的自然语言处理模型,但是图能够更自然描述分子的数据结构,并且具有比字符串更多的潜在优势,尤其是与图网络一起使用时。而基于图的设计药物背后的指导原则是生成满足所需类药物分子所有标准的图。现有的图神经网络(GNN)具有以下能力:1)学习原子序排列不变表示,2)将图矩阵表示编码到一个潜在空间中,3)在GPU上有效训练并扩展到大型数据集。因此,作者利用GNN提出了一个分子生成的平台GraphINVENT,使用GNN直接在分子图上训练深度生成模型。作者通过GraphINVENT如何在深度生成模型中使用GNN,其中GraphINVENT包含了六个不同的GNN:MNN,GGNN,AttGGNN,S2V,AttGGNN和EMN。结合分层全局图的readout函数,在GraphINVENT中探索了许多不同的GNN Block。这些模型体系结构以前从未用于分子图生成。例如,EMN最近被用来成功地预测和鉴定抗生素。另外,GraphINVENT不包含手动编码的化学规则,而是直接从训练数据中学习。

不幸的是,与基于最新技术(SOTA)的方法相比,最近发表的基于GNN的分子生成模型并不多,因此很难比较每种方法的优点。尽管如此,基于图的生成模型JTN-VAE已经使用MOSES指标进行了基准测试,所以GraphINVENT和JTN-VAE等MOSES集成的模型进行了比较。

框架

GraphINVENT中的生成模型由两个部分组成,这些部分称为“块”(block),分别是GNN bolck和全局读出块read out block。简而言之,GNN块将分子图表示形式即邻接张量E和节点特征矩阵X作为输入,并输出变换后的节点特征向量和图嵌入。然后,全局读数块预测图的全局属性。全局属性是每个图的动作概率分布(APD),它是一个向量,其中包含用于扩展图的所有可能动作的概率;采样可以告诉模型如何扩展图。由于APD定义了用于扩展任何子图的所有可能动作,因此从单个图的角度来看,APD可能包含无效动作。对于给定的输入图,模型必须学习为无效动作分配零概率。最后,所有模型的学习输出是APD。下图为该模型的整体框架图。

图2-1 整体框架图

实验

(1)评估标准

PV:有效分子百分比;PU:独特分子百分比;PPT: 通过取样终止操作(与无效操作的取样相反)而“适当终止”的分子百分比;PVPT: 在PPT集合中有效分子的百分比;UC-JSD: UC-JS散度,是用于训练,验证和生成集的每个采样操作的负对数似然率(NLL)分布的相似性度量。

(2)实验结果

在MOSES数据集上,所有前三名模型的平均PV约为95%,PU值为99.8%。虽然无法仅从评估指标中选择最佳模型,但MOSES基准测试揭示了GGNN模型在分子生成任务方面比MNN和S2V模型略有优势。下表突出显示了在MOSES数据集上训练的最佳GGNN模型的性能。所有GGNN模型的PV均> 90,PU> 99(n_samples = 30,000)。

图3-1 实验结果图

4

缺点

PV相对较低

许多基于SOTA字符串的模型的PV都在95%以上,甚至100%以上。相比之下,此处最佳基于GNN的生成模型的PV相对较低,只有96%。探索如何在不影响这些模型的高PU的情况下进一步增加PV是未来工作的主题。

超参数优化(HO)具有挑战性

与任何深度学习模型一样,HO对于成功训练基于GNN的模型至关重要。但是,事实证明,这比预期更具挑战性。在许多情况下,发现理想超参数与先前已发布的值有显着差异(最明显的是,隐藏节点特征的大小)。

生成速度慢

使用GraphINVENT生成1M结构大约需要一个小时,而使用基于RNN的模型可能仅需要花费几分钟。

参考资料

文章链接

https://iopscience.iop.org/article/10.1088/2632-2153/abcf91

代码链接

https://github.com/MolecularAI/GraphINVENT

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Drug Discov Today|用于从头药物设计的图神经网络GNN
Graph Neural Networks 综述
2022简单易懂「图神经网络前沿进展与应用」中文综述
图神经网络:分类、进展和趋势
从4大顶会看GNN预训练技术进展
从分歧走向融合:图神经网络历经了怎样的演化之路?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服