打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
IEEE JBHI丨PPAEDTI:预测药物-靶点相互作用的个性化传播图自编码器
userphoto

2023.05.02 上海

关注
2022年10月27日,西北工业大学尤著宏教授和黄裕安老师团队在IEEE Journal of Biomedical and Health Informatics上发表文章Personalized Propagation Auto-Encoder Model for Predicting Drug-Target Interactions。在本文中,作者提出了一种基于个性化传播图自编码器的药物-靶点相互作用预测方法(Personalized Propagation Auto-Encoder Model for Predicting Drug-Target Interactions,PPAEDTI),通过在药物-靶点二分图上信息的个性化传播策略,增强自编码器模型捕获蛋白质和药物之间相互作用的能力。实验结果验证了PPAEDTI对DTI预测的有效性。作者还建立了一个计算平台,进行DTI在线预测:http://120.77.11.78/PPAEDTI/

背景

确定药物的蛋白质靶点为药物再利用和药物开发奠定了不可或缺的知识基础。尽管昂贵且耗时,体外试验仍被广泛用于发现药物靶点。这表明,现有的相关机器学习算法在预测准确性和性能效率方面仍不能满足药物研发实际应用的需求,亟待提高。传统计算方法的主流可以分为两类:基于配体的虚拟筛选方法和对接方法。基于配体的虚拟筛选方法将候选配体的化学结构与已知配体进行比较,并使用机器学习方法来预测蛋白质是否可以与候选配体结合。然而,对于那些研究较少、了解甚少的蛋白质,其已知配体的数量非常有限,这些方法很难应用。另一种计算方法是基于分子对接,动态模拟蛋白质靶点的3D结构数据。然而,它需要大量关于药物或靶点的三维结构的数据。

在DTI中,一种药物可以与多种蛋白质结合,而一种蛋白质也可以与多种药物相互作用,形成复杂的知识图谱。图中的节点表示药物和蛋白质,它们连接的边表示药物和蛋白靶点之间的已知相互作用。

在过去的几年里,图神经网络在生物信息学领域的一些重要预测问题上被证明具有出色的表现力和强大的预测性能。最近,已经有一些尝试使用图神经网络来预测新的DTI,然而,这些预测模型的预测性能仍然不足以用于实际应用,需要改进。

方法

在这项工作中,作者使用先验知识来计算相似性,以构建药物和靶点的特征。具体来说,药物的相似性是基于它们的化学结构。在其中五个数据集中,从KEGG LIGAND数据库中的药物和化合物部分收集药物的化学结构信息,并计算药物相似性的Tanimoto评分。

作者使用基于图近似个性化传播的编码器和双线性解码器,为特征嵌入模型提出了一个深度学习框架。具体而言,PPAEDTI分五步对新的DTI进行预测(见图1):(i)基于已知的DTI建立药物-靶点二分图,(ii)将不同向量空间的药物和靶点节点映射到同一向量空间,(iii)通过编码器获得药物和靶点结点的嵌入向量,(iv)重建新的药物靶点二分图,以及(v)通过交叉熵损失函数端到端地训练整个模型。
图1 PPAEDTI
作者使用各种信息构建了DTI的二分图,其节点表示为药物和靶蛋白。利用药物结构相似性和靶蛋白序列相似性Fd和Ft这两种辅助信息作为节点属性,构建了一个属性异构图。DTI的图被表示为其邻接矩阵,其中已知交互的实体被设置为1,而未标记的实体被设为0。为了构建用于模型训练的负样本数据集,作者对未标记的交互进行了采样,以生成具有相同大小的正集的负集,考虑到未标记交互中潜在真实交互的百分比太小,很难对其进行采样。

作者使用特征映射部分将药物和靶蛋白特征向量Fd和Ft映射到节点的相同新特征维度向量空间中,接着应用了图神经网络的近似个性化传播层来进一步提取特征,通过双线性解码器重建了二分图的链接,以预测药物-蛋白质对的相互作用。由于sigmoid激活函数适用于二值化分类中处理得很好,因此作者采用的双线性解码器包括双线性运算和sigmoid函数。为了训练如上所述建立的模型,设置交叉熵损失函数。

为了学习考虑输入特征的药物/蛋白质节点的综合表示,作者引入了一种类似PageRank的消息传播方案。作者提出了一种神经网络来进行消息传播,以便以深度学习的方式学习节点表示,近似于已知DTI图上的PageRank运算。个性化PageRank通过识别极限分布和PageRank之间的联系来提升模型性能。大多数常见的聚合方案在每一层中使用可学习的权重矩阵。因此,使用更大的邻域必然会增加神经网络的可学习参数的深度和数量。为了解决这个问题,作者提出了神经预测的个性化传播,以实现神经网络的深度完全独立于传播算法,它独立地操作每个节点的特性,并且可以允许并行化。

结果

作者将PPAEDTI与多种方法进行对比。如表1所示,PPAEDTI的表现超越了现有的方法。

表1 PPAEDTI与其他方法对比

为了进一步评估PPAEDTI在预测中的效率,作者选择了药物D00618(尼索地平)、靶蛋白hsa:775(钙电压门控通道亚单位Alpha1C)和靶蛋白hsa:779(钙电压调控通道亚单位Alpha1S)进行案例研究。对于它们中的每一个,通过查阅公开的独立数据库来手动检查相应的前20名预测列表。Hsa:775提供了制造几种钙通道之一的指令,这些钙通道将带正电的钙原子(钙离子)输送到细胞中,在细胞产生电信号的能力中发挥关键作用。Hsa:779提供了制造被称为钙通道的结构的主要部分(亚单位)的说明。在用于运动的肌肉(骨骼肌)中发现了含有hsa:779蛋白的通道。这些骨骼肌钙通道是一个称为兴奋-收缩耦合的过程的关键,通过这个过程,电信号(兴奋)触发肌肉紧张(收缩)。结果显示(详见原文),hsa:775和hsa:779分别在前20名中有18名和17名被确认。D00618用于治疗高血压,属于钙通道阻滞剂类药物。结果显示,在表2中,D00618已经确认了前20名中的所有DTI。

表2 案例分析
PPAEDTI网络服务器用于预测药物-靶点相互作用,并实现了并行加速。它提供了一个开放和交互式的网络服务,接受药物化学结构SMILES或蛋白质FASTA序列,并以用户友好的方式返回搜索结果。可以直接在输入框中输入/粘贴查询的药物化学结构或蛋白质序列,也可以单击“选择文件”按钮通过文件上传。可以点击Examples按钮自动输入内置序列示例,如图2所示,也可以点击Reset按钮清空所有输入序列。
图2 PPAEDTI网络服务器

查询药物化学结构或蛋白质序列,然后单击submit按钮,完成后,结果将显示如图3所示。可以通过单击表的name按钮找到序列。点击表格相应的download按钮,即可下载相应的预测结果。

图3 预测结果

总结

作为体外试验的有力补充,计算方法可以大规模预测潜在的DTI,从而有效且经济地加速药物开发过程。生物医学知识的快速增长使得使用已知的DTI来预测潜在的DTI成为可能。

在这项工作中,作者提出了基于自动编码器的PPAEDTI模型,该模型由特征映射模块、近似个性化传播层和双线性解码器组成。作者认为药物的结构信息和蛋白质的进化信息对DTI的预测有很大影响,并且基于这种考虑,所提出的模型使用图神经网络结构来组合这类信息进行预测。交叉验证实验结果表明,PPAEDTI可以有效识别药物和蛋白质之间的潜在相互作用。对比实验还表明,PPAEDTI的性能优于现有方法。综合实验结果表明,PPAEDTI是预测DTI的可靠模型。作者预计,在研究人员通过给定的药物结构信息或蛋白质序列查询最潜在的DTI的情况下,所提出的PPAEDTI模型可以作为一个有用的工具。

参考资料:

[1] Li et al. PPAEDTI: Personalized Propagation Auto-Encoder Model for Predicting Drug-Target Interactions. IEEE J Biomed Health Inform. 2023

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
PNAS | ConPLex:一种使用预训练蛋白质语言模型的机器学习方法,用于预测药物-靶标结合
Nat.Mach.Intell.| 自适应和可解释的药靶预测模型
阿斯利康团队用具有域适应性的可解释双线性注意网络改进了药物靶标预测
BIB|基于机器学习的药物与靶点相互作用预测方法综述
【深度学习】ML-DTI—基于相互学习机制预测药靶结合亲和力
miRTissue:一款miRNA-target-protein相互关系分析的神器
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服