打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Bioinformatics | 预测药物-药物相互作用的多模态深度学习框架

今天给大家介绍来自华中农业大学信息学院章文教授课题组在Bioinformatics上发表的一篇关于预测药物与药物相互作用事件的文章。作者提出了一个多模态深度学习框架— DDIMDL。它将不同的药物特征与深度学习相结合,建立了一个预测药物相互作用相关事件的模型。DDIMDL首先分别利用四种药物特征:化学子结构、靶点、酶和通道,构建基于深度神经网络的子模型,然后采用联合DNN框架组合子模型,学习药物-药物对的跨模态表征,预测药物与药物相互作用(DDI, drug–drug interactions )。

1

引言

许多基于机器学习的DDI预测方法已经被提出,大致分为四类:基于相似度的方法、基于网络的方法、基于矩阵分解的方法和基于集成学习的方法。一般来说,现有的方法是为了预测两种药物是否相互作用,并且对更好的理解DDI做出了很大的贡献。然而,DDIs可以导致不同的生物学后果或事件。预测与DDI相关的事件是一项有意义和具有挑战性的任务,并受到了一定的关注。Herrero-Zazo等人(2013)为生物医学文本中的DDIs构建了一个手工注释的语料库。他们从DrugBank和MedLine收集了DDI,并将DDI关系注释为四种类型:机制(药代动力学机制)、效果(药效学机制)、建议(不同时服用这两种药物)和int(未提供进一步信息)。Ryu等人(2018)将从药库中收集到的生物事件分类为86种类型,建立基于药物化学子结构的深度学习模型进行预测DDI事件。随后,Lee等人(2019)直接将三个特征合并为DNN的输入,建立预测模型。

虽然上述工作在事件预测方面做出了重要的努力,但仍有改进的空间。首先,DrugBank是一个可靠的数据源,对DDIs的描述具有统一的语法,因此我们可以通过标准描述提取DDI事件并进行进一步的研究。第二,药库具有多种药物特征。第三,特征之间存在冗余,如何有效的将不同的特征组合在一起是一个挑战。

为了解决上述问题,作者提出了一种名为DDIMDL的计算方法,该方法结合多种药物特征和深度学习来预测DDI事件。作者定义了一个标准方案来分析药库的DDI事件,并选择65种主要事件进行分析。此外,作者还收集了药物的四个特征:化学亚结构、靶标、酶和建模途径。在DDIMDL中,利用每种药物特征构造四个子模型,并利用联合DNN框架将子模型组合起来,学习药物-药物对的交叉模态表示。最后,作者利用学习到的交叉模态表征预测与DDI相关的事件。

2

数据集

DrugBank是一个能提供12151种药物的综合信息的资源,包括3,844种FDA批准的药物和5867种实验药物。在这项研究中,作者从DrugBank中收集了DDIs以及药物的四个特征:化学子结构、靶标、通道和酶。在我们从DrugBank获得一种药物的通道(KEGG ID)后,我们可以使用KEGG数据库将KEGG ID转换为相应的药物通路信息。药物的靶标和酶直接从数据库中获取。

为了更好地理解DDI事件,我们将DDI事件的表示定义为四元结构:(药物A、药物B、机制、动作),其中“机制”指的是药物在代谢、血清浓度、疗效等方面的作用。“动作”表示词元化后的增减。由于预先训练的模型没有在生物医学文本上进行训练,因此它无法为一些专业药物的名称安排合适的词性,因此将所有药物名称列出,进行识别。

3

DDIMDL方法概述

DDIMDL方法如下图所示。首先,作者使用四种类型的药物特征来计算药物-药物的相似性,并使用它们作为药物的表征。在多层神经网络的基础上,将药物的表示分别输入子模型。然后,作者结合子模型来学习药物-药物对的交叉模态表示,并用所学的交叉模态表示来预测DDI事件。下面介绍了DDIMDL的关键组件。

3.1特征抽象模块


如前面所讲,我们有药物的四个特征:化学亚结构、靶点、酶和通道,这些特征带来了药物的不同信息。每个特征对应一组描述符,因此药物可以用一个二元特征向量表示,其值为(1或0)表示对应描述符的存在或不存在。这些特征向量具有高维数,且多数维数为0,从而要对特征进行了压缩,降低了稀疏性。采用Jaccard相似度度量方法,从位向量中计算药物的双向相似度,而不是使用位向量作为输入。Jaccard相似度计算公式如下:

3.2DDIMDL的构建与模型优化


由于我们有多个特征,我们使用深度神经网络(DNN)根据每个特征构造子模型。深度神经网络(DNN)是一种在输入层和输出层之间具有多层结构的人工神经网络。无论是线性关系还是非线性关系,DNN都能找到正确的数学操作,将输入转化为输出。子模型网络的设计受到瓶颈类神经网络VGG16的启发。通过使用瓶颈特征,我们可以减少需要训练的参数的数量。

不同子模型的组合对于DDIMDL很重要。我们根据不同的特征构造子模型,然后将子模型结合起来构建预测模型。采用交叉熵作为损失函数,对DDIMDL模型进行了经验训练和优化。使用早期停止策略,如果在10个epoch内没有观察到任何改进,则自动停止训练。

4

实验和结果

4.1评价标准


在DDI预测中,研究者通常关注三个任务。第一种是预测未知的已知药物之间的相互作用,第二种是预测已知药物和新药之间的相互作用,第三种是预测新药之间的相互作用。对于任务1,我们对DDIs应用5倍交叉验证(5-CV),并将所有DDIs分成5个子集。作者基于训练集中的DDIs来训练模型,然后对测试集中的DDIs进行预测。对于task 2和task 3,作者将5-CV用于药物而不是DDI对。作者将药物随机分成五组,其中四组作为训练药物,其余的作为测试药物。对于task 2,我们在训练药物之间的DDIs上建立预测模型,然后对训练药物和测试药物之间的DDIs进行预测。任务3在训练药物之间的DDIs上建立预测模型,然后对测试药物之间的DDIs进行预测。为了评估,使用准确率(ACC)、AUPR、ROC曲线下面积(AUC)、F1评分和Precision作为评价指标。作者对AUPR和AUC使用微观度量,而对其他的使用宏观度量(微精度、微召回、微f1在多分类问题中等于准确度)。

4.2参数设置


首先,作者讨论了子模型结构的层数。我们设定一个规则,每一层的神经元数是前一层的一半,并将最后一层的神经元数固定为256。我们经验地考虑了两个隐藏层、三个隐藏层、四个隐藏层和五个隐藏层。不同配置下的度量分数和训练时间如下表所示。因此,作者采用了三层网络结构,以达到最好的性能。然后,作者讨论了dropout rate的影响。我们以0.1作为步长,将dropout rate从0设置为0.5,当dropout rate为0.3时获得最高的ACC和AUPR。

4.3特征评价


作者评估了不同药物特征对DDI事件预测的影响。使用每个特征或特征组合来构建DDIMDL模型,并采用模型的度量分数作为对应特征或特征组合有用性的指标。所有预测模型的结果见下表。

在所有的药物特征中,化学亚结构信息最为丰富,准确率为0.8623。基于目标特征的模型的准确率为0.8338,基于路径特征的模型的准确率为0.8182。酶的特征模型的精度为0.6687。与单个特性相比,这些特性的组合提供了显著的改进。子结构和目标的组合在两种特征的所有组合中产生最佳的性能;子结构、靶标和酶的组合在这三种特征的组合中表现得最好。此外,我们观察到,使用所有特征并不会比将子结构、靶标和酶结合起来得到更好的结果。

所有DDIMDL模型的精确召回曲线如下图所示。它们也直观地表明,多模态学习的应用提高了DDIMDL在DDI事件预测中的性能。

4.4方法比较


各预测模型的评价得分如下表所示,结果表明就所有指标而言,DDIMDL比其他方法具有更好的性能。

所有模型的精确回忆曲线如下图所示,而DDIMDL在所有方法中表现最好。

下图演示了DDIMDL在大多数类型的事件比其他方法生成更大的AUPR评分和AUC评分。

为了进一步分析预测模型的性能,我们使用下图显示在65种类型事件上不同方法的AUPR评分和AUC评分。这些箱线图清楚地显示,DDIMDL在处理这些事件时比比较的方法产生更好的统计性能,基于多模态深度学习的DDIMDL显著提高了DNN的性能。

4.5案例研究


作者使用来自DrugBank的数据集中的所有DDIs和它们的事件来训练预测模型,然后对其他药物-药物对进行预测。作者关注从#1到#5频率最高的5个事件,并检查与每个事件相关的前20个预测。

5

结论

本研究从DrugBank获取DDI数据,并应用NLP技术根据描述语法将DDI相关事件分类为65种类型,编译了包含572种药物、74,528种相互作用和65种DDI相关事件的数据集。提出了一种基于深度学习的多模式深度学习框架DDIMDL,该框架将多种药物特性与深度学习相结合,用于DDI事件预测。通过使用五折交叉验证进行评估,DDIMDL的性能优于现有的DDI事件预测方法和基线方法。作者经过多方验证,说明了多模态深度学习框架是一种很有前途的DDI事件预测工具。

代码

https://github.com/YifanDengWHU/DDIMDL


参考资料

Yifan Deng, Xinran Xu, Yang Qiu, Jingbo Xia, Wen Zhang, Shichao Liu, A multimodal deep learning framework for predicting drug–drug interaction events, Bioinformatics, , btaa501, 

https://doi.org/10.1093/bioinformatics/btaa501

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
BMC Bioinform|CNN-DDI:基于卷积神经网络预测药物相互作用
科研人员开发全新的药物-药物相互作用事件预测方法
Brief Bioinform. | 如何使用人工智能进行多种药物相互作用预测?
【药物发现】深度学习模型预测药物药物相互作用
中医药数据库TCMBank
KGNN:基于知识图谱的图神经网络预测药物与药物相互作用
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服