打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【别构】PDBcor: 从蛋白构象系综中提取残基运动相关性的webserver
userphoto

2022.08.17 北京

关注

202259日,来自苏黎世联邦理工学院的Roland Riek研究组在Structure发表题为 PDBcor: An automated correlation extraction calculator for multi-state protein structures”的研究论文,公开了从蛋白质构象集合中分析残基相关性的程序PDBcor

背景介绍——

蛋白质动力学是理解酶活性、蛋白质-蛋白质相互作用、靶标识别、配体结合和信号传导的关键。其中,别构(或变构)是指蛋白质中两个距离较远的位点之间的运动耦合。别构效应具有多种机制,数量分布迁移模型基于蛋白质构象系综在几种状态中的分布,动力学别构模型则是基于蛋白质局部运动的相关性,在没有明显构象变化的情况下理解别构。别构通讯理论假设别构位点与正构位点之间的运动相关性是通过连接它们的一系列局部结构(别构通路)传导的,因此,如何从理论模拟或实验数据建立和验证别构通路是别构机制研究中的核心问题之一,而建立别构通路通常需要以某种方式表征蛋白中残基运动的相关性。

多种理论模拟和实验方法都可给出蛋白质的构象系综。分子动力学、蒙特卡罗模拟是两种典型的模拟方法,实验方法中,NMR和冷冻电镜也是两种解析溶液中蛋白质构象分布的强大技术。从蛋白构象集合中提取残基运动相关性的方法,包括简单的坐标协方差与能够处理非线性相关性的互信息等,都需要事先对多个构象进行叠合。叠合方法的选择具有一定的任意性,这会为相关性分析带来偏差。本文介绍的相关性提取方法PDBcor通过距离矩阵与二面角统计来计算互信息相关性,不需要进行结构叠合,因此是无偏的。PDBcor为开源软件,可从Github获取,或使用PDBcor在线服务器进行任务提交和计算。

——方法原理——

PDBcor的工作流程如图1所示。输入构象集合经过结构微扰,再生成距离矩阵,基于每个残基与其他残基的距离(或该残基的二面角),使用高斯混合模型(GMM)对构象进行聚类,每个残基可得到一组聚类标签(聚类向量),最终再使用两个残基对应聚类向量的互信息相似度表征它们的相关性,得到相关矩阵。

图1  PDBcor工作流程

对输入的构象进行微扰,目的是避免聚类错误地将热涨落范围内的两个构象区分开。这一步是通过给原子坐标添加高斯噪声来实现的,噪声标准差设置为0.5 Å

距离矩阵中,残基的坐标由残基形心来描述。PDBcor在计算形心时可采用不同的原子集,如NMR解出的蛋白结构中,通常主链坐标误差较小,此时可以将形心定义为主链原子形心。聚类时PDBcor需要用户指定类别数量,即蛋白构象的稳态数目。基于距离矩阵的聚类通常更灵敏些。根据每个残基i的距离向量对输入构象进行聚类,都可以得到聚类向量ci,其中包含了每个构象的类别标签。

残基间相关性通过聚类向量的调整互信息计算:

其中X,Y分别是两个残基的聚类向量,是XY的互信息,是假设X’Y’独立随机分布情形下的期望互信息,是XShannon熵。调整互信息越大,两个残基之间的相关性越强。

——实验验证——

作者首先在三个较为典型的蛋白体系中对以上方法进行验证(图2)。A为单态蛋白,在距离相关图中仅存在自相关性;B存在局部的别构现象,相关图正确描述了α2区域与α3区域在别构中的相关性;C的两个态具有整体性的构象差异,在相关图中表现为全局的相关性。

图2  1PBU(A,D), 2LPM(B,E), 6P6C(C,F)的构象系综及其距离相关图

随后,作者在PIN1的WW结构域、GB3与cyclophilin A三个蛋白体系中进行了基准测试(图3)。WW结构域的距离相关图显示出一个全相关网络;GB3的α1与其他区域几乎没有相关性,这与此前报道的结果一致;对于更大的体系,cyclophilin A的距离相关图不仅还原了已报道的5个相关位点(位点1~5),还发现了新的相关位点6,它与位点2~5形成了全连接图。

图3 PIN1的MM结构域(A,D), GB3蛋白(B,E), cyclophilin A(C,F)的构象系综及其距离相关图

——小结——

PDBcor通过蛋白构象的距离矩阵计算残基之间的相关性,避免了结构叠合引入的偏差。当构象数目较少时,直接使用原子坐标计算协方差或互信息无法得到准确的结果,而PDBcor通过离散的聚类标签计算互信息,同时为结构引入微扰,有效降低了产生伪影的可能,从而建立起一种针对残基相关性的准确、无偏的估计。同时,PDBcor也有相应的限制。首先,聚类数目需要自行指定,若蛋白状态数目未知,错误的聚类目标可能导致伪影。另外,无序蛋白不存在明确的亚稳态,无法使用PDBcor进行准确分析。

参考文献

Ashkinadze, Dzmitry, et al. "Pdbcor: An Automated Correlation Extraction Calculator for Multi-State Protein Structures." Structure 30.4 (2022): 646-52. DOI: 10.1016/j.str.2021.12.002

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
Bioinformatics | GraphscoreDTA:用于蛋白质配体结合亲和力预测的优化图神经网络
风电外送通道极限传输能力的自适应向量机估计
如何计算变量之间的相关性?
WGCNA原理及应用
Nat. Com. Sci. | 从深度学习看β淀粉样蛋白的动力学原理
使用WGCNA构建权共表达网络
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服