打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【计算化学】Anton3问世:分子动力学模拟的新一代“屠龙宝刀“
userphoto

2022.08.17 北京

关注

背景——

分子动力学(MD)模拟是研究蛋白质、DNA等生物大分子动态行为的有力工具。它能够通过模拟生物大分子在三维空间的运动状态,在生物分子发挥生理功能的作用机制,小分子与潜在靶点的识别等科学问题上提供帮助。然而,受限于目前的计算能力限制,目前主流硬件通常在数十万个原子、数百纳秒的尺度内进行MD模拟。若需要在更大的时空尺度考察生物大分子动态行为,则需要依赖高算力的超级计算机或云计算平台。在这一方面,来自纽约的D. E. Shaw Research公司多年来一直致力于开发专用于MD模拟的超级计算机,名为Anton系列。其分别于2008年和2013年推出的Anton和Anton 2处理长时间MD模拟任务的性能比当时先行最优的硬件还要高2-3个数量级。最近,他们发表了题为《Anton 3: twentymicroseconds of molecular dynamics simulation before lunch》的论文,标志着Anton3的问世。相比与Anton 2,Anton 3的计算性能再次提升了一个数量级,在512个节点并行处理下,能够对达100万个原子的大体系,每天进行超过100微秒量级的MD模拟[1]。

——Anton 3 特点——

Anton超级计算机的硬件设计上与传统计算机不同,它是为了针对MD模拟而特化设计的。MD模拟主要任务是记录每个原子的位置、运动状态等,然后基于位置计算原子间的相互作用,主要耗时在非键相互作用的更新和计算上。这类并行计算是通讯密集型问题,需要高频率进行数据传输。在这里,每个节点承担的运算并不复杂,所以单个计算单元的计算能力提升并不明显,同时也没有大量数据需要存储,因此也不是计算密集型和访存密集型任务。
Anton 3相比前代,对节点内的芯片间通讯的物理延迟进行了一定的优化,而节点之间的物理封装限制,采取了专属于MD的压缩算法。原本通过链路传输最新的原子位置,此时在缓存中就预测好原子在下一个时刻的位置,而链路传输的仅仅是预测位置和实际位置的差异。通过这一方法,对传输的数据进行更为紧凑的编码,提高了传输效率。
除此以外,Anton 3在计算相互作用时,也沿用了之前的Pairwise Point Interaction Piplines (PPIP)的算法,但它进一步以距离5Å为界按照短程、较大的力(Big PPIPs)和长程、较小的力(Small PPIPs)分开计算(图1)。因为小PPIPs只计算常见相互作用,更易于专门化,因此使用了更少的逻辑单元,因而节省了芯片面积,能够将原来两个大型PPIPs的空间用于计算一个大PPIPs和三个小PPIPs,进一步提高了计算效率。

1  参与相互作用计算的成对相互作用分区示意图

除此以外,Anton 3还针对成键和非键相互作用的具体算法进行了优化,降低数据传输的带宽需求,从而提高并行运算的效率,这些针对MD独有的优化帮助Anton 3超越前代,成为新一代处理MD模拟的“屠龙刀”。

——性能比较——

将各个生物大分子的模拟体系作为benchmark,表1展示了Anton 3和其他同时期的高性能计算机在各benchmark上的模拟性能,从表中可指,Anton 3动力学模拟的性能远超包括Anton 2在内的其他机器。即便是64节点的Anton 3,性能也成百倍的强于其他非Anton机器,能够模拟最多可达2百万个原子的体系,并达到每天25微秒的运行速度。

1  Anton 3, Anton 2和目前最快的非Anton机器在benchmark体系的模拟性能

作者指出,随着时间尺度的增加,生物大分子能够发生更多样的状态转变,MD模拟采样也将更加充分,因而MD模拟没有通用的时间限制。而生物大分子发生和药物发现相关的构象动态变化通常在微秒量级,在作者使用Anton2的前期实践中,大分子的构象变化通常需要在20微秒量级左右(从亚微秒到亚毫秒级)才能观察到。如图2所示,对于现有的蛋白的benchmark要完成大约20微秒的动力学模拟,非Anton机器通常要持续运行1周以上,而Anton 3在千万级原子以下的体系能够在一周内完成20微秒的动力学模拟(绿色及以上区域)。对于一些较大的体系,Anton 3相比通用功能的超算体现了较明显的优势,例如它能在5小时左右完成总原子数达到200万原子的核糖体体系,而在非Anton机器上则需要长达100天。总体而言,在计算效率上达到了现有的通用超级计算机的100倍以上。而相比之前开发的Anton 2,64节点的Anton 3 就也已经优于512节点并行的Anton 2,同样取得了较大的突破。

2  对于不同benchmark,各机器进行动力学模拟的性能和20ns模拟所需的时间
此外,在能耗上,Anton 3在每微秒模拟所消耗的能源也比目前最快的GPU低10倍以上,如图3所示。通过处理小任务时分配较少的节点用于运算,能避免多节点时的能源浪费问题。以上的结果表明,Anton 3比目前的通用计算机在MD问题上具有更快的处理速度、更高的数据吞吐和能源利用效率。

3  每微秒动力学模拟的能耗

——小结——

总之,Anton3进一步扩展了MD模拟可及的空间和时间尺度,一方面能够去模拟更大的生化体系短时间内的运动状态,另一方面可以从更长的时间探索现有体系。相比于现代的通用计算机,特化MD模拟的设计使它具有远超当代其他机器的性能,是MD模拟界的新一代“屠龙宝刀”。笔者在此更加期待的是Anton3在药物虚拟筛选中的作用。目前的高通量虚拟筛选主要还是采用近似对接方式进行大量的虚拟筛选,但对在特定位点强结合分子捕捉的准确度较低。如果能利用Anton在MD模拟的高性能,结合基于对接的虚拟筛选和候选分子的MD模拟,有望进一步提高药物发现过程的速度和质量。

参考文献:

Shaw, David E., et al. "Anton 3: twenty microseconds of molecular dynamics simulation before lunch." Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis. 2021. Doi:10.1145/3458817.3487397

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
JCIM | 组合分子动力学模拟和深度学习预测小分子迁移自由能
分子模拟发展史
2
J. Mol. Liq.: 分子动力学和蒙特卡洛模拟作为研究缓蚀剂在水相中界面吸附行为的有力工具:综述
Nature Communications:结合深度学习和分子动力学模拟探索蛋白质的长程相互作用模式和酶活性
【化工】清华大学大学张强团队发表综述,评论分子模拟与数据科学驱动的电解液研究
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服