打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
AlphaFold新竞争对手出现,ESMFold预测了6亿种蛋白质结构
userphoto

2022.11.02 上海

关注

2022年7月,DeepMind声称AlphaFold已经确定了地球上几乎所有已知生物体中大约2亿种蛋白质的结构。如今,另一家科技巨头也加入了蛋白质结构预测的“军备竞赛”。

据Nature最新新闻报道,Meta(前身为Facebook)的研究人员开发了一种蛋白质结构预测模型ESMFold,预测了来自细菌、病毒和其他尚未表征的微生物的约6亿种蛋白质的结构。

该技术进展来自于Meta AI蛋白质团队于10月31日发表在预印本平台bioRxiv上的一篇文章Evolutionary-scale prediction of atomic level protein structure with a language model。ESMFold使用大型语言模型从主序列直接推断结构,预测的速度比最先进的方法快60倍,同时能够保持分辨率和准确性。

原文链接

https://www.biorxiv.org/content/10.1101/2022.07.20.500902v2

基于该方法,Meta AI推出了ESM Metagenomic Atlas,这是第一个大规模的元基因组蛋白质的结构特征集,有超过6.17亿个结构(这项工作只花了2周时间)。该图集揭示了超过2.25亿个高置信度的预测,包括数百万个与实验确定的结构相比较新颖的结构,使人们前所未有地看到地球上一些最不为人所知的蛋白质结构的广阔性和多样性。

ESM宏基因组图谱数据库包含6.17亿种蛋白质的结构预测 

ESMFold vs AlphaFold

与AlphaFold工作原理不同,ESMFold基于语言学习模型,而不是基于结构和序列匹配算法。

AlphaFold2和其他替代方法使用多序列比对(MSA)和类似蛋白质的模板来实现原子分辨率结构预测的最佳性能或突破性成功;而ESMFold通过利用语言模型的内部表征,只用一个序列作为输入就能生成结构预测。

Meta AI声称AlphaFold 2和RoseTTAFold具有相似的准确性,但ESMFold在探索宏基因组蛋白质的结构空间方面速度更快。

 用ESMFold进行单序列结构预测的比较

ESMFold的优势之一是它提供了比现有原子分辨率结构预测方法更快的预测速度,这在某种程度上使它能够弥补包含数十亿序列的蛋白质序列数据库的快速增长与蛋白质结构和功能数据库的缓慢发展之间的差距。

6.17亿种蛋白质结构

作为测试案例,Meta AI将ESMFold用于来自环境来源(包括土壤、海水、人类肠道、皮肤和其他微生物栖息地)的批量测序“宏基因组”DNA数据库。绝大多数编码潜在蛋白质的DNA条目来自从未培养过且科学未知的生物体。

总的来说,Meta团队预测了超过6.17亿种蛋白质的结构。这项工作只花了2周时间(AlphaFold 可能需要几分钟才能生成一个预测)。任何人都可以免费使用这些预测结构和模型背后的代码。

Meta AI蛋白质团队的研究负责人Alexander Rives说,“这些是我们最不了解的结构,这些是非常神秘的蛋白质。我认为它们提供了深入了解生物学的潜力

首尔国立大学的计算生物学家Martin Steinegger说,“AlphaFold数据库的很大一部分由彼此几乎相同的结构组成,而宏基因组数据库应该能够覆盖以前看不见的蛋白质宇宙的很大一部分,现在有很大的机会来解开更多的黑暗。”

参考资料

https://www.nature.com/articles/d41586-022-03539-1

https://www.biorxiv.org/content/10.1101/2022.07.20.500902v2

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
AlphaFold之外,又一里程碑!两周预测6亿蛋白质结构,首次通往蛋白质“暗世界”
AlphaFold迎来对手?Meta AI 预测超6亿个蛋白结构,仅用2周时间
Meta AI团队新成果!150亿参数Transformer模型对原子级蛋白质结构进行进化尺度预测
Science前沿:大语言模型涌现演化信息,加速蛋白质结构预测
碾压AlphaFold?Meta预测蛋白质元宇宙的“暗物质”
跌宕2022年:这十件科技大事影响世界
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服