打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
AI蛋白质设计的进化|David Baker近两年半发表19篇CNS主刊文章
userphoto

2023.07.17 上海

关注
David Baker是AI蛋白质设计领域的全球最顶尖科学家之一。
本文整理了David Baker团队自2021年至今发表的19篇Cell/Science/Nature主刊文章的简要内容 (子刊文章不包括在内)。

全部文章参见

https://www.bakerlab.org/publications/

David Baker的研究方向

David Baker是华盛顿大学蛋白质设计研究所所长,专注于大分子结构和功能的设计。至今发表了550多篇研究论文,获得了100多项专利,并与他人共同创立了17家公司。

David Baker的研究方向包括以下六大方面:蛋白质结构预测、蛋白质和小分子结合、自组装纳米材料、新型蛋白质骨架、酶设计、蛋白质结构测定。

蛋白质结构预测


构建深度学习工具,仅通过序列数据就能快速准确地建立蛋白质三维结构模型。最新工具RoseTTAFold可供公众免费使用。

蛋白质与小分子结合

创造了产生高亲和性蛋白质结合的方法,并将其应用于医学感兴趣的靶点。团队还在设计与小分子结合的蛋白质。这项研究有助于深入了解大多数细胞过程的分子相互作用。

自组装纳米材料

团队正在开发创造新型自组装纳米结构的方法,并利用这些方法开发先进的疫苗和药物递送载体。首个获批药物COVID-19疫苗采用了团队的通过计算设计的蛋白质纳米粒子技术。

新型蛋白质骨架

过去,几乎所有的蛋白质设计工作都是对自然界中的蛋白质进行改造。团队正在开发从头开始设计各种异常稳定的蛋白质折叠的方法,这些折叠具有可调的几何形状,可用于特定应用。

酶设计

酶催化生命所必需的化学反应。团队正在开发设计新酶的方法,以实现自然界中未发现的化学转化。这项研究有助于揭示生命的化学基础。

蛋白质结构测定

团队正在开发利用有限的实验数据解决蛋白质结构的方法。世界各地的研究实验室都在使用这些工具。


19篇CNS主刊文章回顾

通过深度网络幻化进行全新蛋白质设计

De novo protein design by deep network hallucination. Nature. 2021 Dec;600(7889):547-552.

doi: 10.1038/s41586-021-04184-w.
利用深度神经网络从氨基酸序列预测残基间距离,在蛋白质结构预测方面取得了可观的进展。本文研究了这类网络捕获的信息是否足够丰富,以生成与训练模型所用的天然蛋白质序列无关的新折叠蛋白质。
首先生成随机的氨基酸序列,并将其输入到trRosetta结构预测网络中以预测起始残基-残基距离图,正如所预期的那样,该图是相当无特征的。然后,在氨基酸序列空间进行蒙特卡洛采样,优化网络预测的距离分布与背景分布之间的对比度(KL-divergence)。从不同的随机起点进行优化的结果是,新型蛋白质跨越了非常广泛的序列和预测结构。

本文获得了编码129个网络幻化(hallucinated)序列的合成基因,在大肠杆菌中表达并纯化了这些蛋白质,发现其中27个折叠成单分散物种(monodisperse species),其圆二色光谱与幻化结构一致。作者确定了三个幻觉蛋白质的结构,其中两个通过X射线晶体学,一个通过核磁共振,这些结构与幻化模型非常吻合。

因此,从序列预测蛋白质结构的深度网络可以反向设计新的蛋白质,这样的网络和方法应该与传统的基于物理的模型一起,为从头设计具有新功能的蛋白质做出贡献。本文证明了分子设计的生成深度学习方法的力量。

真核生物核心蛋白质复合物的计算结构

Computed structures of core eukaryotic protein complexes. Science. 2021 Dec 10;374(6573): eabm4805.
doi: 10.1126/science.abm4805.
蛋白质与蛋白质之间的相互作用在生物学中起着至关重要的作用,但许多真核生物蛋白质复合物的结构尚不清楚,可能还有许多相互作用尚未确定。本文利用全蛋白质组氨基酸协同进化分析和基于深度学习的结构建模的进步,在酿酒酵母蛋白质组中系统地鉴定和建立真核生物核心蛋白质复合物的精确模型。 
作者使用RoseTTAFold和AlphaFold的组合来筛选830万对酵母蛋白质的成对多序列比对,识别出1505个可能相互作用的蛋白质,并为106个以前未识别的复合物和806个未被结构表征的复合物建立结构模型。这些复合物有多达5个亚基,在真核细胞的几乎所有关键过程中发挥作用,为了解生物功能提供了广泛的视角。 

利用三轨神经网络准确预测蛋白质结构和相互作用

Accurate prediction of protein structures and interactions using a three-track neural network. Science. 2021 Aug 20;373(6557):871-876.
doi: 10.1126/science.abj8754.
在最近的CASP14蛋白质结构预测评估会议上,DeepMind展示了非常准确的预测结果。我们探索了包含相关思想的网络架构,并利用三轨网络获得了最佳性能。在该网络中,一维序列层、二维距离图层和三维坐标层的信息被相继转换和整合。三轨网络的结构预测精度接近DeepMind在CASP14中的预测精度,能够快速解决具有挑战性的X射线晶体学和低温电子显微镜结构建模问题,并为目前结构未知的蛋白质的功能提供见解。该网络还能仅通过序列信息快速生成准确的蛋白质-蛋白质复合物模型,从而缩短了需要先建立单个亚基模型再进行对接的传统方法的时间。
具有1D,2D和3D注意力轨道的RoseTTAFold架构如下。轨道之间的多个连接允许网络同时学习序列、距离和坐标内部和之间的关系:

         

设计蛋白质将抗体组装到模块化纳米笼中

Designed proteins assemble antibodies into modular nanocages. Science. 2021 Apr 2;372(6537):eabd9994.

doi: 10.1126/science.abd9994.

受体连接抗体或配体的多价呈现可增强其活性 (Multivalent display of receptor-engaging antibodies or ligands can enhance their activity)。在这里,我们通过计算设计纳米笼(其中一个结构成分是抗体或Fc-配体融合体,第二个结构成分是设计的抗体结合同源异构体,驱动纳米笼组装,而不是通过附着在已有的骨架上实现多价性。
通过电子显微镜测定了8个纳米笼的结构,包括二面体、四面体、八面体和二十面体结构,每个纳米笼分别含有2、6、12和30个抗体,这些结构与相应的计算模型非常吻合。在死亡受体5(DR5)介导的细胞凋亡、血管生成素-1受体(Tie2)介导的血管生成、CD40活化和T细胞增殖方面,与游离抗体或Fc融合抗体相比,靶向细胞表面受体的抗体纳米笼增强了信号传导。纳米笼组装还提高了α-SARS-CoV-2单克隆抗体和Fc-血管紧张素转换酶2(ACE2)融合蛋白对严重急性呼吸系统综合征冠状病毒2(SARS-CoV-2)伪病毒的中和作用。

从头设计跨膜β管

De novo design of transmembrane β barrels. Science. 2021 Feb 19;371(6531):eabc8182.
doi: 10.1126/science.abc8182.
跨膜β管蛋白(TMBs)能够自发折叠和插入膜并形成稳定的孔,因此对单分子分析技术具有极大的价值。我们利用全新计算设计的力量,结合"假设、设计和测试"的方法来确定TMB的设计原则,特别是negative设计对减缓β管组装的重要性。我们设计了新的八链TMB,与已知的TMB没有同源性,可插入合成脂膜并可逆折叠,其核磁共振和X射线晶体结构与计算模型非常相似。这些进展将有助于为广泛的应用定制孔隙设计。 

模块化和可调谐蛋白质生物传感器的从头设计

De novo design of modular and tunable protein biosensors. Nature. 2021 Mar;591(7850):482-487.
doi: 10.1038/s41586-021-03258-z.
天然存在的蛋白质开关已被重新用于开发细胞和临床应用的生物传感器和报告器。然而,这类开关的数量有限,重新设计它们具有挑战性。在这里,我们展示了一种基于蛋白质的通用生物传感器,它可以通过全新设计的蛋白质开关逆转信息流,其中肽键的结合触发感兴趣的生物输出。所设计的传感器是模块化的分子装置,具有闭合的暗态和开放的发光态;分析物的结合驱动开关从闭合态转向开放态。
由于传感器是基于分析物结合到传感器激活的热力学耦合,因此只需要一个目标结合域,这简化了传感器的设计,并允许在溶液中直接读出。我们创造的生物传感器可以灵敏地检测抗凋亡蛋白BCL-2、IgG1 Fc结构域、HER2受体和肉毒杆菌神经毒素B,以及心肌肌钙蛋白I和抗乙型肝炎病毒抗体,具有临床检测这些分子所需的高灵敏度。鉴于需要诊断工具来追踪严重急性呼吸系统综合征冠状病毒2(SARS-CoV-2),我们利用这种方法设计了SARS-CoV-2尖峰蛋白的传感器以及针对膜蛋白和核壳蛋白的抗体。前者结合了全新设计的尖峰受体结合域(RBD)粘合剂,其检测限为15 pM,发光信号比背景水平高50倍。该平台的模块化和灵敏度使其能够快速构建用于多种分析物的传感器,并凸显了从头开始设计蛋白质以创建具有新的有用功能的多态蛋白质系统的能力。

生物活性二元蛋白二维材料设计

Design of biologically active binary protein 2D materials. Nature. 2021 Jan;589(7842):468-473.

doi: 10.1038/s41586-020-03120-8.

有序的二维阵列,如S层和设计的类似物,已经引起了生物工程师的兴趣,但除了用柔性连接体形成的单一晶格外,它们仅由一种蛋白质成分构成。由两种成分组成的材料在调节组装动力学和整合更复杂的功能方面具有相当大的潜在优势。在这里,我们描述了一种计算方法,通过在成对的二面性蛋白质构件之间设计刚性界面来生成共同组装的二元层,并用它来设计p6m晶格。  
由于这种材料是从头开始设计的,因此可以很容易地对其组分进行功能化和重新配置其对称性,从而形成具有可区分表面的配体阵列,我们证明这种阵列可以驱动广泛的受体聚集、下游蛋白招募和信号传导。使用原子力显微镜观察支撑双层膜和定量显微镜观察活细胞,我们发现组装在膜上的阵列具有与体外形成的阵列相似的组分配比和结构,因此我们的材料可以在细胞膜等基本无序的基质上建立秩序。
与先前表征的细胞表面受体结合组装体(如抗体和纳米笼)快速内吞不同,我们发现组装在细胞表面的大型阵列以可调的方式抑制内吞,这对延长受体参与和免疫逃避具有潜在的治疗意义。我们的工作为合成细胞生物学奠定了基础,在合成细胞生物学中,多蛋白宏观材料被设计用来调节细胞反应并重塑合成和生命系统。

四价流感纳米颗粒疫苗诱导广泛保护

Quadrivalent influenza nanoparticle vaccines induce broad protection. Nature. 2021 Apr;592(7855):623-628.

doi: 10.1038/s41586-021-03365-x.

在这里,我们展示了通过计算设计的双组分纳米颗粒免疫原可诱导针对多种流感病毒的强效中和及广泛的保护性抗体反应。这种纳米颗粒免疫原包含20个有序排列的血凝素糖蛋白三聚体,它们在体外的组装可以精确控制多种不同血凝素蛋白以确定的比例共同显示。共同显示四价流感疫苗中四种血凝素的纳米颗粒免疫原在几种动物模型中引起了针对疫苗匹配毒株的抗体反应,其效果等同于或优于商用四价流感疫苗,同时通过靶向亚优势但保守的血凝素干,诱导了针对异源病毒的广泛保护性抗体反应。纳米颗粒免疫原诱导的强效受体阻断抗体和交叉反应性干定向抗体的结合使它们成为有吸引力的超季节性流感疫苗候选物,有可能取代传统的季节性疫苗。 

幻化对称蛋白质组装

Hallucinating symmetric protein assemblies. Science. 2022 Oct 7;378(6615):56-61.
doi: 10.1126/science.add1964.
深度学习生成方法为广泛探索天然蛋白质序列和结构之外的蛋白质结构空间提供了机会。在这里,我们利用深度网络幻化生成了广泛的对称蛋白质同质异构体,只给定了原体数目和原体长度。七种设计的晶体结构与计算模型非常相似(中位数均方根偏差:0.6埃),三种具有多达1550个残基和C33对称性的10纳米巨环的冷冻电镜结构也非常相似;所有这些结构都与以前解决的结构有很大不同。我们的研究结果凸显了利用深度学习可以生成的新蛋白质结构的丰富多样性,并为设计日益复杂的纳米机器和生物材料组件铺平了道路。

使用 ProteinMPNN 进行基于深度学习的稳健蛋白质序列设计

Robust deep learning-based protein sequence design using ProteinMPNN. Science. 2022 Oct 7;378(6615):49-56.
doi: 10.1126/science.add2187.
尽管深度学习已经彻底改变了蛋白质结构预测,但几乎所有具有实验特征的全新蛋白质设计都是通过基于物理的方法(如Rosetta)产生的。在这里,我们描述了一种基于深度学习的蛋白质序列设计方法ProteinMPNN,它在计算和实验测试中都有出色的表现。在原生蛋白质骨架上,ProteinMPNN的序列恢复率为52.4%,而Rosetta为32.9%。不同位置的氨基酸序列可以在单链或多链间耦合,从而能够应用于当前广泛的蛋白质设计挑战。我们利用X射线晶体学、冷冻电镜和功能研究证明了ProteinMPNN的广泛实用性和高准确性,挽救了以前用Rosetta或AlphaFold设计失败的蛋白质单体、环状同源高分子、四面体纳米颗粒和目标结合蛋白。
ProteinMPNN的架构:

高精度从头设计可透膜的环状多肽

Accurate de novo design of membrane-traversing macrocycles. Cell. 2022 Sep 15;185(19):3520-3532.e26.
doi: 10.1016/j.cell.2022.07.019.
我们采用计算设计和实验表征相结合的方法,系统地研究了大环化合物膜渗透性和口服生物利用度的设计原理。我们设计了184种6-12个残基的大环,其预测结构范围广泛,包含非典型的骨架修饰,实验测定了35种结构,其中29种与计算模型非常接近。通过这样的控制,我们表明通过确保所有酰胺(NH)基团参与内部氢键相互作用,可以系统地实现膜渗透性。在6-12个残基大小范围内的84个设计交叉膜的表观渗透性大于1×10-6 cm/s。暴露NH基团的设计可通过设计脂膜中偏爱的替代等能完全氢键态使其具有膜渗透性。以高结构精度设计膜渗透性和口服生物可用性肽的能力应有助于下一代设计的大环治疗药物。
用于设计透膜肽的计算机管道的总体示意图:

利用深度学习构建蛋白质功能位点

Scaffolding protein functional sites using deep learning. Science. 2022 Jul 22;377(6604):387-394.
doi: 10.1126/science.abn2100.
蛋白质的结合和催化功能通常由整体蛋白质结构固定的少量功能残基介导。在这里,我们描述了无需预先指定骨架的折叠或二级结构就能构建此类功能位点的深度学习方法。第一种方法是"约束幻化(constrained hallucination)",它可以优化序列,使其预测结构包含所需的功能位点。第二种方法是"内绘制(inpainting)",从功能位点开始,在经过专门训练的RoseTTAFold网络中填充额外的序列和结构,在一次前向传递中创建一个可行的蛋白质骨架。我们使用这两种方法设计候选免疫原、受体陷阱、金属蛋白、酶和蛋白质结合蛋白,并通过结合使用计算和实验测试验证设计。
蛋白质功能设计方法如下:

机械耦合轴转子蛋白质组件的计算设计

Computational design of mechanically coupled axle-rotor protein assemblies. Science. 2022 Apr 22;376(6591):383-390.
doi: 10.1126/science.abm1183.
自然界的分子机器包含相互运动的蛋白质成分。设计这种具有内部自由度的机械约束纳米级蛋白质结构是计算蛋白质设计的一个突出挑战。在这里,我们探索了从设计的具有内部循环或二面对称性的轴和转子组件中重新构建蛋白质机械。我们发现轴-转子系统在体外和体内都能按照设计进行组装。利用低温电子显微镜,我们发现这些系统具有构象可变的相对方向,反映了耦合组件的对称性和计算设计的界面能谱。这些具有内部自由度的机械系统向设计可基因编码的纳米机械迈出了一步。

仅从靶结构设计蛋白质结合蛋白

Design of protein-binding proteins from the target structure alone. Nature. 2022 May;605(7910):551-560.

doi: 10.1038/s41586-022-04654-9.
在没有靶蛋白三维结构信息的情况下设计能与靶蛋白表面特定位点结合的蛋白仍然是一个挑战。在这里,我们描述了这一问题的一般解决方案,即从广泛探索蛋白质表面选定区域可能的结合模式的广阔空间开始,然后在最有希望的结合模式附近加强搜索。我们通过为12种不同形状和表面性质的蛋白质靶标从头设计结合蛋白,证明了这种方法的广泛适用性。生物物理表征结果表明,这些结合蛋白都小于65个氨基酸,具有超稳定性,经过实验优化后,能以毫微摩尔到皮摩尔的亲和力与靶标结合。我们成功地解析了五种结合剂-靶标复合物的晶体结构,所有这五种复合物都与相应的计算设计模型非常吻合。近50万个计算设计和数十万个点突变体的实验数据详细反馈了该方法的优势和局限性以及我们目前对蛋白质-蛋白质相互作用的理解,并将指导两者的改进。我们的方法能够针对各种蛋白质上的感兴趣位点有针对性地设计粘合剂,用于治疗和诊断应用。
结合蛋白设计管道如下:
 

通过隐式negative设计重新配置不对称蛋白质组装

Reconfigurable asymmetric protein assemblies through implicit negative design. Science. 2022 Jan 21;375(6578):eabj7662.

doi: 10.1126/science.abj7662.

进行亚基交换的不对称多蛋白复合物在生物学中起着核心作用,但也给设计带来了挑战,因为这些组分不仅必须包含能够实现可逆结合的界面,而且还必须是稳定的和行为良好的。我们使用隐式negative设计来产生β折叠介导的异二聚体,这些异二聚体可以组装成各种各样的复合物。这些设计在隔离状态下稳定、折叠和可溶,并且在混合后迅速组装,晶体结构接近计算模型。我们构建了多达六种不同组分的线性排列的异构高聚物、支化异构高聚物、封闭的C4对称双组分环,以及组装在环状同源高聚物中心枢纽上的异构高聚物,并证明了这种复合物可以通过亚基交换而很容易地重组。我们的方法为设计非对称可重构蛋白质系统提供了一条通用途径。

不对称异寡聚复合物的设计策略:

IV型分泌系统的冷冻电镜结构

Cryo-EM structure of a type IV secretion system. Nature. 2022 Jul;607(7917):191-196.
doi: 10.1038/s41586-022-04859-y.
细菌共轭是DNA(通常是质粒DNA)从供体细胞向受体细胞单向转移的基本过程。它是抗生素耐药基因在细菌种群中传播的主要途径。在革兰氏阴性细菌中,共轭作用由供体细胞产生并嵌入其外膜和内膜的大型转运装置--共轭IV型分泌系统(T4SS)介导。T4SS还能形成长的胞外丝--共轭柔毛,这对DNA转移至关重要。在这里,我们展示了由92个多肽组成的2.8百万道尔顿T4SS复合物的高分辨率冷冻电镜(cryo-EM)结构,这些多肽代表了参与柔毛生物发生的10个基本T4SS组分中的8个。我们利用蛋白质界面的协同进化分析将剩余的两个组分加入到结构模型中,从而实现了包括柔毛在内的整个系统的重组。该结构描述了组装构成T4SS的许多组分所需的异常庞大的蛋白质-蛋白质相互作用网络,并提供了关于它们制造纤毛虫的独特机制的见解。

通向完全可编程蛋白质催化之路

The road to fully programmable protein catalysis. Nature. 2022 Jun;606(7912):49-58.
doi: 10.1038/s41586-022-04456-z.
从零开始设计高效酶的能力将对化学、生物技术和医学产生深远影响。过去十年中蛋白质工程的快速发展使我们乐观地认为这一目标指日可待。含有金属辅助因子和非典型有机催化基团的人工酶的开发显示了如何通过优化蛋白质结构来利用非蛋白元素的反应性。与此同时,计算方法已被用于根据过渡态稳定的基本原理设计用于各种反应的蛋白质催化剂。尽管设计的催化剂活性很低,但大量的实验室进化已被用于产生高效的酶。对这些系统的结构分析表明,要设计出具有更高活性的催化剂,需要很高的精确度。为此,包括深度学习在内的新兴蛋白质设计方法特别有望提高模型的准确性。在此,我们对该领域的主要发展进行了总结,并强调了新的创新机遇,这些机遇将使我们超越目前的技术水平,实现生物催化剂的稳健设计,以满足社会需求。

利用深度学习从头设计荧光素酶

De novo design of luciferases using deep learning. Nature. 2023 Feb;614(7949):774-780.
doi: 10.1038/s41586-023-05696-3.
从头酶设计试图将预测能催化感兴趣反应的活性位点和底物结合口袋引入几何上兼容的原生骨架,但一直受限于缺乏合适的蛋白质结构和原生蛋白质序列结构关系的复杂性。在这里,我们描述了一种基于深度学习的"全家族幻化"方法,该方法可以生成大量理想化的蛋白质结构,其中包含不同的口袋形状和编码它们的设计序列。
我们利用这些骨架设计了人工荧光素酶,它可以选择性地催化合成荧光素底物二苯基三嗪和2-脱氧腔肠素的氧化化学发光。所设计的活性位点将一个精氨酸胍基团与一个阴离子相邻,该阴离子在反应过程中形成一个具有高度形状互补性的结合袋。对于这两种荧光素底物,我们获得了具有高选择性的设计荧光素酶;其中最活跃的是一种小型(13.9 kDa)、可恒温(熔点高于95 °C)的酶,它对二苯基三嗪的催化效率(kcat/Km = 106 M-1 s-1)与原生荧光素酶相当,但底物特异性更高。从零开始创造在生物医学中具有广泛应用的高活性和特异性生物催化剂是计算酶设计的一个关键里程碑,我们的方法应该能够产生广泛的荧光素酶和其他酶。

通过超螺旋匹配从头设计模块化多肽结合蛋白

De novo design of modular peptide-binding proteins by superhelical matching. Nature. 2023 Apr;616(7957):581-589.

doi: 10.1038/s41586-023-05909-9.

设计序列特异性肽结合蛋白的一般方法在蛋白质组学和合成生物学中具有广泛的用途。然而,设计肽结合蛋白具有挑战性,因为大多数肽不具有确定的独立结构,氢键必须与埋藏在肽骨架中的极性基团结合。

在这里,受天然和再造蛋白质-肽系统的启发,我们着手设计由重复单元组成的蛋白质,这些重复单元可结合具有重复序列的肽,蛋白质的重复单元与肽的重复单元之间具有一一对应的关系。我们使用几何哈希算法来识别蛋白质骨架和肽对接排列,这些排列与蛋白质侧链和肽骨架之间的双叉氢键兼容。然后对蛋白质序列的其余部分进行折叠和肽结合优化。我们设计的重复蛋白以多脯氨酸II构象与六种不同的三肽重复序列结合。这些蛋白具有超稳定性,在体外和活细胞中能以纳摩尔到皮摩尔的亲和力与4到6个三肽目标串联重复序列结合。晶体结构揭示了蛋白质和肽之间的重复相互作用,包括从蛋白质侧链到肽骨架的氢键阶梯。通过重新设计单个重复单元的结合界面,可以实现对非重复肽序列和原生蛋白无序区的特异性。

利用强化学习自上而下设计蛋白质结构

Top-down design of protein architectures with reinforcement learning. Science. 2023 Apr 21;380(6642):266-273.

doi: 10.1126/science.adf6591.

由于进化选择的结果,自然形成的蛋白质组装体的亚基往往以很大的形状互补性组合在一起,以产生目前的设计方法无法实现的最佳功能结构。我们描述了一种基于强化学习的"自上而下"的设计方法,该方法利用蒙特卡洛树搜索,在整体结构和特定功能约束的背景下对蛋白质构象进行采样,从而解决了这一问题。所设计的盘状纳米孔和超小型二十面体的冷冻电镜结构与计算模型非常接近。二十面体可以实现免疫原和信号分子的高密度显示,从而增强疫苗反应和血管生成诱导。我们的方法能够自上而下地设计出具有所需系统特性的复杂蛋白质纳米材料,并证明了强化学习在蛋白质设计中的强大作用。

利用RFdiffusion从头设计蛋白质结构和功能

De novo design of protein structure and function with RFdiffusion. Nature. 2023 Jul 11.
doi: 10.1038/s41586-023-06415-8.
最近在利用深度学习方法设计新蛋白质方面取得了相当大的进展。尽管取得了这一进展,但用于蛋白质设计的通用深度学习框架仍有待描述,该框架能够解决广泛的设计挑战,包括全新粘合剂设计和高阶对称架构设计。扩散模型在图像和语言生成建模中取得了相当大的成功,但在应用于蛋白质建模时却成效有限,这可能是由于蛋白质骨架几何和序列结构关系的复杂性。在这里,我们展示了通过在蛋白质结构去噪任务中对RoseTTAFold结构预测网络进行微调,我们获得了一个蛋白质骨架的生成模型,该模型在无条件和拓扑约束的蛋白质单体设计、蛋白质粘合剂设计、对称寡聚体设计、酶活性位点骨架以及用于治疗和金属结合蛋白质设计的对称主题骨架方面取得了杰出的性能。我们通过实验表征了数百个设计的对称组合体、金属结合蛋白和蛋白结合剂的结构和功能,证明了这种称为RoseTTAFold Diffusion(RFdiffusion)的方法的强大功能和通用性。RFdiffusion的准确性通过设计的粘合剂与流感血凝素复合物的低温电子显微镜结构得到证实,该结构与设计模型几乎完全相同。与根据用户指定的输入生成图像的网络类似,RFdiffusion能够根据简单的分子规格设计出多种功能蛋白质。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
在线预测蛋白质三级结构,让文章提升逼格的策略!(附攻略)
《科学》年度突破揭晓!解决50年生物学难题,它改变了一个领域
秒杀AlphaFold!Science:用AI一秒设计自然界全新蛋白质
同日两篇Science论文,David Baker团队推出从头设计蛋白质序列新模型,几秒即可设计出原创分子
Science | 以功能为核心的蛋白质设计
卢培龙:人工设计蛋白质将怎样改变人类生活?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服