小分子药物一直是人工智能应用于药物研发的前沿领域。然而,人工智能工具正在越来越多地应用于大分子领域(包括抗体、基因疗法和基于RNA的疗法等)。这些疗法在生物制药行业目前的产品组合及其未来的商业潜力中占有重要份额。
2023年8月29日,麦肯锡咨询公司的Navraj S. Nagra等人在Nat Rev Drug Discov杂志发表文章The company landscape for artificial intelligence in large-molecule drug discovery。
文章整理和分析了基于人工智能的方法如何应用于大分子药物发现、开发这些方法的公司及其研发管线情况,并探讨了生物制药行业成功实施这些方法所需的条件基础。
人工智能在大分子药物研发中的应用主要包括3个方面:结构预测、功能预测和新候选药物生成。在这些方面,各种方法正在迅速成熟。 蛋白质结构预测对于大分子药物研发非常重要,涉及的领域从靶点识别(如预测抗原结构)到先导物识别和优化。该领域的许多公司现在都在使用AlphaFold2或其他具有类似准确性的蛋白质结构预测模型(如 RoseTTAFold)。正在进行的开发工作包括改进易用性、可扩展性、可再训练性等(例如 ColabFold、FastFold、OmegaFold 和 OpenFold),并利用类似于GPT-4等大型语言模型的不同架构(例如 ESMFold)提高通用性和速度。
目前已开发出人工智能工具来预测大分子候选疗法的功能,包括抗原-抗体或RNA-蛋白质结合,以及与其可开发性相关的方面(如药代动力学清除率)。这些预测可以使用梯度提升树(gradient-boosted trees)等机器学习模型或分子动力学模拟等计算模型来完成。
最近,深度学习方法已被用于预测抗体亲和力等关键治疗特性,包括基于图的模型、卷积神经网络、递归神经网络或"大分子语言模型"等。
生成大分子候选疗法快速增长的数据可用性支持了可大规模生成蛋白质、抗体或mRNA的算法的开发,作为先导物生成或优化的一部分。例如,可以基于扩散、变异自动编码器模型,或通过采用类似于GPT-4的大型语言模型,对蛋白质序列等特定模式的数据进行训练。
采用这种算法的具体例子包括开发新型抗原结构、确定稳定性和免疫原性的最佳mRNA结构以及新型蛋白质和抗体设计。设计出的分子随后通常会在高通量系统中进行评估,以实验证实其功能特性,并进一步强化和改进候选分子的生成。上述工具用途广泛。例如,RFdiffusion或ESM系列模型已被用于新型蛋白质的生成以及结构和功能预测。这些工具目前正在补充或取代传统的计算方法。 人工智能工具在抗体发现流程中的应用如下。
补充图1|传统计算方法和人工智能工具如何加速抗体疗法发现
目前,有82家公司活跃在AI大分子药物研发领域。其中60%以上的公司成立于过去5年,这表明该行业在近期技术进步(如 AlphaFold 的出现)的推动下刚刚起步。这些公司之间也出现了一些整合的迹象,如iBio于2022年收购了RubrYc Therapeutics。补充表1|按年份整理的AI大分子药物研发领域公司成立情况老牌生物制药公司正在内部或通过收购投资建设大分子药物发现的人工智能能力,例如基因泰克于2021年收购了Prescient Design,这是一家人工智能驱动的生物技术公司,将机器学习应用于抗体发现。
成熟的大型生物制药公司也与人工智能驱动的生物技术公司建立了合作关系,2021年确定的合作关系有51项,高于2016年的10项。图1a|每年成立的以人工智能为驱动、专注于大分子药物研发的生物技术公司数量,以及这些公司每年与Top20的生物制药公司建立合作关系的数量
该领域的公司在2021年筹集了39亿美元。然而,2022年的融资总额大幅下降,仅为7亿美元。
值得注意的活动包括AbCellera(专注于抗体发现)于2020年IPO,募集了5.55亿美元。Absci(专注于抗体发现)于2021年IPO,募集了2亿美元。Generate Biomedicines(专注于蛋白质药物发现)于2021年B轮融资,募集了3.7亿美元。 人工智能驱动的生物技术公司的研发管线目前还处于早期阶段。有三个管线已进入II期:Evaxion正在开发一种基于多肽的个性化癌症免疫疗法,用于治疗转移性黑色素瘤。ZielBio 正在开发一种针对实体瘤的plectin单克隆抗体。PharmCADD正在开发一种候选mRNA疫苗,用于治疗SARS-CoV-2。
此外,还有三个管线处于I期:Peptilogics的多肽抗生素用于治疗假体周围关节感染。SparX Therapeutics的单克隆抗体靶向claudin 18.2用于治疗胃癌。PharmCADD的另一种mRNA疫苗用于治疗SARS-CoV-2。 图1c|按研发阶段和适应症划分,这些公司的管线资产数量开发这些分子的公司利用基于人工智能的靶点识别、功能(结合)预测和抗体生成(包括使用生成性人工智能)作为候选药物开发的一部分。临床开发中的分子详情见下表。
补充表2|拥有大分子候选药物的人工智能驱动型生物技术公司
在临床前管线中,这些公司正在开发的最大资产组是肿瘤学领域,共有8个分子。就方式而言,临床前开发中的RNA疗法和多肽疗法(约占所有分子的 50%)多于抗体疗法。这可能是由于抗体设计的复杂性较高,而且缺乏可用于训练机器学习工具的功能数据。人工智能在大分子药物发现中的应用正在迅速增加。然而,虽然这些工具的潜在价值已在学术环境中得到了令人信服的证明,但迄今为止,规模化部署仍具有挑战性。 首先,必须将人工智能模型充分融入研究流程,并对研究科学家进行适当的能力建设。通过这样做,公司可以快速训练和验证机器学习算法,同时还能克服人工智能工作可能出现的"孤岛"现象。例如,在使用大型语言模型对抗体亲和力进行高通量预测时,通过综合研究系统及时进行体外验证,将进一步训练和提高计算模型的性能。 其次,必须建立技术环境,如复杂的数据工程管道(整合公共和内部数据并能够自动标记)、合适的计算基础设施以及源系统建模环境的整合。这样,企业就能以一定的速度训练和完善人工智能模型,为下一次实验提供信息并加以改进。 最后,需要将人工智能技术结合到药物发现之外的整个研发过程中,如试验设计和患者亚群识别等领域,以进一步提高试验效率和成功概率。 Nagra NS, van der Veken L, Stanzl E, Champagne D, Devereson A, Macak M. The company landscape for artificial intelligence in large-molecule drug discovery. Nat Rev Drug Discov. 2023 Aug 29. doi: 10.1038/d41573-023-00139-0.
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请
点击举报。