攻克难成药靶点，AI赋能虚拟筛选带来成功案例

摘要： GPX4是细胞铁死亡过程中的重要靶点,GPX4负责催化还原的过氧化脂质都是嵌入在细胞膜中的,为了贴合平坦的细胞膜表面,GPX4的催化口袋非常平坦,类似于蛋白蛋白界面,不是常规意义上的可药口袋,这对非共价靶向GPX4的催化口袋造成了很大的难度。

在靶向这类平坦的口袋时,在特大化合物库中进行筛选是非常有必要的,因为平坦的口袋能提供的作用力有限,只有极少数小分子能完美地贴合到口袋上,并充分...

GPX4是细胞铁死亡过程中的重要靶点，GPX4负责催化还原的过氧化脂质都是嵌入在细胞膜中的，为了贴合平坦的细胞膜表面，GPX4的催化口袋非常平坦，类似于蛋白蛋白界面，不是常规意义上的可药口袋，这对非共价靶向GPX4的催化口袋造成了很大的难度。

在靶向这类平坦的口袋时，在特大化合物库中进行筛选是非常有必要的，因为平坦的口袋能提供的作用力有限，只有极少数小分子能完美地贴合到口袋上，并充分利用这些作用力来达到较高的活性。特大化合物库中的分子一般由化学砌块通过不同类型的单步化学反应组合而成，其分子数量能达到10亿以上，这为找到那些极少数能靶向GPX4催化口袋的分子提供了足够大的基数。

目前还没有任何湿实验方法能够支撑10亿级别化合物库的实体筛选。

苗头化合物筛选的湿实验方法中，目前主流的方法有高通量筛选（HTS）和DNA编码化合物库（DEL）等。但和特大化合物库相比，两者所覆盖的化学空间就小了很多。HTS测试的分子数量很难超过一百万，也就是仅有特大化合物库千分之一的数量。DEL所包含的分子能达到一亿个，但是因为受到化学反应类型的限制，DEL的分子多样性远远不如特大化合物库。

虽然湿实验方法无法覆盖特大化合物库的所有分子，但在虚拟筛选中，通过采用不同颗粒度的亲和力打分算法，并结合机器学习算法可以实现对10亿分子的高效筛选，并具有高度的准确性。

但在特大化合物库中搜索时，传统的虚拟筛选策略是不适用的。

• 传统的虚拟筛选方法主要包含以下步骤：

1）分子对接：把库中所有的小分子对接到要靶向的口袋上，获得小分子在口袋上的结合模式。

2）对接打分：对结合模式用对接打分进行评估，并挑选对接打分较好的分子；

3）评估排序：对挑选出的分子用精度更高的方法，如MMGBSA或者FEP进行评估；

4）挑选验证：挑选MMGBSA或者FEP打分较好的分子进行合成测试。

在传统虚筛流程的1）和2）步骤中，即使对千万级别化合物库中的每个分子进行对接打分，也需要花费一整天的时间来完成。而对于一个规模达到10亿的虚拟化合物库，要完成全部的对接打分则需要长达3个月的时间。

显然，这样的时间成本是不切实际的。

• 晶泰科技的解决方案——定制化的虚拟筛选策略

在GPX4案例中，晶泰科技使用了针对特大化合物库开发的虚筛流程。

1）片段对接：首先用10,000个片段作为“探针”对接到GPX4的催化口袋上，这些片段拥有不同的化学性质和结构，代表了不同类型的药效团。

2）FEP计算：接着用XFEP（晶泰科技自由能微扰技术）来评估这些片段在口袋上各个位置的结合强度。

3）主动学习：运用Active Learning (主动学习) 技术通过多轮迭代，对分子库进行采样和分析，在一天时间内总计进行了超过5000个FEP计算，并用预测的结合强度训练AI模型，用于加速在化学空间中的探索。

4）药效团模型构建：通过FEP预测出的结合强度排序这些片段，得到GPX4催化口袋上各个位置所对应的药效团。

5）快速检索：使用这些药效团快速检索特大化合物库，并挑出8000+个拥有这些药效团且空间排布正确的分子。

6）虚拟筛选：通过传统虚筛流程对这8000+个分子进行排序，最终挑选了159个分子进行自动化库合成。

值得一提的是，在第4）步中，由于药效团的匹配过程不需要蛋白结构坐标，所以相比于需要蛋白结构作为输入的对接打分是更快速的，在1天时间内就完成特大化合物库的药效团匹配。

根据药效团和它们的空间排布，研究团队从晶泰自动化可及的虚拟化合物库中挑选了8,000多个化合物，并根据它们的物理化学性质、预测的ADMET属性FEP打分和AI模型预测的可合成性进行筛选，最后挑选了159个化合物进行合成，成功合成了124个化合物（纯度95%，重量5mg）。最后，团队使用商业试剂盒对这124个分子的酶活进行了测试，在这些全新骨架的分子中，有3个分子的活性达到了IC50<10μM，活性最好的分子其酶活与已报道的共价抑制剂相当。在高通量FEP计算平台和自动化库合成技术的帮助下，整个虚拟筛选+合成的过程仅用了28个工作日。这些苗头化合物有望作为非共价靶向GPX4的起点，为进一步在动物模型中验证GPX4的靶向效果奠定基础。

正如前文所述，通过在特大化合物库中进行筛选，可以提高针对GPX4等口袋较浅的靶点的成功率。通常情况下，在苗头化合物筛选阶段，每个分子的成本和交付时间都受到严格控制。在成本和交付时间的双重压力下，市面上的特大化合物库中的分子通常是通过不同的分子砌块进行一步合成得到的，这也限制了库中分子的多样性。

晶泰科技的特大虚拟化合物库由200万个分子砌块通过化学反应规则生成得到，除了一步反应组合成的分子，也包括需要两步化学合成才能得到的分子，这使得晶泰的虚拟特大化合物库的多样性远远大于其他供应商。而且，这些两步反应合成的分子的单价和交付周期依然适用于苗头化合物筛选的场景。一个原因是公司实现了化学合成中多个重要环节的完全自动化，并且拥有200多台自动化合成工站。这让在传统实验室中一个合成人员需要3周才能完成的反应；而在晶泰，可以在5天内用几台自动化合成工站轻松完成。第二个原因是，公司使用合成工站产生了大量高质量的常用反应合成数据（每月产生30,000个反应数据），然后针对不同的反应类型训练了反应可行性预测AI模型。根据这些AI模型预测结果，可以直接跳过合成小试，从而大幅缩短人工、物料成本以及交付时间。

基于这两个因素，晶泰科技成功地将两步化学合成所需的成本和时间降低到与传统实验室中完成一步合成相当的水平。这一创新使得公司的虚拟化合物库能够扩展到那些只能通过两步合成才能获得的分子，从而在分子总量和多样性方面实现了突破。

另一个技术关键点在于使用了FEP进行结合亲和力的打分，根据晶泰内部的实践经验和文献报道【1】，FEP在虚拟筛选中对亲和力的评估精度远远高于对接打分，根本的原因在于对接打分作为上世纪90年代的产物，在算法上采用了大量的近似来适应当时的计算机算力。而相对于对接打分，FEP在预测亲和力时，不但考虑了基本的蛋白配体相互作用力，同时也考虑了配体分子内能、去溶剂化能和结合口袋的柔性变化等对接打分不考虑的部分，对于决定亲和力的因素描述更完整。FEP在虚拟筛选中的应用可以说让虚拟筛选的成功率相比于过去得到了数量级的飞跃。

据统计，在晶泰内部60多个虚拟筛选项目的应用表明, XFEP的精度超越现有的大部分商业软件，并得到了国际头部药企的普遍认可。得益于XFEP的使用，晶泰的虚拟筛选成功率达到90%以上（IC50<100μM），有70%的虚筛项目达到了IC50<10μM。

当然，FEP能有更高的精度也需要更大的算力来支撑。晶泰的XFEP平台通过优化硬件利用率，相对于开源的FEP软件提升了一倍的计算效率。同时，晶泰拥有大规模云平台调度能力，覆盖全球主流的云平台供应商，来保证5000个分子/天的亲和力评估通量。目前，只有极少数虚拟筛选服务供应商，如晶泰，具备进行大规模FEP计算的能力。尽管市场上普遍使用的是上个世纪开始应用的传统虚拟筛选流程，这种流程在许多靶点上已被证明有效，并能够降低化合物筛选的成本，但与HTS和DEL筛选相比，传统虚拟筛选流程并不能提供差异化的结果。一些供应商在传统虚拟筛选流程中引入了FEP计算，在对接打分筛选之后，对于对接打分排名TOP100的分子进行FEP计算。然而，由于对接打分的精度限制，对于像GPX4这样难以靶向的小分子靶点，这100个分子中可能没有任何阳性分子，因此这100个FEP计算对虚拟筛选结果没有任何帮助。虚拟筛选是一种基于AI和计算化学的高效药物发现工具，能够加速新药的发现和开发过程。随着AI技术和计算能力的不断提升，以及自动化技术的快速发展，虚拟筛选在药物设计领域将继续发挥重要作用。晶泰科技将致力于进一步优化筛选方法，大力发展AI模型和自动化技术，提高筛选的准确性和效率，为药物研发持续赋能。

信息来源：医药魔方

声明：本文系转载内容，版权归原作者所有，涉及作品问题，我们将在第一时间删除！

【所属栏目：行业动态】【查看次数：2553次】【发布时间：2024年11月12日】

上条：第十批国采最新消息，规则重大变化
下条：央视曝光60亿虚开发票案！规避“两票制”，带金销售遭监管重拳