继2018年、2020年的两代AlphaFold的横空出世后,蛋白质结构预测已经接近实验精度,为计算赋能药物研发领域打下了坚实基础。在药物研发漫长的研发环节中,分子与蛋白质的相互作用预测是下一个计算赋能药物研发领域的“圣杯”。近日,星药科技预发表了TBind: Trigonometry Aware Neural NetworK for Drug-Protein Binding Structure Prediction。该模型是全球*能同时预测小分子和靶蛋白三维结合构象和结合亲和力的深度表征学习框架,大幅超越现存方法的*结果。TBind采用端到端的数据驱动范式,结合物理启发式的几何图神经网络,打通了复合物三维结合模式及结合强度的双重预测,实现了对国际商业分子对接软件精度和效率的双超越,为分子蛋白相互作用预测提供了国产*突破性方案。继AlphaFold之后, 将计算驱动的药物研发带入新的纪元。
药物发现是一项*挑战性的任务。在庞大的化学空间(约1060个类药物分子)中,只有一小部分能与特定的生物靶点结合并产生治疗效果。目前的药物一般以蛋白质作为靶分子,通过设计与它相互作用的化合物小分子来治疗疾病。因此,发现能与蛋白质分子相互作用的小分子化合物并阐明其与靶蛋白的结合模式对于新药研发至关重要。
为了解决上述痛点,赋能新药研发,继四月份与阿斯利康全球研发中心联合发布了基于结构的深度亲和力预测模型STAMP-DPI后,星药科技联合复旦大学、中山大学研究人员,最新发布了基于三体深度神经网络(Trigonometry Aware Neural NetworK)的TBind v1.0.1,专攻小分子配体-蛋白质复合物三维结构预测。
受启发于AlphaFold2的氨基酸内“Triangle Multiplicative Update”架构,TBind将该模块有机地拓展到小分子和靶蛋白的分子间相互作用中,进行了多处升级,使得模型突破传统分子间力场的限制,有了直接拟合多体效应的能力且并未显著增加模型的复杂性。在分子间的三体神经网络模块基础上,TBind还自主研发了基于对比学习和分而治之思想的蛋白区块化技术,根据蛋白结构功能区实行分别关注,对保守区域进行局部信息提取,在结构数据下实现了隐式数据增强的效果; 研究小组还提出了*边缘对比性亲和力损失函数(max-margin contrastive affinity loss)以驱动模型充分利用亲和力信息和全局三维结构信息。对于局部信息和全局信息的权衡极大程度上提高了TBind的精度和泛化性能,使其能够对新颖的蛋白口袋和新型的结合模式做出快速且有效的预测。
TBind模型示意简图。模型的输入为一个蛋白质三维结构和分子三维结构,输出是两者之间的结合模式和结合强度。
在行业标准测试集PDBBind上,TBind的性能大幅超过了现存*的深度学习方法(由MIT Tommi Jaakkola组领衔开发的EQUIBIND,ICML 2022[1])以及多款国际商业、学术对接软件(包括GLIDE, VINA, SMINA, GINA等)。TBind使用2020年以前发表的17787个小分子复合物三维结构进行训练。在对2020年之后发布的142个训练集未见过的新蛋白质形成的复合三维结构预测任务中,TBind将LigandRMSD小于5Å的比例从约30%提升至56% [2];对于结合中心的预测与真实中心距离小于5Å的比例更是从48%提升至76%。
在PDBBind新蛋白测试集中,预测结构与真实共晶结构的RMSD小于5Å的比例。TBind显著优于其他模型。
在PDBBind新蛋白测试集中,预测配体质心与真实质心距离小于5Å的比例。TBind显著优于其他模型。
由于模型摒弃了繁琐的传统采样方法,利用数据驱动的AI势能面进行结构生成,所以在预测和筛选的效率上也得到了大幅度提升,全局对接的任务中每个分子仅需要0.5秒钟,是学术软件VINA的400分之一,商业软件GLIDE的2000分之一。
完成一次对接打分的时间。TBIND仅需要0.5秒钟完成预测,显著快于传统对接方法。
目前研究团队在GitHub发布了免费开源测试版本TBind v0.5.0,并提供了案例展示,扫描二维码跳转GitHub。
TBind商业版本v1.0.1已经部署于星药科技打造新一代智能计算平台M1,可在短时间内完成亿级超高通量药物虚拟筛选,赋能苗头化合物发现、先导化合物优化等药物研发多个关键环节。商业合作伙伴请联系m1@galixir.com获取更多使用信息。
TBind方法不仅可以应用在小分子和蛋白结合领域,也可以泛化到蛋白复合物结合、核酸蛋白结合等分子间相互作用问题上。星药科技将继续保持创新精神,将AI技术与药物实践场景深度结合,不断提升预测精度与速度,支持更多的应用场景。
TBind v1.0.1的发布,标志着星药科技已具备国际*的小分子蛋白结合预测能力。作为小分子药物设计的关键环节,TBind已与星药科技的蛋白结构建模算法, 分子设计算法,性质预测算法,逆合成分析算法及智能计算平台M1有机结合,配合生物实验平台,形成“AI-计算-实验迭代”三位一体的药物研发新范式。星药科技将继续聚焦能为医药产业带来更多增益的差异化管线,尤其是未成药、难成药靶点开发项目,高效精准预测分子相互作用,拓展传统化学的想象空间,探索更多新颖的药物分子。让世界远离病痛,让新药触手可及。
关于星药科技
星药科技(Galixir)成立于2019年,是一家使用尖端人工智能技术赋能药物研发的公司。星药通过使用人工智能的前沿算法,结合计算化学、药物化学和生物学的工具及经验,全方位攻克小分子药物早期研发流程中的疑难问题,快速发现活性高、成药性好且结构新颖的候选分子。星药正在和国内外药企以及研究机构合作推进多个药物研发管线,覆盖中枢神经系统疾病、自体免疫类疾病、肿瘤、呼吸系统疾病等不同疾病领域。星药将单个临床前药物研发管线的成本和时间大幅降低和缩短,使得同时储备多条药物研发管线、优化整体战略布局都成为可能。