近日,南方科技大学生物医学工程系张博副教授团队在国际学术期刊 Nature Computational Science 发表题为“Chemistry-Informed Deep Learning Model for Predicting Stereoselectivity and Absolute Configuration in Asymmetric Hydrogenation”的研究论文。团队基于烯烃不对称氢化反应机理,将化学知识融入深度学习框架,开发出名为 Chemistry-Informed Asymmetric Hydrogenation Network(ChemAHNet)的预测模型。该模型首次实现了对具有双前手性中心的烯烃不对称氢化反应中,产物绝对构型与立体选择性的同步精准预测,标志着人工智能在复杂不对称催化反应领域迈出了重要一步。
烯烃不对称氢化是当代手性合成中最关键的方法之一,因其高效率、原子经济性以及在制药工业中的广泛应用而具有重要地位。自2001年荣获诺贝尔奖以来,烯烃不对称氢化已成为药物分子的对映选择性构建核心技术,大幅降低了实验成本并加快了药物研发速度。然而,该反应需要高压氢气并涉及复杂催化剂筛选,使得安全性与条件优化都极具挑战。因此,迫切需要高效方法来辅助药物合成中这一关键步骤的预测与设计。尽管近年来机器学习与人工智能方法已广泛应用于有机反应预测,但长期以来,这些技术在不对称催化领域的应用仍受到显著限制。现有模型多集中于结构相对简单、仅含单一前手性中心的底物体系,其预测能力难以覆盖更具挑战性的双前手性位点烯烃的不对称氢化反应。此外,传统模型往往只能预测对映选择性,难以同时给出主要产物的绝对构型,这使其在复杂手性分子的精准合成设计中难以满足实际需求。更为关键的是,当前大多数模型高度依赖专家预设的分子描述符或人工特征,模型本身难以从原始分子结构中自主学习深层次化学规律。这不仅限制了预测性能的上限,也严重影响了模型对新反应体系的泛化能力。
针对不对称催化预测的实际需求,团队开发了基于分子结构直接学习的新型立体化学预测模型。该模型无需依赖预设分子描述符,能够自动从原始分子几何与电子结构中提取关键反应特征,可准确预测包括双前手性中心烯烃在内的多类型底物–催化剂组合的不对称氢化反应结果。模型不仅可同时输出立体选择性与主要产物的绝对构型,还展现出卓越的泛化能力,适配广泛的催化体系与底物范围。
图1 基于相互作用模式的双手性中心 ∆∆G‡ 合理计算策略
根据不对称氢化反应的机理认知以及前期理论研究结果,项目团队发现烯烃底物中的碳碳双键及其周围取代基在氢化发生之前,会通过多种次级相互作用与金属中心发生配位或空间接触(图1a)。基于这一关键认识,团队提出应在模型中显式识别并学习烯烃分子与催化剂金属中心之间的正确相互作用模式,以全面反映反应真实机制。相较于依赖 CIP 规则确定构型的传统方法,交互模式不仅能够确保相同机理下预测结果的一致性,避免因相对优先级变化导致的构型歧义(图1b);同时,对于具有两个前手性中心的烯烃底物,相互作用模式也能有效克服传统 R/S 分类在(R,R)、(S,S)、(R,S)、(S,R)等组合中的复杂排序问题,使模型能够准确识别真正主导立体选择性的关键因素(图1c)。这一思路为精准预测烯烃不对称氢化立体选择性奠定了方法学基础。
图 2 ChemAHNe的模型示意图
基于上述机理启发,团队构建了一个包含三大创新模块的反应性能预测模型(图2):片段识别模块(MoIM)能够自动识别反应物中不同尺度的结构片段,并精准捕捉由不同试剂贡献的关键化学片段信息;反应组分整合模块(RCIM)将来自各反应组分的多尺度片段信息进行整合,从而生成更具化学意义的分子表征;分子相互作用模块(MIM)进一步学习反应物之间的协同作用模式,能准确识别烯烃底物与金属催化中心的真实互动方式,从而显著提升对立体选择性与绝对构型的预测性能。基于上述框架,团队提出了首个真正意义上实现“无化学描述符”“广泛底物适用性”“绝对构型预测”和“立体选择性预测”的模型ChemAHNet。
图 3 ChemAHNet模型实验结果
结果显示,ChemAHNet 在烯烃不对称氢化优势产物绝对构象预测任务中实现了88.9% 的 top-1 准确率,显著优于对比模型(3b)。这一结果表明,ChemAHNet能够通过精准识别底物与催化剂之间的相互作用模式,有效预测主要产物的绝对构型,从而显著提升模型对烯烃不对称氢化反应立体控制规律的理解。
此外,消融实验结果进一步验证了模型结构的必要性:当任意移除 MoIM、RCIM 或 MIM 中的一个模块时,模型的预测准确率均出现不同程度下降(图3c,d)。这充分说明三个模块的设计在提升模型整体性能方面具有关键作用,其协同效应对于实现高精度立体选择性预测不可或缺。
图4 预测手性磷酸催化的硫醇对N-酰亚胺的加成反应的对映体选择性
图 5 ChemAHNet模型的化学可解释性
为了验证 ChemAHNet 的可扩展性,研究人员进一步选用了“手性磷酸催化的硫醇对N-酰亚胺加成反应”数据集进行外部测试。结果表明,ChemAHNet 在该体系中同样表现出优异的对映体选择性预测能力(图 4),证明该方法不仅适用于烯烃不对称氢化反应,也能有效泛化至其他类型的不对称催化体系,展现了良好的跨反应可迁移性潜力。此外,ChemAHNet 还能提供原子层面的空间与电子相互作用解析(图 5),帮助揭示影响立体选择性的关键结构因素。这种可解释性不仅增强了模型预测的可信度,也为目标导向的分子设计与催化剂优化提供了更具理论依据和实践价值的工具。
论文共同第一作者为南方科技大学与澳门大学联培2022级博士生程立和广州医科大学教授邵攀霖,张博、澳门大学教授邢贵川和广州医科大学教授邵攀霖为论文通讯作者,南方科技大学为论文第一单位,合作单位为澳门大学和广州医科大学。以上研究得到了中国国家自然科学基金、深圳市医学研究基金、深圳市基础研究基金、广东省先进生物材料重点实验室以及深圳市智能医学工程重点实验室的支持。
链接:https://www.nature.com/articles/s43588-025-00920-8
供稿:生物医学工程系
通讯员:肖然
主图:丘妍
编辑:曾昱雯



