核磁-结构自动化验证:从手动比对到智能化时代
在化学、材料、药物研发等领域,核磁共振(NMR)谱图被誉为“分子身份证”。但长期以来,将 NMR 实验数据与化合物结构进行比对验证仍是一项依赖人工经验、耗时耗力的工作。随着化学信息学和人工智能技术的快速发展,核磁-结构自动化验证正逐渐成为科研流程中的关键“加速器”。
传统挑战:人工比对效率低、误差高
科研人员在合成或分离出一个目标化合物后,通常会采用 NMR 对其进行结构确认。这一过程通常包括以下几个步骤:
1. 基于结构推导各个信号的位置与类型
2. 手动比对实验谱图与理论预测值
3. 判断结构是否正确、是否存在杂质、是否为目标化合物
然而,这一过程存在诸多问题:
1. 信号重叠多、化学位移偏移明显
2. 操作依赖经验,主观性强
3. 对复杂分子或新手而言,容易出错
4. 对于高通量合成或筛选项目,效率极低
自动化验证:理念与路径
“核磁-结构自动化验证”是指通过算法自动将实验 NMR 谱图与给定结构进行匹配、比对与评价,从而判断二者是否吻合。以最常用的氢谱(HNMR)为例,介绍自动化验证的基本流程。

该流程大致分为三个核心步骤:
01 NMR 谱图解析
受限于核磁共振波谱仪的测试条件和仪器和样品本身的影响,初始的核磁数据会有相位失真和基线漂移的现象,传统方法使用手动方式调整方式进行相位和基线校正,这无疑拖慢了数据分析自动化的流程。因此我们使用自动化解析程序可以自动的对原始核磁谱图数据进行自动化的处理,实现完全自动化的谱图数据预处理。
除了预处理步骤,我们也对核磁谱峰的自动化检测和积分,以及溶剂峰,水峰的自动化标注。在这一自动化处理的基础上,用户可以借助这一工具,进行自动化的核磁数据解析,生成简单的核磁实验报告。
02 根据化合物结构预测 NMR 位移
在用户已知样品的信息的情况下,希望验证样品和假定的结构是否一致,通常情况是将样品谱图和假定结构的标准谱图进行匹配,但有些情况下用户手中并没有标准谱图,或者分子结构非常新颖,尚未有标准谱图收录。此时用户可以借助我们的 AI 算法对假定结构进行核磁谱图预测。通过比对预测谱图和真实谱图的区别,用户可以判断假定结构和实验样品是否一致。
NMR 位移一般有三类预测的方法,基于第一性原理的算法、基于分子子结构的预测算法以及更复杂的机器学习算法,如使用 DFT 等量化方法进行预测。DFT 计算只基于稳态结构,受几何构型的影响,同一个 C 原子上的 H 的屏蔽常数不一致,需要用其他的方式进行校正。对于基于子结构的算法相对简单,对于一些较小的分子有不错的预测准确率,但其考虑的结构范围仅限于自定义好的子结构的局部环境,难以捕捉长相互作用。基于图神经网络的算法由于其固有的对称性和分子中的化学等价关联,保证了同一个 C 原子上的 H 具有相同的化学位移,同时单个原子的特征是通过多层卷积计算得来,每一个原子都可以感受到分子中其他所有原子带来的影响。目前智化科技开发了基于图神经网络框架的核磁位移预测模型,对于有机小分子可以准确预测氢原子的化学位移并显示整个预测谱图。
03 原始谱图与预测谱图对比
尽管目前预测的谱图在化学位移层面已经有很高的准确度,原始谱图与预测谱图仍然会在许多地方有细微差别。在位移层面,对于一些官能团(如酚羟基可能会受到氢键的影响)的化学位移较难预测,不仅仅和附近的原子结构相关,还和整个分子的结构有关系;一些溶剂可能也会对化学位移产生影响,而核磁位移预测的模型往往为了简化忽略溶剂的因素。另外实际 NMR 会因为有杂质的干扰,使得峰形受到影响。通过峰对齐算法,将预测峰与实际峰进行一一对应,然后在进行谱图对比时,需要允许一定的噪音或位移预测不准的情况,比如在对比峰的化学位移时,允许有一定的误差。但是,氢原子的个数,即各个峰的积分面积比例需要一致,否则可能意味着结构很可能不正确。
NMR 预测在合成中应用
除了可以将预测谱图和样本谱图进行比对之外,用户可以在进行样品测试之前先对谱图的结构进行预测,跟踪化学反应过程中的特征峰的变化,了解反应物、中间体,以及产物的核磁谱图的预期变换,方便研究者对合成过程中的中间产物进行追踪研究,也能加快研究人员对 NMR 谱图的解析,直接通过特征峰的变化判断反应是否顺利。另外,结合杂质预测功能则可以提前预估。
真实案例
SMILES:Clc1nc(Cl)c2ncccc2n1

该分子一共有三个氢原子,分子连着三个位于不同化学环境中的碳原子,虽然是同样的位于芳香环中的 C 原子,但是却位于不同的化学环境,因此会有不同的化学位移。我们核磁图谱解析算法首先能识别该谱图中实际有六个主峰,其中 1 个是 TMS,有两个是溶剂峰(水和氘代氯仿),因此只有三个化学环境不同的氢原子,且个数比例是 1:1:1。再看我们预测的核磁位移,同样是三个主峰,基本和实际谱图位移一致。因此算法判断该谱图确实对应该分子。

真实谱图

预测谱图
核磁-结构自动化验证正从“辅助工具”变为“标准流程”。对科研人员来说,它能大大减轻结构分析的重复劳动;对产业应用而言,它显著提升了质量控制与项目迭代效率。当然目前核磁自动化验证仅限对于相对简单的小分子,当分子变得复杂以后,一来原子间的相互影响可能变多,导致位移预测可能不准,二来可能会出现峰位置重合的情况,导致积分可能不准,从而影响判断,此时研究者往往会通过多种谱图或者二维核磁等手段进行综合判断,而非仅靠 HNMR 进行鉴定,未来我们也需要融合多种检测技术,进一步强化结构自动验证的功能。