Page 193 - 《软件学报》2025年第9期

P. 193

4104 软件学报 2025 年第 36 卷第 9 期

环境配置: 本节中的实验在 NVIDIA GeForce RTX 3090 上进行测试, 显存为 24 GB. 显式解析函数的采用
Fortran 进行编写, 实现过程中调用了 MKL 2022.0.2 数学函数库, 编译器为 Gcc 7.5.0; 神经网络的搭建采用
PyTorch 1.3, 数据的归一化预处理调用了 scikit-learn 1.2.0.
模型参数: 我们评估了 2B3B-Cosine、2B3B-Gaussian、MTP、SNAP 作为解析函数, 产生描述符 (descriptor),
再输入到拟合网络中进行训练的神经网络力场模型. 这些方法生成的中心原子的特征数量记录在表 4 中. 拟合网
络采用全连接神经网络, 为了保证网络的一致性, 每一层的神经元数量分别为 [60, 30, 1], 激活函数为 tanh. 在测试
中, 一阶优化器采用 Adam, 学习率的衰减及总体损失的设定参考第 2 节中观察 1 中配置④的参数. 层重组的卡尔
曼滤波优化器的关于分块阈值的选取参考第 2.2 节中分块大小的建模.

表 4 不同解析函数的特征数

原子种类 2B3B-Cosine 2B3B-Gaussian MTP SNAP
单原子体系 42 26 53 60
两原子体系 111 72 253 60

评价指标: 均方根误差 (root mean square error, RMSE) 广泛应用在回归模型的性能评估中. 本文采用 RMSE 作
为预测准确性的评价指标, RMSE 的数值越小, 表示模型的预测值与真实值之间的差距越小, 即模型的拟合能力更
好, 反之表示拟合得不好. 在力场训练的网络中, 我们既关心每个样本的总能量的拟合效果, 同时还关心单原子受
力的拟合效果. 因此在我们的测评里, 即需要考虑体系总能量的均方根误差 RMSE E , 同时也需评估原子受力的
均方根误差 RMSE F , 其计算见公式 (24) 和 (25). 其中样本的集合记为 , E x i 表示样本 x i 能量的真
X |X| 表示样本数,
实值 (标签, label), ( F ,F ,F ) 分别表示样本 x i 原子受力 3 个分量上的真实值. 则表示样本 x i 能量的预测值
e 3
e 2
e 1
x i x i x i b E x i
(prediction), ( b F , b F , b F ) 分别表示样本 x i 原子受力 3 个分量上的模型预测值.
e 3
e 2
e 1
x i x i x i

√
1 ∑ 2
RMSE E = ( b E x i − E x i ) (24)
|X|
x i ϵX

√
1 ∑ [ ( ) 2 ( ) 2 ( ) 2 ]
RMSE F = b F x i e 1 − F x i e 1 + b F x i e 2 − F x i e 2 + b F x i e 3 − F x i e 3 (25)
3|X|
x i ϵX

3.1 收敛精度
表 5 中展示了在 11 个有代表性的数据集上分别测试 4 种不同模型上 (2B3B-Cosine、2B3B-Gaussian、MTP、
SNAP)、两种优化器 (Adam 优化器、层重组卡尔曼滤波优化器) 下的收敛精度和均方根误差. 其中第 3、4 列表
示训练集的能量和原子受力的均方根误差, 第 5、6 列表示测试集的能量和原子受力的均方根误差, “/”前后的数
据分别表示训练采用的 Adam 优化器和层重组卡尔曼滤波优化器.
从表 5 可以得出以下结论: (1) 单元素体系 (除了 S 8 ) 相比于多元素体系, 能量和原子受力均能收敛到 0.1
以下的精度; (2) 相同的特征和相同的拟合网络, Adam 优化器和层重组卡尔曼滤波优化器在单原子类型的测试
数据下关于能量和受力的收敛精度更为接近, 多元素的体系中收敛的误差差异较大, 以 H 2 O 为例, Adam 和
RLEKF 在能量和力上的 RMSE 的相差超过 1; (3) 4 种生成特征的方法由于解析函数的构造不同, 导致在相同
的拟合网络下的收敛结果有些许差异, 说明不同特征生成的方法各自适用的体系不同. 例如碳体系, 2B3B-Cosine
相比于 MTP 和 SNAP 更能建模准能量和受力. 对于锂和镁体系, MTP 相比于其他 3 种方法表现出更高的收敛
精度.
上面的结论是基于表 5 中的精度数据得到的, 在此基础上, 我们可以进一步推广得到更为一般的结论. 例如根
据结论 (1) 和 (2), 可以看出多元素的训练更具挑战性; 根据结论 (2), 相同输入特征和拟合网络表明网络具有相同
的表达能力, 优化器负责训练过程中权重的不断更新, 优化器算法的不同会导致最终收敛到不同的局部最优点, 优
化器的选取在多元素数据集上的影响比单元素数据集更大; 根据结论 (3), 为了能精准建模一个体系, 中心原子的
描述符的生成 (也即基组的种类) 至关重要, 不同体系适用的描述符各不相同.

188 189 190 191 192 193 194 195 196 197 198