Page 193 - 《软件学报》2025年第9期
P. 193

4104                                                       软件学报  2025  年第  36  卷第  9  期


                    环境配置: 本节中的实验在         NVIDIA GeForce RTX 3090  上进行测试, 显存为     24 GB. 显式解析函数的采用
                 Fortran  进行编写, 实现过程中调用了       MKL 2022.0.2  数学函数库, 编译器为      Gcc 7.5.0; 神经网络的搭建采用
                 PyTorch 1.3, 数据的归一化预处理调用了       scikit-learn 1.2.0.
                    模型参数: 我们评估了       2B3B-Cosine、2B3B-Gaussian、MTP、SNAP  作为解析函数, 产生描述符        (descriptor),
                 再输入到拟合网络中进行训练的神经网络力场模型. 这些方法生成的中心原子的特征数量记录在表                                  4  中. 拟合网
                 络采用全连接神经网络, 为了保证网络的一致性, 每一层的神经元数量分别为                        [60, 30, 1], 激活函数为  tanh. 在测试
                 中, 一阶优化器采用      Adam, 学习率的衰减及总体损失的设定参考第             2  节中观察  1  中配置④的参数. 层重组的卡尔
                 曼滤波优化器的关于分块阈值的选取参考第               2.2  节中分块大小的建模.

                                                 表 4 不同解析函数的特征数

                              原子种类          2B3B-Cosine    2B3B-Gaussian    MTP         SNAP
                             单原子体系             42              26            53          60
                             两原子体系             111             72            253         60

                    评价指标: 均方根误差       (root mean square error, RMSE) 广泛应用在回归模型的性能评估中. 本文采用       RMSE  作
                 为预测准确性的评价指标, RMSE         的数值越小, 表示模型的预测值与真实值之间的差距越小, 即模型的拟合能力更
                 好, 反之表示拟合得不好. 在力场训练的网络中, 我们既关心每个样本的总能量的拟合效果, 同时还关心单原子受
                 力的拟合效果. 因此在我们的测评里, 即需要考虑体系总能量的均方根误差                         RMSE E , 同时也需评估原子受力的
                 均方根误差    RMSE F , 其计算见公式   (24) 和  (25). 其中样本的集合记为  ,               E x i   表示样本  x i  能量的真
                                                                       X |X| 表示样本数,
                 实值  (标签, label), (  F ,F ,F )  分别表示样本  x i  原子受力  3  个分量上的真实值.    则表示样本    x i  能量的预测值
                                       e 3
                                     e 2
                                  e 1
                                  x i  x i  x i                                 b E x i
                 (prediction), (  b F , b F , b F )  分别表示样本  x i  原子受力  3  个分量上的模型预测值.
                                  e 3
                               e 2
                            e 1
                            x i  x i  x i

                                                         √
                                                           1  ∑        2
                                                 RMSE E =       ( b E x i  − E x i )                 (24)
                                                           |X|
                                                             x i ϵX

                                              √
                                                 1  ∑ [ (    ) 2 (     ) 2 (     ) 2  ]
                                      RMSE F =         b F x i e 1  − F x i e 1  + b F x i e 2  − F x i e 2  + b F x i e 3  − F x i e 3  (25)
                                                3|X|
                                                   x i ϵX

                 3.1   收敛精度
                    表  5  中展示了在  11  个有代表性的数据集上分别测试          4  种不同模型上    (2B3B-Cosine、2B3B-Gaussian、MTP、
                 SNAP)、两种优化器      (Adam  优化器、层重组卡尔曼滤波优化器) 下的收敛精度和均方根误差. 其中第                     3、4  列表
                 示训练集的能量和原子受力的均方根误差, 第               5、6  列表示测试集的能量和原子受力的均方根误差, “/”前后的数
                 据分别表示训练采用的        Adam  优化器和层重组卡尔曼滤波优化器.
                    从表   5  可以得出以下结论: (1) 单元素体系        (除了  S 8 ) 相比于多元素体系, 能量和原子受力均能收敛到              0.1
                 以下的精度; (2) 相同的特征和相同的拟合网络, Adam             优化器和层重组卡尔曼滤波优化器在单原子类型的测试
                 数据下关于能量和受力的收敛精度更为接近, 多元素的体系中收敛的误差差异较大, 以                                H 2 O  为例, Adam  和
                 RLEKF  在能量和力上的      RMSE  的相差超过    1; (3) 4  种生成特征的方法由于解析函数的构造不同, 导致在相同
                 的拟合网络下的收敛结果有些许差异, 说明不同特征生成的方法各自适用的体系不同. 例如碳体系, 2B3B-Cosine
                 相比于   MTP  和  SNAP  更能建模准能量和受力. 对于锂和镁体系, MTP           相比于其他     3  种方法表现出更高的收敛
                 精度.
                    上面的结论是基于表        5  中的精度数据得到的, 在此基础上, 我们可以进一步推广得到更为一般的结论. 例如根
                 据结论   (1) 和  (2), 可以看出多元素的训练更具挑战性; 根据结论           (2), 相同输入特征和拟合网络表明网络具有相同
                 的表达能力, 优化器负责训练过程中权重的不断更新, 优化器算法的不同会导致最终收敛到不同的局部最优点, 优
                 化器的选取在多元素数据集上的影响比单元素数据集更大; 根据结论                       (3), 为了能精准建模一个体系, 中心原子的
                 描述符的生成     (也即基组的种类) 至关重要, 不同体系适用的描述符各不相同.
   188   189   190   191   192   193   194   195   196   197   198