Page 94 - 《振动工程学报》2025年第11期
P. 94

2552                               振     动     工     程     学     报                     第 38 卷


                  表 3 案例一:由     Gemini 2.0 Flash  生成的诊断指标           表 4 案例二:由     Gemini 2.5 Pro 生成的诊断指标
              Tab. 3 Case 1: diagnostic indices generated by Gemini 2.0 Flash  Tab. 4 Case 2: diagnostic indices generated by Gemini 2.5 Pro

               决策链     准确率    F1分数    验证准确率       验证F1分数         决策链     准确率     F1分数    验证准确率      验证F1分数
                       0.901   0.899  0.739 ± 0.114  0.723 ± 0.149        0.901  0.899  0.739 ± 0.114  0.723 ± 0.149
                 Φ 1                                               Φ 1
                       0.810   0.809  0.698 ± 0.152  0.681 ± 0.176        0.810  0.809  0.698 ± 0.152  0.681 ± 0.176
                 Φ 2                                               Φ 2
                       0.872   0.857  0.991 ± 0.017  0.991 ± 0.018        0.872  0.857  0.991 ± 0.017  0.991 ± 0.018
                 Φ 3                                               Φ 3
                       0.951   0.950  0.945 ± 0.047  0.945 ± 0.047        0.951  0.950  0.945 ± 0.047  0.945 ± 0.047
                 Φ 4                                               Φ 4
                       0.732   0.721  0.731 ± 0.088  0.719 ± 0.103        0.360  0.356  0.362 ± 0.020  0.363 ± 0.020
                 Φ 5                                               Φ 5
                       0.493   0.491  0.422 ± 0.044  0.417 ± 0.058        0.383  0.393  0.371 ± 0.030  0.370 ± 0.027
                 Φ 6                                               Φ 6
                       0.433   0.423  0.397 ± 0.065  0.389 ± 0.069        0.286  0.285  0.317 ± 0.018  0.313 ± 0.020
                 Φ 7                                               Φ 7
                       0.370   0.371  0.403 ± 0.022  0.404 ± 0.018        0.436  0.436  0.444 ± 0.026  0.443 ± 0.022
                 Φ 8                                               Φ 8
                       0.358   0.358  0.348 ± 0.043  0.344 ± 0.038        0.977  0.977  0.997 ± 0.006  0.997 ± 0.006
                 Φ 9                                               Φ 9
                       0.389   0.394  0.418 ± 0.045  0.419 ± 0.050        0.950  0.948  0.965 ± 0.027  0.964 ± 0.028
                 Φ 10                                              Φ 10
                       0.475   0.466  0.390 ± 0.096  0.379 ± 0.096        0.358  0.358  0.348 ± 0.043  0.344 ± 0.038
                 Φ 11                                              Φ 11
                       0.355   0.356  0.364 ± 0.029  0.363 ± 0.024        0.389  0.394  0.418 ± 0.045  0.419 ± 0.050
                 Φ 12                                              Φ 12
                       0.753   0.744  0.741 ± 0.092  0.729 ± 0.108        0.732  0.721  0.731 ± 0.088  0.719 ± 0.103
                 Φ 13                                              Φ 13
                       0.485   0.482  0.428 ± 0.044  0.423 ± 0.062        0.493  0.491  0.422 ± 0.044  0.417 ± 0.058
                 Φ 14                                              Φ 14
                       0.525   0.525  0.554 ± 0.051  0.536 ± 0.059        0.511  0.508  0.488 ± 0.034  0.483 ± 0.030
                 Φ 15                                              Φ 15
                       0.289   0.288  0.260 ± 0.021  0.259 ± 0.021        0.512  0.514  0.519 ± 0.028  0.519 ± 0.026
                 Φ 16                                              Φ 16
                       0.286   0.285  0.317 ± 0.018  0.313 ± 0.020        0.519  0.513  0.470 ± 0.046  0.466 ± 0.042
                 Φ 17                                              Φ 17
                       0.436   0.436  0.444 ± 0.026  0.443 ± 0.022        0.505  0.506  0.540 ± 0.017  0.539 ± 0.015
                 Φ 18                                              Φ 18
                       0.912   0.912  0.846 ± 0.103  0.836 ± 0.121        0.475  0.466  0.390 ± 0.096  0.379 ± 0.096
                 Φ 19                                              Φ 19
                       0.681   0.689  0.788 ± 0.051  0.785 ± 0.058        0.355  0.356  0.364 ± 0.029  0.363 ± 0.024
                 Φ 20                                              Φ 20
                       0.488   0.465  0.464 ± 0.051  0.447 ± 0.052        0.974  0.974  0.950 ± 0.022  0.949 ± 0.023
                 Φ 21                                              Φ 21
                       0.604   0.606  0.581 ± 0.022  0.579 ± 0.017        0.799  0.733  0.996 ± 0.006  0.996 ± 0.006
                 Φ 22                                              Φ 22
                       0.419   0.414  0.406 ± 0.031  0.400 ± 0.029
                 Φ 23                                             集成      0.978  0.978      —           —
                       0.383   0.388  0.407 ± 0.046  0.408 ± 0.049
                 Φ 24
                       0.335   0.335  0.335 ± 0.021  0.333 ± 0.022
                                                                    表 5 案例三:由     Gemini 2.5 Pro  生成的诊断指标
                 Φ 25
                       0.344   0.345  0.344 ± 0.047  0.337 ± 0.045
                 Φ 26
                                                                 Tab. 5 Case 3: diagnostic indices generated by Gemini 2.5 Pro
                       0.518   0.507  0.439 ± 0.070  0.432 ± 0.059
                 Φ 27
                       0.415   0.409  0.396 ± 0.076  0.384 ± 0.069  决策链  准确率     F1分数    验证准确率      验证F1分数
                 Φ 28
                       0.767   0.761  0.702 ± 0.079  0.691 ± 0.095
                 Φ 29                                              Φ 1    0.707  0.709  0.759 ± 0.051  0.755 ± 0.055
                       0.505   0.505  0.416 ± 0.045  0.412 ± 0.060
                 Φ 30                                                     0.340  0.338  0.321 ± 0.007  0.320 ± 0.007
                                                                   Φ 2
                       0.412   0.412  0.411 ± 0.023  0.409 ± 0.011
                 Φ 31
                                                                   Φ 3    0.991  0.991  0.988 ± 0.009  0.988 ± 0.009
                       0.350   0.337  0.386 ± 0.044  0.373 ± 0.054
                 Φ 32
                                                                   Φ 4    0.342  0.339  0.309 ± 0.007  0.305 ± 0.008
                       0.488   0.465  0.464 ± 0.051  0.447 ± 0.052
                 Φ 33
                                                                   Φ 5    0.392  0.392  0.407 ± 0.008  0.407 ± 0.008
                       0.604   0.606  0.581 ± 0.022  0.579 ± 0.017
                 Φ 34
                       0.719   0.710  0.693 ± 0.085  0.680 ± 0.097  Φ 6   0.340  0.339  0.336 ± 0.007  0.336 ± 0.007
                 Φ 35
                       0.488   0.485  0.410 ± 0.059  0.404 ± 0.077        0.966  0.967  0.978 ± 0.013  0.978 ± 0.013
                 Φ 36                                              Φ 7
                       0.701   0.695  0.730 ± 0.105  0.718 ± 0.125
                 Φ 37                                              Φ 8    0.341  0.340  0.317 ± 0.005  0.316 ± 0.006
                       0.366   0.366  0.433 ± 0.017  0.430 ± 0.024
                 Φ 38                                                     0.994  0.994  0.997 ± 0.002  0.997 ± 0.002
                                                                   Φ 9
                集成     0.872   0.857      —           —
                                                                   Φ 10   0.372  0.372  0.372 ± 0.025  0.370 ± 0.024
                                                                   Φ 11   0.392  0.392  0.407 ± 0.008  0.407 ± 0.008
              行或逻辑错误的算子调用指令。
                                                                          0.333  0.168  0.331 ± 0.004  0.167 ± 0.002
                                                                   Φ 12
                  LLM  在进行“工具使用”的符号推理时,完全依
                                                                   Φ 13   0.360  0.360  0.370 ± 0.004  0.369 ± 0.004
              赖于其对工具功能的精确理解。若信息不完整,就
                                                                   Φ 14   0.655  0.657  0.679 ± 0.009  0.678 ± 0.011
              会导致:
                                                                   Φ 15   0.587  0.591  0.529 ± 0.060  0.536 ± 0.056
                  (1)参数“幻觉”                                        Φ 16   0.330  0.330  0.327 ± 0.011  0.327 ± 0.011
                  生成不存在的参数,例如为            Φ ff 算子臆造一个汉             Φ 17   0.331  0.331  0.334 ± 0.004  0.333 ± 0.004
                                             t
              明窗的参数调用。                                             Φ 18   0.332  0.332  0.335 ± 0.004  0.335 ± 0.004
                  (2)逻辑混淆                                          Φ 19   0.341  0.341  0.334 ± 0.004  0.334 ± 0.004
                  例如将需要时域信号作为输入的算子错误地应                             Φ 20   0.353  0.352  0.336 ± 0.021  0.335 ± 0.022
              用于一个已经是频域的信号上。神经符号规约的重                               Φ 21   0.357  0.357  0.376 ± 0.004  0.375 ± 0.004
                                                                  集成      0.993  0.993      —           —
              要性在于,它为        LLM  构建了一份精确且无歧义的
   89   90   91   92   93   94   95   96   97   98   99