Page 94 - 《振动工程学报》2025年第11期
P. 94
2552 振 动 工 程 学 报 第 38 卷
表 3 案例一:由 Gemini 2.0 Flash 生成的诊断指标 表 4 案例二:由 Gemini 2.5 Pro 生成的诊断指标
Tab. 3 Case 1: diagnostic indices generated by Gemini 2.0 Flash Tab. 4 Case 2: diagnostic indices generated by Gemini 2.5 Pro
决策链 准确率 F1分数 验证准确率 验证F1分数 决策链 准确率 F1分数 验证准确率 验证F1分数
0.901 0.899 0.739 ± 0.114 0.723 ± 0.149 0.901 0.899 0.739 ± 0.114 0.723 ± 0.149
Φ 1 Φ 1
0.810 0.809 0.698 ± 0.152 0.681 ± 0.176 0.810 0.809 0.698 ± 0.152 0.681 ± 0.176
Φ 2 Φ 2
0.872 0.857 0.991 ± 0.017 0.991 ± 0.018 0.872 0.857 0.991 ± 0.017 0.991 ± 0.018
Φ 3 Φ 3
0.951 0.950 0.945 ± 0.047 0.945 ± 0.047 0.951 0.950 0.945 ± 0.047 0.945 ± 0.047
Φ 4 Φ 4
0.732 0.721 0.731 ± 0.088 0.719 ± 0.103 0.360 0.356 0.362 ± 0.020 0.363 ± 0.020
Φ 5 Φ 5
0.493 0.491 0.422 ± 0.044 0.417 ± 0.058 0.383 0.393 0.371 ± 0.030 0.370 ± 0.027
Φ 6 Φ 6
0.433 0.423 0.397 ± 0.065 0.389 ± 0.069 0.286 0.285 0.317 ± 0.018 0.313 ± 0.020
Φ 7 Φ 7
0.370 0.371 0.403 ± 0.022 0.404 ± 0.018 0.436 0.436 0.444 ± 0.026 0.443 ± 0.022
Φ 8 Φ 8
0.358 0.358 0.348 ± 0.043 0.344 ± 0.038 0.977 0.977 0.997 ± 0.006 0.997 ± 0.006
Φ 9 Φ 9
0.389 0.394 0.418 ± 0.045 0.419 ± 0.050 0.950 0.948 0.965 ± 0.027 0.964 ± 0.028
Φ 10 Φ 10
0.475 0.466 0.390 ± 0.096 0.379 ± 0.096 0.358 0.358 0.348 ± 0.043 0.344 ± 0.038
Φ 11 Φ 11
0.355 0.356 0.364 ± 0.029 0.363 ± 0.024 0.389 0.394 0.418 ± 0.045 0.419 ± 0.050
Φ 12 Φ 12
0.753 0.744 0.741 ± 0.092 0.729 ± 0.108 0.732 0.721 0.731 ± 0.088 0.719 ± 0.103
Φ 13 Φ 13
0.485 0.482 0.428 ± 0.044 0.423 ± 0.062 0.493 0.491 0.422 ± 0.044 0.417 ± 0.058
Φ 14 Φ 14
0.525 0.525 0.554 ± 0.051 0.536 ± 0.059 0.511 0.508 0.488 ± 0.034 0.483 ± 0.030
Φ 15 Φ 15
0.289 0.288 0.260 ± 0.021 0.259 ± 0.021 0.512 0.514 0.519 ± 0.028 0.519 ± 0.026
Φ 16 Φ 16
0.286 0.285 0.317 ± 0.018 0.313 ± 0.020 0.519 0.513 0.470 ± 0.046 0.466 ± 0.042
Φ 17 Φ 17
0.436 0.436 0.444 ± 0.026 0.443 ± 0.022 0.505 0.506 0.540 ± 0.017 0.539 ± 0.015
Φ 18 Φ 18
0.912 0.912 0.846 ± 0.103 0.836 ± 0.121 0.475 0.466 0.390 ± 0.096 0.379 ± 0.096
Φ 19 Φ 19
0.681 0.689 0.788 ± 0.051 0.785 ± 0.058 0.355 0.356 0.364 ± 0.029 0.363 ± 0.024
Φ 20 Φ 20
0.488 0.465 0.464 ± 0.051 0.447 ± 0.052 0.974 0.974 0.950 ± 0.022 0.949 ± 0.023
Φ 21 Φ 21
0.604 0.606 0.581 ± 0.022 0.579 ± 0.017 0.799 0.733 0.996 ± 0.006 0.996 ± 0.006
Φ 22 Φ 22
0.419 0.414 0.406 ± 0.031 0.400 ± 0.029
Φ 23 集成 0.978 0.978 — —
0.383 0.388 0.407 ± 0.046 0.408 ± 0.049
Φ 24
0.335 0.335 0.335 ± 0.021 0.333 ± 0.022
表 5 案例三:由 Gemini 2.5 Pro 生成的诊断指标
Φ 25
0.344 0.345 0.344 ± 0.047 0.337 ± 0.045
Φ 26
Tab. 5 Case 3: diagnostic indices generated by Gemini 2.5 Pro
0.518 0.507 0.439 ± 0.070 0.432 ± 0.059
Φ 27
0.415 0.409 0.396 ± 0.076 0.384 ± 0.069 决策链 准确率 F1分数 验证准确率 验证F1分数
Φ 28
0.767 0.761 0.702 ± 0.079 0.691 ± 0.095
Φ 29 Φ 1 0.707 0.709 0.759 ± 0.051 0.755 ± 0.055
0.505 0.505 0.416 ± 0.045 0.412 ± 0.060
Φ 30 0.340 0.338 0.321 ± 0.007 0.320 ± 0.007
Φ 2
0.412 0.412 0.411 ± 0.023 0.409 ± 0.011
Φ 31
Φ 3 0.991 0.991 0.988 ± 0.009 0.988 ± 0.009
0.350 0.337 0.386 ± 0.044 0.373 ± 0.054
Φ 32
Φ 4 0.342 0.339 0.309 ± 0.007 0.305 ± 0.008
0.488 0.465 0.464 ± 0.051 0.447 ± 0.052
Φ 33
Φ 5 0.392 0.392 0.407 ± 0.008 0.407 ± 0.008
0.604 0.606 0.581 ± 0.022 0.579 ± 0.017
Φ 34
0.719 0.710 0.693 ± 0.085 0.680 ± 0.097 Φ 6 0.340 0.339 0.336 ± 0.007 0.336 ± 0.007
Φ 35
0.488 0.485 0.410 ± 0.059 0.404 ± 0.077 0.966 0.967 0.978 ± 0.013 0.978 ± 0.013
Φ 36 Φ 7
0.701 0.695 0.730 ± 0.105 0.718 ± 0.125
Φ 37 Φ 8 0.341 0.340 0.317 ± 0.005 0.316 ± 0.006
0.366 0.366 0.433 ± 0.017 0.430 ± 0.024
Φ 38 0.994 0.994 0.997 ± 0.002 0.997 ± 0.002
Φ 9
集成 0.872 0.857 — —
Φ 10 0.372 0.372 0.372 ± 0.025 0.370 ± 0.024
Φ 11 0.392 0.392 0.407 ± 0.008 0.407 ± 0.008
行或逻辑错误的算子调用指令。
0.333 0.168 0.331 ± 0.004 0.167 ± 0.002
Φ 12
LLM 在进行“工具使用”的符号推理时,完全依
Φ 13 0.360 0.360 0.370 ± 0.004 0.369 ± 0.004
赖于其对工具功能的精确理解。若信息不完整,就
Φ 14 0.655 0.657 0.679 ± 0.009 0.678 ± 0.011
会导致:
Φ 15 0.587 0.591 0.529 ± 0.060 0.536 ± 0.056
(1)参数“幻觉” Φ 16 0.330 0.330 0.327 ± 0.011 0.327 ± 0.011
生成不存在的参数,例如为 Φ ff 算子臆造一个汉 Φ 17 0.331 0.331 0.334 ± 0.004 0.333 ± 0.004
t
明窗的参数调用。 Φ 18 0.332 0.332 0.335 ± 0.004 0.335 ± 0.004
(2)逻辑混淆 Φ 19 0.341 0.341 0.334 ± 0.004 0.334 ± 0.004
例如将需要时域信号作为输入的算子错误地应 Φ 20 0.353 0.352 0.336 ± 0.021 0.335 ± 0.022
用于一个已经是频域的信号上。神经符号规约的重 Φ 21 0.357 0.357 0.376 ± 0.004 0.375 ± 0.004
集成 0.993 0.993 — —
要性在于,它为 LLM 构建了一份精确且无歧义的

