Page 282 - 《软件学报》2025年第5期
P. 282
2182 软件学报 2025 年第 36 卷第 5 期
结合表 5 和表 6, 本文可以得到下列结论: (1) 在两个数据集上, MGCC、粗粒度单元格语义对比及细粒度单元
格语义构成元素对比都是有效的; (2) MGCC 优于粗粒度单元格语义对比和细粒度单元格语义构成元素对比; (3)
在大多数情况下, 粗粒度单元格语义对比优于细粒度单元格语义构成元素对比; (4) 随着表格类型差异, 细粒度单
元格语义构成元素对比效果存在变化. 更进一步, 粗粒度单元格语义对比和细粒度单元格语义构成元素对比可以
看成在对比学习框架中使用不同类型的正负样本, 而这些不同类型正负样本提升 FinQANet 性能是有差异的, 因
此在对比学习框架, 选择合适的正负样本是重要的.
本文旨在通过消融实验验证粗粒度单元格语义对比和细粒度单元格语义构成元素对比的有效性. 其他组合类
型的消融实验都是基于已验证的对比学习方法, 因此其有效性在一定程度上得到保障, 同时考虑到计算资源的限
制, 本文将不进行额外的验证.
4.7 多粒度单元格语义对比有效性分析
4.7.1 多粒度单元格语义对比下的 FinQANet 生成器预测结果错误分析
为了进一步探究多粒度表格单元格语义对比 (MGCC) 方法的有效性, 本研究从问题的支撑事实类型出发, 具体
由操作符错误 (operator errors) 和操作数错误 (number errors) 两个方面进一步分析 MGCC 带来的提升. 在表 7 中,
“操作符错误”指预测的计算程序中操作符集合 (这里期望通过操作符集合是否一致近似判断操作符错误) 和标注计
算程序中的操作符集合不一致, 而“操作数错误”是预测的计算程序数值集合和标注的计算程序数值集合不一致.
表 7 中括号外数值表示在当前这种划分下的模型预测结果错误比例, 而括号内的数值是 FinQANet(RoBERTa-
large)+MGCC 相比 FinQANet(RoBERTa-large) 减少的错误比例. 根据表 7 的数据, 本文可以得到下列结论.
表 7 使用 MGCC 下 FinQANet(RoBERTa-large) 生成器在测试集预测结果错误占比 (%)
错误类型 Text Table Text and Table Error sum
Operator errors 2.87 (−0.01) 4.70 (−1.49) 12.11 (−2.48) 19.68 (−3.97)
Number errors 5.14 (−0.00) 10.20 (−1.74) 21.79 (−3.05) 37.13 (−4.79)
(1) MGCC 带来了更为显著的操作数错误比例下降. MGCC 带来的操作符错误比例下降了 3.97%, 而操作数错
误比例下降了 4.79%. 这主要因为 MGCC 优化了表格单元格语义和构成计算程序的支撑单元格数值表示. 同时,
通过优化单元格语义, 降低了操作符学习的难度, 从而降低了操作符错误的占比.
(2) MGCC 带来的操作数错误比例下降主要集中在包含表格支撑事实类型问题上. 在支撑事实包含文本和表
格时, MGCC 带来的操作数错误比例下降是 3.05%, 支撑事实是表格时, 其带来的错误占比下降是 1.74%, 但在支
撑事实为文本时, MGCC 没有带来明显的下降. 支撑事实是文本和表格时, MGCC 带来更大的错误占比下降, 其原
因可能为这部分错误占比大, 有较大的提升空间.
4.7.2 在 t-SNE 下多粒度单元格语义对比的锚点, 正例及负例可视化
为了探究多粒度单元格对比 (MGCC) 对于生成器区分支撑与干扰单元格句子的影响, 本研究通过 t-SNE 技术
对 FinQANet(RoBERTa-large) 在有无 MGCC 情形下的锚点、正负例表示进行了空间可视化. 分析包括了 MGCC
中的 4 种对比类型 (粗粒度单元格语义 (a2)、行名 (b2)、列名 (c2)、数值名 (d2) 对比) 下的表示聚类情况. 其中,
蓝色点代表锚点表示, 绿色点代表正例表示, 红色点代表负例表示, (a1), (b1), (c1), (d1) 表示无 MGCC 下相同子词
表示. 结果显示, 使用 MGCC 时, 锚点、正例和负例表示在空间上表现出更明显的聚类, 验证了 MGCC 能有效提
升模型区分能力.
(1) 使用 MGCC 可以很好区分开支撑单元格句子和干扰单元格句子表示. 在没有使用 MGCC 下, 从图 6(a1),
(b1), (d1), 粗粒度单元格语义对比, 行对比, 列对比正负例表示混合在一起, 模型难以区分它们. 在使用 MGCC 后,
从图 6(a2), (b2), (d2) 观察, 模型可以很好地区分 MGCC 的粗粒度单元格语义对比、细粒度单元格行对比、细粒
度单元格列对比的正负例表示. 即模型可以很好地区分支撑单元格句子语义和干扰单元格句子语义.
(2) 使用 MGCC 后, 问题表示和正例表示距离更近. 对比图 6(a1), (b1), (c1), 本文可以发现未使用 MGCC 下,
问题表示和正负例表示之间的距离远近是不定的. 在使用 MGCC 下, 问题表示和正例表示有更近的距离. 图 6(d1)