Page 293 - 《软件学报》2025年第10期
P. 293
4690 软件学报 2025 年第 36 卷第 10 期
(2) 外部效度. 我们的研究数据集选自上海、香港、东京、纽约等不同制度体系下证券交易所的真实业务规
则文档, 覆盖多种业务场景, 具有较好的代表性和普适性. 尽管如此, 鉴于证券领域业务规则的多样性和风格差异,
所选数据集不一定能够完全代表现实世界中的所有业务规则场景. 未来研究将探索本方法在更广泛数据集上的应
用效果, 以进一步验证其广泛适用性. 另外, 虽然我们的方法主要针对证券领域, 但整体框架展现出较强的通用性.
结合大语言模型自身的能力和对领域知识策略性的整合和运用, 我们的方法在各种专业知识密集型领域表现出可
迁移性. 关键调整包括: 1) 对大语言模型进行微调或上下文学习, 以适应对应的领域; 2) 构建相应领域特定的知识
库. 由于不同领域之间存在显著差异, 上述工作是不可避免的. 尽管这些工作耗时费力, 但训练好的大语言模型和
领域知识库具有可重用性, 即能够为同一领域提供持续支持, 可以跨应用和跨项目地被重复利用, 从而显著减轻所
需的人力工作负担. 这种积累和共享的知识资源不仅可提高工作效率, 也将推动整个领域内技术的进步.
(3) 构建效度. 对于需求规约生成质量的评估, 目前许多研究依然采用定性分析方法, 依靠与用户和其他利益
相关者的交互, 通过访谈和反馈来验证需求文档是否准确反映了业务需求和用户期望 [32] . 由于评估需求规约的质
量涉及对需求内容的解释及其与用户期望之间的匹配度, 在不同领域中可能存在显著差异. 在本文中, 功能点的准
确识别是衡量需求规约质量的基础, 因此, 本文通过功能点识别率 (FPI) 进行评估. 较高的 FPI 表明 LLSec 能够全
面捕捉业务规则中的关键信息, 生成的需求规约更为全面. 功能点识别率是生成质量的一个重要指标, 但也可能存
在其他评估指标, 如规约的可读性、可维护性和可测试性.
(4) 可靠性. 由于大语言模型的输出具有随机性, 可能在不同的运行时表现出不同的行为, 特别是在解析非结
构化和复杂自然语言数据时. 此外, 模型的更新和优化可能会导致结果的变动, 从而影响实验的可靠性. 然而, 经
过 3 次以上的重复实验验证, 我们发现使用上下文学习和微调策略两种策略生成的需求规约总是保持较高的、相
近的准确率. 这显示了即便在面临模型内在不确定性的情况下, 我们的处理流程依然稳定有效. 此外, 我们已经将
我们的代码、模型和数据开源 (https://github.com/LingleLi/LLSec), 以支持研究结果的验证和复现.
6 相关工作
本文探索了证券领域的业务规则规约方法, 研究了如何将领域知识嵌入到规约过程中. 相关的工作主要包括
领域知识赋能的需求规约以及业务规则规约.
6.1 领域知识赋能的需求规约
需求工程领域早期的工作主要采用基于规则的方法从政策文档或法规文本中提取软件需求. Young 等人 [33] 提
出了一种以关键要素和模板为核心的方法, 用于从政策文档中提取软件需求. 该方法首先对政策文档中的承诺、特
权和权利等要素进行分析, 以识别特定的政策陈述, 然后按照范围、行为者等维度将这些陈述分为 12 个类别, 并使
用模板将分类后的政策陈述转换为软件需求. Breaux 等人 [34] 提出了一种从法规文本中提取数据访问需求的方法, 通
过定义 6 种数据访问约束, 提取文本中的主体、动作、对象等内容, 并创建相应的规则表来记录各规则的约束. 这些
提取方法虽然在一定程度上取得了成效, 但它们面临着两大主要问题. 首先, 它们完全依赖于预定义的规则或模式,
这限制了它们的通用性. 其次, 这些方法仅仅通过提取的内容明确提取的知识, 没有更多的领域知识的嵌入.
也有些研究者们以本体显式的表示领域知识, 用于软件需求的规约. 例如 Chen 等人 [6,7] 提出了一种结合本体
和问题框架的需求建模方法, 将本体知识嵌入到问题框架的规范中, 从而引导需求分析员逐步抽取和描述软件开
发问题. Bencharqui 等人 [8] 同样设计了一种基于本体的需求规约方法, 通过本体构建领域知识模型, 并将其嵌入到
规约过程中从而提高规约的一致性和准确性. Abdalazeim 等人 [9] 回顾了从各种设计模型生成自然语言需求规约的
方法, 包括将 UML 模型、XML 和 OntoUML 转换为自然语言规范的工作以及利用 OWL 和 RDF 本体生成自然语
言文本的工作, 其中涵盖了将本体、领域知识等嵌入规约过程的应用, 能够生产更精确的需求模型和更高质量的
需求规约. 然而, 这些工作需要持续地更新和维护本体和规则库.
自 ChatGPT 等大语言模型问世以来, 使用大语言模型进行需求规约成为一个新的研究热点. Jain 等人 [35] 提出
了一种基于自然语言生成模型 T5 的方法, 用于从软件工程合同中自动识别安全性和隐私性要求. 他们将来自多个

