Page 277 - 《软件学报》2025年第10期

P. 277

4674 软件学报 2025 年第 36 卷第 10 期

一可能性, 我们对比了目前最先进的大语言模型之一——GPT-4 [14] 和领域专家生成证券业务规则规约的表现. 我
们使用案例 1 中的债券交易规则, 要求 GPT-4 和领域专家根据提示词生成对应的规约, 结果如图 1 所示.

图 1 GPT-4 与领域专家生成业务规则规约的对比分析

通过分析领域专家和 GPT-4 生成的规约, 我们发现 GPT-4 在规约任务中存在以下问题.
(1) 无法精准筛选与软件需求相关的内容. 在证券领域的业务规则中, 一些规则与软件需求无关, 需要被过滤.
尽管提示中要求规约应与软件需求明确相关, 但 GPT 生成的结果中仍然包含了一些不相关的规则.
(2) 遗漏需求关键信息. 尽管 GPT 生成的规约能够准确提取一些需求信息, 但有时仍然会遗漏一些证券领域
中的需求关键信息, 例如交易方式和交易品种等.
(3) 需求表述抽象, 不具有可操作性. GPT 生成的规约表述抽象, 缺乏具体的操作步骤和执行细节. 例如, “确认
时间符合交易时段”这一表述未明确具体的交易时间, 导致规约在实际操作中难以实施.
(4) 需求间关系未能识别. GPT 生成的部分规约未包含需求间关系. 例如, 对于“撤销申报”, 需要在发起撤销申
报前先“申报”.
(5) 幻觉与杂糅. GPT 有时会产生幻觉, 生成的规约中杂糅了一些其他来源的信息. 例如, “检查时间是否在竞
买日前一天的 18:00 之前”这一内容未在深圳证券交易所的业务规则中提及, 可能引入错误, 影响规约的准确性和
可靠性.
通过上述对比, 我们可以看出, 直接使用 GPT-4 生成业务规则需求规约虽显示出一定的可行性, 但也存在明
显的限制. 对于一些通用的自然语言处理任务, GPT-4 表现较好, 能理解基本领域术语的含义, 并基于规则的字面
表达进行简单的关系识别. 然而, 由于缺少相关领域知识, GPT-4 在执行自然语言处理任务时并不清楚哪些内容与
软件需求相关以及哪些信息对于证券领域是关键的, 会产生问题 (1)、(2). 同时, GPT-4 在处理抽象表达和挖掘规
则之间的依赖关系时仅能进行表面级的语义理解, 难以将抽象的表达具体化以及深入解析复杂关系, 导致问题 (3)、
(4). 此外, GPT-4 因为缺少可靠的知识来源, 还可能产生幻觉, 如问题 (5), 即在生成的规约中引入与当前业务无关
的错误信息. 这些都需要结合可靠的知识源——领域知识进行处理.
1.3 方法框架
为了克服上述挑战, 提出了一种新的为业务规则自动生成规约的方法. 它结合了大语言模型和领域知识库, 通

272 273 274 275 276 277 278 279 280 281 282