Page 71 - 《软件学报》2025年第12期
P. 71
5452 软件学报 2025 年第 36 卷第 12 期
定的时序标签, 确保生成的时序逻辑公式能够准确表达需求中的时序、依赖关系和复杂行为, 从而减少需求描述
中的歧义与误解, 整体提升形式化规约生成的准确率与有效性. 本文以 ICON 数据集中隐含语义为例, 如表 9 所
示, 说明需求文本中难以识别的隐含语义的分类, 及其对于形式化规约生成准确率的影响.
表 9 隐含语义识别对形式化规约生成影响
数据集 总计 前提条件 并行或允许的操作 警告或重要提示
Amazon S3 REST API 14 2 4 8
PayPal Payment REST API 20 2 7 11
Java.Io 47 12 6 29
形式化规约准确率 (%) ↑3.05 ↑0.60 ↑0.64 ↑1.81
(1) 前提条件. 需求描述某个操作之前必须满足的条件或必须先完成的步骤. 如数据集中“However, for copying
an object greater than 5 GB, you must use the multipart upload API”.
(2) 并行或允许的操作. 需求描述了可以与其他操作同时或在不同时间段内进行的操作. 如“However, bucket
owners can grant other users permission to delete the website configuration by writing a bucket policy granting them the
S3 permission”.
(3) 警告或重要提示. 需求强调了某些操作的关键步骤或后续步骤的要求. 如“Amazon S3 returns a unique
identifier, the upload ID, that you must include in your upload part request”.
隐含语义相较于显式语义, 在需求数据中体现为语法描述自由且占比较少, 很难制定的专门的语法规则去定
义和识别, 导致 ICON 工具中无法直接将其自动转化为逻辑公式. 本文所提技术可以解决隐含语义在形式化规约
生成过程中无法识别的问题, 提升形式化规约生成的准确率. 同时通过将需求文本标注上清晰的时序标签分类, 使
得规约更易于理解和维护, 这在实际形式化验证中也能够减少错误和偏差, 提升形式化规约的可用性.
• 问题 5: 模型是否具备跨领域软件需求文档的泛化能力?
在分析跨领域软件需求文本的时序逻辑语义时, 模型的泛化能力至关重要. 尽管本模型在特定任务上表现优
异, 但其在不同领域需求文档中的适应性仍需进一步评估. 为此, 本实验通过引入多个不同领域的软件需求数据
集, 评估模型在跨领域任务中的泛化性能, 以确保方法的可复现性和科学严谨性. 该模型实际应用于航天太阳搜索
控制软件子系统项目研究 [42] , 并在实际业务场景中取得了良好的效果, 同时额外引入 ARSC (Amazon review
sentiment classification) 软件产品功能需求文档、自动驾驶需求文档进行了实验评估, 在词向量维度和 Epoch 均
为 300 情况下, 采用领域自适应微调技术将新需求文档带入微调模型参数, 分析模型不同领域需求文档的性能表
现. 以下是软件需求文件介绍.
(1) 在太阳搜索控制需求文档 16 个 IP 的软件需求, 其均为可形式化验证的安全需求描述.
(2) ARSC 开源数据集中 Software.t2 产品类别中, 此数据集为软件开发者提供了多种类型软件的需求, 包括描
述软件功能、兼容性以及数据处理. 开发者可以深入了解用户对软件功能的实际需求和期望, 从而更精确地定义
功能需求.
(3) 自动驾驶的软件数据集, 描述了自动驾驶系统与传感器的交互数据、系统响应和安全机动的执行指令, 涵
盖了自动驾驶在正常运行和故障模式下的安全需求描述.
表 10 显示了模型在不同领域需求文本下的良好的泛化能力和适用性. 在对 3 个软件需求文档数据集的模型
性能评估中, 模型在描述规范和技术性较强的文档, 如太阳搜索控制需求文档, 表现出高精度和准确率, 其准确率
达到 1.0, 表明模型对该领域需求的语义解析具有适用性, 能够精准地处理规范化安全需求描述. 而在处理广泛软
件功能的 ARSC 数据集时, 模型准确率为 0.79 有所下降, 这与数据集中需求文本的多样性和技术描述的不一致性
有关. 对于自动驾驶需求数据集, 模型展现出较高的适应性, 语义解析准确率达到 0.94, 表明模型在处理自动驾驶
领域需求时仍能保持较高的准确性. 这些结果验证了模型在解析需求时序逻辑的有效性, 同时也表明当数据集内
容包含多样且文本结构差异较大需求时, 模型的性能可能会有所下降. 实验代码及数据已发布在 https://github.
com/ChunyiLi322/TLSA.

