Page 16 - 《软件学报》2021年第7期
P. 16
1934 Journal of Software 软件学报 Vol.32, No.7, July 2021
使这些属性值在不同文献的形式统一,我们采取了以下措施.
(1) 针对作者名,考虑到 IEEE Xplore、ACM Digital Library、ScienceDirect 和 Springer 数据库中提供的作
者名的形式有所不同,我们从文献及其对应的发表网站上爬取了所有文献中所有作者的全名,以作者全名代替
所有的缩写名以及不同的书写形式.
(2) 针对作者机构,考虑到有些作者可能有多个所属的科研机构,我们以该作者所提及的第 1 单位作为其所
在的单位.同时,不同的文献数据库对不同机构的书写形式也不一样.同样,我们爬取了所有机构的全称,以全称
代替所有的缩写形式.
(3) 针对出版物类型,我们同样从文献相关的网站上爬取了出版物的全称,并以出版物的全称代替所有的
其他书写形式.
(4) 针对关键词,考虑到不同的作者有着不同的写作习惯和表达方式,他们会使用不同的关键词来表示相
同的主题,比如 uncertainty、unpredictability、indeterminacy 等词经常替代使用.因此,我们建立了一个同义词表,
将不同的词替换为同一个词,比如将 unpredictability、indeterminacy 替换为 uncertainty,以更好地发现文献的相
关主题及其共现关系.同时,有些关键词的全称有其简写形式,比如 Unified Modeling Language 的简写形式为
UML.因此,我们还建立了一个关键词简称和全称对照表,并以此为根据将关键词的简写替换为其对应的全称.
Table 3 The attribute details of the primary studies
表 3 文献属性的详细信息
序号 属性名 属性描述 相关的研究问题
1 编号 文献唯一标识 全部
2 标题 文献的标题 全部
3 作者姓名 文献全部作者的姓名 全部
4 作者机构 作者所在的科研机构 全部
5 出版时间 文献的出版时间 RQ1
6 出版物类型 文献出版类型,如期刊、会议等 RQ2
7 关键词 文献中涉及到的关键词 RQ3
8 生命周期阶段 不确定性研究涉及到的系统生命周期的阶段 RQ4
9 运用领域 不确定性研究涉及到的领域,如信息物理系统、物联网等 RQ5
10 不确定性类型 不确定性研究涉及到的不确定性类型 RQ6
11 不确定性处理方法 不确定性研究涉及到的不确定性处理方法 RQ7
12 学科领域 不确定性研究涉及到的学科领域,如自动化、计算机(软件工程)等 RQ8
3.6 研究问题调研
基于相关文献及其对应的属性,我们构建了文献-属性表格,并根据此表格调研和回答各个研究问题.需要
强调的是,这个过程是数据收集(尤其是针对文献属性 8~属性 12)中一个至关重要的环节.所以整个数据收集过
程,由本文的两位作者进行数据收集和反复的协商直至得到一致的结果,主要目的是完善不确定性分类以及不
确定性处理方法.
4 实验结果
本节基于收集到的数据,针对每个研究问题,展开详细讨论.
4.1 研究问题1:复杂系统的不确定性研究的相关文献随时间的发表情况是怎样的?
为了回答这个研究问题,我们统计了从 2011 年~2020 年(截止到 3 月)每年文献的发表数量.图 2 展示了相关
文献发表年份的分布情况.从图 2 中可以发现,在 2015 年及其之前复杂系统的不确定性领域文献发表的数量增
幅相对平缓,发表文献较多的是 2013 年和 2015 年,文献发表数量分别为 9 篇和 10 篇.在 2015 年之后,文献发表
的数量呈逐年递增的趋势,到 2018 年达到了 37 篇(37/142).这表明,研究人员对复杂系统的不确定性研究的关注