Page 350 - 《软件学报》2021年第5期
P. 350
1574 Journal of Software 软件学报 Vol.32, No.5, May 2021
Fig.5 99 shape images included in the Kimia shape dataset [28]
图 5 Kimia 形状数据集中的 99 个形状图像 [28]
4.2 性能评估方法
这里,我们采用信息检索的标准性能评估方法——平均精度均值(mean average precision,简称 MAP) [32] 来
评估算法的检索性能.设数据库中有 N 个图像,将每一个样本 q i 作为查询图像,与数据库中的所有图像进行匹配,
共计 N 次匹配.将匹配结果按公式(24)定义的差异度量值,由小到大排序,得到该查询图像的检索结果.设该查询
, ,...,P (按在列表中出现的先后
图像 q i 在数据库中有 Q i 个同类样本,并计它们在检索排序列表中的位置为 PP 2 i Q
1
顺序).对其中的每一位置 P m ,统计排序列表中的前 P m 个样本中与查询图像同类的样本数,计为 S m .则返回的前
P m 个样本的检索精确率定义为 S m /P m ,则查询图像 q i 的平均检索精确率 ap i 定义为
1
ap = ∑ i Q S m (25)
i
Q i m= 1 P m
则 MAP 的计算公式定义为
1
MAP = ∑ N ap i (26)
N i= 1
4.3 算法性能比较
(1) CVIP100 叶片数据集
由表 1 可以看出:本文所提出的方法获得了 89.27%的 MAP 分数,分别比 IDSC+DP、MDM、Height Function、
HSC、VGGNet-19 和 RESNet-152 方法高出了 8.74%,17.77%,5.02%,3.19%,8.73%,6.16%.在平均检索时间方面,
本文所提出的方法运行速度快于 IDSC+DP、MDM、Height Function 方法,慢于 HSC 和两种深度学习方法
VGGNet-19 [30] 和 RESNet-152 [31] .但这里报告的深度学习方法的计算时间不包含网络训练的时间,而且深度特征
的计算运行在高性能计算平台.综合考虑检索精确度和检索效率,本文提出的方法性能最优.
本文所提出的方法有两个重要的参数:一个是尺度个数 k,一个是轮廓点的采样个数 T.为研究它们对算法性
能影响,我们在 CVIP100 数据集上进行了另外两组实验.一组实验是研究尺度个数 k 的不同取值对检索结果的
影响.我们将尺度个数 k 从 1 取值到 11,得到对应的检索结果,将实验结果绘成折线图,如图 6 所示.由该图我们可
−3
以看出:当只取一个尺度时,即取尺度安排中的最大尺度σ=2 ,MAP 值只有 27.43%.这是因为此时描述子主要侧
重于粗粒度特征,而对叶片图像的细节信息描述能力不足.当增加尺度个数 k,细粒度特征的描述能力持续得到
加强,反映图像检索精度的 MAP 值也持续提升.当 k 取到 8 时,MAP 值达到最高值为 89.27%.而当 k 继续取大于
8 的值时,我们发现 MAP 值有所降低.这是因为 k 过大,描述子将会引入更多的细粒度特征,使得描述子中细粒度
特征所占的比重越来越大,粗粒度特征的作用会被逐渐忽略,即描述子会过度聚焦于细节信息,而忽略了叶片图