Page 350 - 《软件学报》2021年第5期
P. 350

1574                                     Journal of Software  软件学报 Vol.32, No.5,  May 2021























                                     Fig.5    99 shape images included in the Kimia shape dataset [28]
                                          图 5   Kimia 形状数据集中的 99 个形状图像       [28]
                 4.2   性能评估方法
                    这里,我们采用信息检索的标准性能评估方法——平均精度均值(mean average precision,简称 MAP)                     [32] 来
                 评估算法的检索性能.设数据库中有 N 个图像,将每一个样本 q i 作为查询图像,与数据库中的所有图像进行匹配,
                 共计 N 次匹配.将匹配结果按公式(24)定义的差异度量值,由小到大排序,得到该查询图像的检索结果.设该查询
                                                                              , ,...,P (按在列表中出现的先后
                 图像 q i 在数据库中有 Q i 个同类样本,并计它们在检索排序列表中的位置为 PP                   2    i Q
                                                                             1
                 顺序).对其中的每一位置 P m ,统计排序列表中的前 P m 个样本中与查询图像同类的样本数,计为 S m .则返回的前
                 P m 个样本的检索精确率定义为 S m /P m ,则查询图像 q i 的平均检索精确率 ap i 定义为
                                                         1
                                                     ap = ∑   i Q S m                                (25)
                                                       i
                                                         Q i  m= 1  P m
                 则 MAP 的计算公式定义为
                                                          1
                                                    MAP = ∑   N  ap i                                (26)
                                                          N   i= 1
                 4.3   算法性能比较
                    (1) CVIP100 叶片数据集
                    由表 1 可以看出:本文所提出的方法获得了 89.27%的 MAP 分数,分别比 IDSC+DP、MDM、Height Function、
                 HSC、VGGNet-19 和 RESNet-152 方法高出了 8.74%,17.77%,5.02%,3.19%,8.73%,6.16%.在平均检索时间方面,
                 本文所提出的方法运行速度快于 IDSC+DP、MDM、Height Function 方法,慢于 HSC 和两种深度学习方法
                 VGGNet-19 [30] 和 RESNet-152 [31] .但这里报告的深度学习方法的计算时间不包含网络训练的时间,而且深度特征
                 的计算运行在高性能计算平台.综合考虑检索精确度和检索效率,本文提出的方法性能最优.
                    本文所提出的方法有两个重要的参数:一个是尺度个数 k,一个是轮廓点的采样个数 T.为研究它们对算法性
                 能影响,我们在 CVIP100 数据集上进行了另外两组实验.一组实验是研究尺度个数 k 的不同取值对检索结果的
                 影响.我们将尺度个数 k 从 1 取值到 11,得到对应的检索结果,将实验结果绘成折线图,如图 6 所示.由该图我们可
                                                               −3
                 以看出:当只取一个尺度时,即取尺度安排中的最大尺度σ=2 ,MAP 值只有 27.43%.这是因为此时描述子主要侧
                 重于粗粒度特征,而对叶片图像的细节信息描述能力不足.当增加尺度个数 k,细粒度特征的描述能力持续得到
                 加强,反映图像检索精度的 MAP 值也持续提升.当 k 取到 8 时,MAP 值达到最高值为 89.27%.而当 k 继续取大于
                 8 的值时,我们发现 MAP 值有所降低.这是因为 k 过大,描述子将会引入更多的细粒度特征,使得描述子中细粒度
                 特征所占的比重越来越大,粗粒度特征的作用会被逐渐忽略,即描述子会过度聚焦于细节信息,而忽略了叶片图
   345   346   347   348   349   350   351   352   353   354   355