Page 343 - 《软件学报》2021年第5期
P. 343

陈鑫  等:高斯卷积角:用于叶片图像检索的形状描述不变量                                                    1567


                    基于区域的叶片形状描述方法是将叶片整个区域的像素点作为算法的输入,将算法输出的特征向量作为
                                   [2]
                 描述子.Horaisová 等人 将叶片形状转化成二值图像模式,在其中提取二维傅里叶功率谱,进行平移、缩放、旋
                 转和镜像等操作,该方法在植物叶片分类中取得了很好的效果.考虑到很难从叶片轮廓中找到明显的曲率点,
                        [3]
                 Lee 等人 认为:一些基于区域的特征,例如纵横比、紧密度、质心和水平或垂直投影等,对叶片图像的识别更为
                 可靠.文献[4]提出用快速 Curvelet 变换得到 3 个变换系数,再对每一个系数,用其第 1 个不变矩表征形状,由此得
                 到一个三维的形状特征向量.文献[5]提出了一种结构积分变换(structure integral  transform),不同于图像沿直线
                 进行投影的 Radon 变换,该方法将形状图像沿一对正交直线进行投影,用图像在两个正交方向上的直线投影长
                 度得到一个复数来表征图像区域的内部结构,相较于基于 Radon 变换的描述子,对形状的表征能力更强,且满足
                 对平移、旋转和缩放的不变性.
                                                                      [6]
                    叶的轮廓包含了叶片的边缘、顶点和基质这些丰富的鉴别信息 ,这些信息通常被认为是物种识别的主要
                 线索.因此,国内外相关学者基于这些鉴别信息提出了两类用于植物识别的叶片轮廓描述方法,主要包括基于边
                 界点集的描述方法和基于曲线的描述方法.
                    基于边界点集的描述方法是将目标边界(包括内边界和外边界)看成一个无序的点集,直接抽取点集的几何
                                               [8]
                                   [7]
                 特征作为形状的描述子 .形状上下文 是一个著名的基于边界点集的描述子.该方法对每一个边界采样点,构
                                                                                      [9]
                 造对数极坐标直方图,以统计所有其他边界采样点,相对于它的空间分布关系.Ling 等人 定义两个轮廓采样点
                 之间的内部距离为一个点到另外一个点的所有只经过轮廓所围区域的路径的长度最小值.不同于文献[8]提出
                 的欧式距离产生形状上下文,该方法用轮廓采样点之间的内部距离构建形状上下文描述子.其优点是描述子对
                 目标的肢体变化不敏感,且能有效地描述目标的结构信息.该方法已有效地应用于研发植物叶片识别系统                                      [10] .
                 Backes 等人 [11] 将形状轮廓建模成一个复杂网络,并通过网络的动态演化,用网络的度和联合度作为形状特征,构
                 建特征向量来描述叶片形状.该方法它不仅满足尺度和旋转的不变性,而且不依赖于轮廓的拓扑结构.
                    基于曲线的描述方法是将叶片轮廓作为曲线,通过测量其曲线的几何特性来描述形状.曲率尺度空间
                 (curvature scale space,简称 CSS) [12] 是一种基于轮廓曲率测量的描述子,且被 MEPG-7     [13] 推荐为标准的轮廓描述
                 子.一个形状图像的轮廓线通过不同宽度的高斯卷积,得到曲率过零点的变化轨迹,形成 CSS 图像作为形状描述
                 子.文献[13]提出了一种 CSS 表示的泛化方法,用于识别具有自遮挡的轮廓,并成功地用于对菊花叶片的识别.对
                 曲线曲率的测度一般使用的是微分技术,但其局限性是噪声比较敏感.Manay 等人                         [14] 提出运用不同的核函数来
                 进行对目标轮廓的积分运算,产生形状描述不变量,并具有对曲线曲率度量的等效性和对噪声干扰的鲁棒性.
                 Kumar 等人 [15] 用该思路构造圆盘积分不变量和圆周积分不变量,产生描述叶片形状特征的直方图,用于研发叶
                 片图像的识别系统.除了曲线的曲率特性,曲线的一些其他几何特征也可用来产生描述子.Hu 等人                                [16] 提出用多
                 尺度距离矩阵(multiscale distance matrix,简称 MDM)进行快速叶片识别,该方法用叶片轮廓的每一对采样点之
                 间的欧式距离或内部距离,产生满足对相似变换不变的距离矩阵,作为形状描述子.分层弦切法(hierarchical
                 string cuts,简称 HSC) [17] 通过用弦对轮廓片段的切割,抽取轮廓片段上的点相对于弦的几何空间分布信息,以描
                 述轮廓片段的几何结构特征.该方法通过改变轮廓片段的长度,自然地构建了一个多尺度的轮廓弦切描述子.该
                 方法的主要优点是运行非常快,描述能力非常强,适用于需要大规模的数据库图像检索任务.
                    近年来,一些基于学习的方法也被用来产生叶片形状描述子.受词袋模型(bag-of-words)                        [18,19] 的启发,Wang
                 等人 [20] 提出将叶片形状拆分成轮廓片段,用它们的形状上下文描述子(shape context)构成形状编码;然后用训练
                 样本的形状编码,通过 K 均值聚类算法,用得到的类中心的集合生成轮廓线片段的码本;最后,用码本对形状图像
                 进行编码描述.该算法得到的描述子具有鲁棒、紧致的特性,且精确地描述了包括轮廓线片段的空间布局信
                           [6]
                 息.Zhao 等人 提出用字典学习技术          [21] 去收集叶片形状的有用模式,描述一个叶片形状就简化为在收集的形状
                 模式集上的分布直方图上计算形状特征.该方法最大的优点是能对单叶叶片图像和复合叶片图像都进行有效
                 的识别.Zeng 等人   [22] 提出一种基于距离的融合稀疏表示和局部约束字典学习的鲁棒叶片识别新方法,该方法不
                 仅提高了叶片识别精度,而且识别速度也很快.针对描述图像内容的高维特征的数据冗余和噪声干扰问题,Li 等
                 人 [23] 组合利用谱聚类和冗余分析,提出一种带冗余约束的非负谱分析无监督特征选择方法.该方法可直接鉴别
   338   339   340   341   342   343   344   345   346   347   348