Page 71 - 《武汉大学学报(信息科学版)》2025年第6期
P. 71

第 50 卷第 6 期          隋百凯等:基于几何先验约束的高点多视角损毁建筑物检测方法                                    1093


                码网络提取深层特征,再经过解码网络得到逐像                           的预测掩膜,之后与二维预测类别经过点积操作
                素嵌入特征。Canny 边缘检测的关键步骤包括噪                        得到最终的实例分割结果,并通过类别损失和二
                声降低、梯度计算、非极大值抑制、滞后阈值处理                          值掩膜损失分别约束类别预测和掩膜预测的参
                以及边缘跟踪。熵检测分支主要通过图像熵混                            数优化。
                乱检测函数实现,对输入图像的对齐特征进行计
                算,得到离散数据分布中事件出现的概率的混乱
                程度,熵值越高,数据越无序,损毁概率越高。熵
                混乱检测是一种基于信息熵理论的数据异常检
                测方法,通过量化数据的混乱程度(不确定性)来
                识别异常模式。
                    然后,深层特征还要输入到 Transformer 注意
                力模块中的解码网络提取序列特征。使用标准
                的 Mask2Former 解码网络     [22] 从图像特征和 N 个
                可学习的位置嵌入(即查询)中计算其输出,即深
                层影像特征与序列位置编码分别经过掩膜注意
                力 层 、自 注 意 力 层 和 前 馈 网 络 提 取 序 列 掩 膜 特
                征 ,每 层 后 面 均 需 要 添 加 一 个 相 加 和 归 一 化
                操作。
                    最后,在检测模块中,应用线性分类器在每
                段嵌入 Q 上进行 Softmax 激活,以产生每个段的
                类别概率预测。对于掩膜预测,由 Transformer 注
                意力解码网络输出的序列特征经过多层感知器
                                                                   图 5 建筑与损毁建筑边缘特征和熵混乱程度表达
               (multilayer perceptron,MLP),将每段嵌入 Q 转换
                                                                 Fig.  5 Edge Features and Entropy Chaos Expression of
                为 C×N 的二维掩膜嵌入特征,与逐像素嵌入进
                                                                          Buildings and Damaged Buildings
                行点积,再通过 Sigmoid 激活函数得到 N×H×W





















                                                   图 6 损毁建筑实例分割网络
                                        Fig.  6 Damaged Building Instance Segmentation Network

                1.3 基于垂直/水平视场切割的几何约束的空间                         个相交点即为此刻检测到的建筑物。当建筑物
                     映射方法                                       检 测 框 的 中 心 不 在 图 像 中 心 时 ,需 要 重 新 计 算
                    一般来说,摄像机云台传回的水平旋转角 α                        当这一建筑物位于图像中心时所对应的水平旋
                和俯仰角 β 均为图像中心点所对应的角度,当建                         转角和俯仰角。如图 7 所示,坐标系以图像左上
                筑 物 检 测 框 的 中 心 位 于 图 像 中 心 时 ,直 接 采 用          角 为 原 点 ,图 像 宽 方 向 为 x 轴 ,图 像 高 方 向 为 y
                云 台 传 回 的 角 度 ,以 摄 像 机 位 置 为 原 点 建 立 一          轴 ,C(x 1 ,y 1 )是 建 筑 物 检 测 框 中 心 在 坐 标 系 的
                条 射 线 ,这 条 射 线 与 建 立 的 建 筑 物 图 层 的 第 一          位置。
   66   67   68   69   70   71   72   73   74   75   76