Page 71 - 《武汉大学学报(信息科学版)》2025年第6期
P. 71
第 50 卷第 6 期 隋百凯等:基于几何先验约束的高点多视角损毁建筑物检测方法 1093
码网络提取深层特征,再经过解码网络得到逐像 的预测掩膜,之后与二维预测类别经过点积操作
素嵌入特征。Canny 边缘检测的关键步骤包括噪 得到最终的实例分割结果,并通过类别损失和二
声降低、梯度计算、非极大值抑制、滞后阈值处理 值掩膜损失分别约束类别预测和掩膜预测的参
以及边缘跟踪。熵检测分支主要通过图像熵混 数优化。
乱检测函数实现,对输入图像的对齐特征进行计
算,得到离散数据分布中事件出现的概率的混乱
程度,熵值越高,数据越无序,损毁概率越高。熵
混乱检测是一种基于信息熵理论的数据异常检
测方法,通过量化数据的混乱程度(不确定性)来
识别异常模式。
然后,深层特征还要输入到 Transformer 注意
力模块中的解码网络提取序列特征。使用标准
的 Mask2Former 解码网络 [22] 从图像特征和 N 个
可学习的位置嵌入(即查询)中计算其输出,即深
层影像特征与序列位置编码分别经过掩膜注意
力 层 、自 注 意 力 层 和 前 馈 网 络 提 取 序 列 掩 膜 特
征 ,每 层 后 面 均 需 要 添 加 一 个 相 加 和 归 一 化
操作。
最后,在检测模块中,应用线性分类器在每
段嵌入 Q 上进行 Softmax 激活,以产生每个段的
类别概率预测。对于掩膜预测,由 Transformer 注
意力解码网络输出的序列特征经过多层感知器
图 5 建筑与损毁建筑边缘特征和熵混乱程度表达
(multilayer perceptron,MLP),将每段嵌入 Q 转换
Fig. 5 Edge Features and Entropy Chaos Expression of
为 C×N 的二维掩膜嵌入特征,与逐像素嵌入进
Buildings and Damaged Buildings
行点积,再通过 Sigmoid 激活函数得到 N×H×W
图 6 损毁建筑实例分割网络
Fig. 6 Damaged Building Instance Segmentation Network
1.3 基于垂直/水平视场切割的几何约束的空间 个相交点即为此刻检测到的建筑物。当建筑物
映射方法 检 测 框 的 中 心 不 在 图 像 中 心 时 ,需 要 重 新 计 算
一般来说,摄像机云台传回的水平旋转角 α 当这一建筑物位于图像中心时所对应的水平旋
和俯仰角 β 均为图像中心点所对应的角度,当建 转角和俯仰角。如图 7 所示,坐标系以图像左上
筑 物 检 测 框 的 中 心 位 于 图 像 中 心 时 ,直 接 采 用 角 为 原 点 ,图 像 宽 方 向 为 x 轴 ,图 像 高 方 向 为 y
云 台 传 回 的 角 度 ,以 摄 像 机 位 置 为 原 点 建 立 一 轴 ,C(x 1 ,y 1 )是 建 筑 物 检 测 框 中 心 在 坐 标 系 的
条 射 线 ,这 条 射 线 与 建 立 的 建 筑 物 图 层 的 第 一 位置。