基于RepPointsV2的旋转目标检测算法的研究
摘要
任意方向目标场景上的目标检测研究是近几年来目标检测领域新兴的一个研究方
向。对比水平视角通用场景,任意方向目标场景由于其具有的方向随机性,相较于水
平视角的图像包含了更多的细节信息,使其在交通疏导、城市规划、海上救援以及军
事部署有着广泛的应用价值。但任意方向目标的检测场景相较于水平目标检测场景,
场景中目标的尺度变化很大、小目标多、目标多呈聚集分布和背景环境复杂,这些都
为准确的目标检测带来了困难。针对上述问题,本文以无锚框的检测模型RepPointsV2
为基准模型,对旋转目标检测模型进行了研究,主要研究内容如下:
针对目标尺寸分布跨度大导致的传统下采样金字塔网络无法正确地提取目标特征
的问题,本文在RepPointsV2上新增了一个上采样金字塔网络,通过金字塔池化结构连
接了两个特征金字塔网络来充分利用特征信息进行多尺度特征融合。同时将骨干网络
替换为带有注意力机制的Swin-Transformer,利用其窗口交流机制在不同层之间建立窗
口,将每个窗口的特征图与其他层中对应位置的窗口特征图进行交互,从而实现多尺
度信息的融合来提取小目标的特征。通过在DOTAv1数据集上的实验验证,该方法在
实验中取得了显著的性能提升。
在任意方向目标的检测过程中,当目标IoU阈值固定时,目标长宽比分布不一容
易导致正负样本分配时产生错分和漏分等问题。针对这些问题,本文提出了基于目标
形状自适应的IoU阈值正负样本分配算法SADT,使得模型在分配样本时可以根据样本
长宽比自适应地改变IoU阈值,从而实现更精准的正负样本分配。通过在DOTAV1数
据集上的实验分析,结果表明SADT能够有效地提高检测模型的检测精度。
针对目标角度周期性变化而引起的边界不连续、类正方形问题和损失函数高敏感
性等问题,本文提出了旋转框回归损失函数GHD,该损失函数先通过将旋转目标检测
中的目标框转换为高斯分布,然后通过将高斯分布之间的Hellinger距离转换为适合网
络学习的回归损失函数,解决了边界不连续问题,并且在一定程度上降低了损失函数
的敏感性。在总体损失函数中加入了单独预测角度的分布聚焦损失函数,解决了类正
方形问题。通过在DOTAv1,DOTAv1.5和DOTAv2数据集上的实验验证,结果表明本
文所提出的旋转框回归损失函数GHD和总体损失函数是有效的。
关键词:目标检测;旋转框回归损失;正负样本分配;多尺度特征融合;RepPointsV2
基于RepPointsV2的旋转目标检测算法的研究
Abstract
Objectdetectioninarbitrary-directionsceneshasemergedasasignificantareaofresearch
inrecentyears.Comparedtogeneralscenescapturedfromahorizontalperspective,suchscenes
containmoredetailedinformationduetotherandomnessofthedirection.Thishasimplications
forawiderangeofapplicationsincludingtrafficguidance,urbanplanning,marinerescue,and
militarydeployment.However,duetothelarge-scalevariation,theconcentrateddistributionof
objects,thecomplexbackgroundenvironment,andthepresenceofmoresmalltargets,
detectingobjectsinarbitrarydirectionsismorechallengingthan