复杂运动场景下的相似目标跟踪方法研究
摘要
多目标跟踪由目标检测和数据关联组成,这两个模块分别用于评估一段视频序列中
目标的位置和各自的身份。目标检测的输出结果会作为数据关联的输入用于跟踪目标,
因此目标检测的性能会直接影响多目标跟踪的整体效果,完成检测任务并提高检测器的
性能对更好地完成多目标跟踪任务具有重要意义。此外,随着用于数据关联的重识别模
型性能的提升,多目标跟踪对行人、车辆等外观易于区分目标的跟踪效果越来越好,这
一发展趋势使现有算法对外观高度相似目标的跟踪性能显著下降,原因是无法通过重识
别模型对目标进行有效区分。针对上述背景和问题,本文选用符合目标外观相似且运动
模式复杂特性的DanceTrack数据集和SoccerNet数据集,主要研究以下内容:
针对复杂运动场景中的目标漏检及边界框回归不准确问题,为了提高对目标的检测
精度,提出了基于特征解耦的目标检测算法。在改进后的网络中,采用无锚框机制,同
时对检测头进行特征解耦,以解决回归和分类任务冲突产生的界框回归不准确问题。此
外,为了保留更多的真实目标,本文在对冗余检测框进行非极大值抑制的过程中加入检
测框中心点信息,通过将中心点距离与交并比进行融合计算的方法一定程度上缓解了目
标漏检问题,加强了算法的检测能力。在DanceTrack数据集和SoccerNet数据集上进行了
对比实验,实验结果证明算法在两数据集上的检测精度有较好提升,更有利于后续的数
据关联,并设计了消融实验验证了各改进方法的有效性。
针对目标外观相似时跟踪算法性能下降问题,为了提高对目标的跟踪精度,提出了
基于级联匹配的数据关联算法。对于外观相似目标,通过实验证明了利用外观信息会对
跟踪性能产生负面影响,因此在后续研究中只考虑运动信息。本文对交并比匹配的区域
进行缓冲扩大,以不同缓冲比例进行级联匹配,充分利用运动信息对目标实现正确跟踪。
并在此次级联匹配后额外将低质量检测框再次与轨迹进行匹配,从获得较低检测得分的
目标中找到真实目标,减少轨迹碎片。此外,通过在卡尔曼滤波过程中加入自适应噪声
尺度,缓解因引入低质量检测框给算法带来的噪声问题。最终,本文的多目标跟踪算法
由基于特征解耦的目标检测算法和基于级联匹配的数据关联算法组成,通过网格实验确
认算法超参数,并在DanceTrack数据集和SoccerNet数据集上进行对比实验,实验结果证
明相对于基线模型和其他多目标跟踪模型,本文模型在跟踪性能上具备优势。
关键词:目标检测;级联匹配;多目标跟踪
复杂运动场景下的相似目标跟踪方法研究
ABSTRACT
MultipleObjectTracking(MOT)consistsofobjectdetectionanddataassociation,which
aretwomodulesusedtoevaluatethelocationandtherespectiveidentityoftargetsinavideo
sequencerespectively.Theoutputresultofobjectdetectionwillbeusedastheinputofdata
associationfortrackingtargets,sotheperformanceofobjectdetectionwilldirectlyaffectthe
overalleffectofMOT,anditisimportanttocompletethedetectiontaskandimprovethe
performanceofthedetectortobetteraccomplishtheMOTtask.Inaddition,withthe
improvementoftheperformanceofre-identificationmodelsusedfordataassociation,MOTis
becomingmoreandmoreeffectiveonpedest