摘要
摘要
人体目标检测的主要任务是分析人体空间特征,从而预测图像中出现的目标类别
以及位置,被广泛应用在目标跟踪、视频分析、自动驾驶、人机互动等应用领域。现有
方法存在多尺度特征融合形式单一、图像中存在与待检测目标人体相似性的特征、小
目标人体检测精度低、遮挡面积较大的人体目标这四个问题,这将极大地限制模型在
现实场景中应用。针对上述问题,本文将解决多尺度特征融合形式单一问题的解决方
法双向特征金字塔结构形式作为本文整体模型的基底,由此提出了两种人体目标检测
模型和一种损失函数机制。
(1)为了解决多尺度特征融合形式单一和图像中存在与待检测目标人体相似的相似
特征这两问题,本文提出了一种基于多尺度重构特征金字塔的人体目标检测模型
(Multi-scaleRedistributionFeaturePyramidNetwork,MRFPN)。首先,MRFPN通过多个
可重叠的M-BiFPN模块构建双向特征金字塔进行上下层特征信息的传递,从模型内部
可看出次模块可以有效地减少相似或者相同特征信息的干扰;然后,通过通道分配模
块(ChannelAllocationModule,CAM)区别不同特征信息的重要程度为之后能高效的对
人体目标识别打下基础;最后,受ResNet启发,通过引入残差边重构特征金字塔进行
预测。实验结果表明,本章方法在PASCALVOC2012、MSCOCO和Caltech行人数据
库这三个数据集上都获得较好的检测效果。
(2)为了解决多尺度特征融合形式单一和小目标人体检测精度较低这两个问题,本
文提出了一种基于双向多补偿特征金字塔的人体目标检测模型(Bi-directionalMulti-
CompensationFeaturePyramid,Bi-MCFN)。首先,Bi-MCFN通过两个特征金字塔FPN
的连接构建双向特征金字塔结构形式,利用特征金字塔模型的上下特征传递结构可增
强小目标人体特征信息;然后,在两个特征金字塔模型连接方式上,模型引入了ASPP
作为连接模块,通过不同扩张系数的空洞卷积构成的金字塔结构,从而捕获不同感受
野的特征信息;最后,在研究过程中发现原始特征金字塔模型中的横向连接存在高层
特征信息损失和上下层特征信息映射不齐这两个问题,因此提出了特征亲和度分析模
块(AffinityAnalysis,AAS),此模块还可进一步增强小目标人体的检测性能。实验结果
表明,本章方法在PASCALVOC2012、MSCOCO和Caltech行人数据库这三个数据集
上都获得较好的检测效果。
(3)为了解决遮挡面积较大的人体目标这一问题,本文提出了一种基于人体目标检
测的遮挡损失函数。此函数包括基于边框回归改进的边框补偿损失函数和针对多目标
之间交叉部分的交叉补偿损失函数。将上述损失函数引入到第2章MRFPN和第3章
I
西安工程大学硕士学位论文
Bi-MCFN这两个模型上,并通过实验结果表明,本章方法在Caltech行人数据库这一
数据集上相较于没有引入本章损失函数的模型性能有了提升。
关键词:人体目标检测;双向特征金字塔;小目标检测;注意力机制;补偿损失函数
论文类型:应用研究型
II
目录
目录
摘要I
ABSTRACTIII
第1章绪论1
1.1研究背景及意义1
1.2国内外研究现状2
1.2.1目标检测2
1.2.2特征金字塔3
1.2.3人体目标检测4
1.3数据集介绍8
1.4本文主要研究内容11
1.5本文章节安排13
第2章基于多尺度重构特征金字塔的人体目标检测模型15
2.1双向可重叠信息传递模