城市道路场景下双分支实时语义分割算法研究
摘要
近年来,随着城市化进程的不断加速和人工智能的迅速发展,城市道路场景下的无
人驾驶任务受到了业界的广泛关注。由于无人驾驶任务的安全性需求及城市道路场景的
复杂性,利用机器实时且准确的实现环境感知成为了无人驾驶任务的研究重点。语义分
割任务作为环境感知的基础对无人驾驶领域有着重要的意义,但使用现有语义分割网络
进行高精度的环境感知需要耗费大量硬件资源,不利于实际应用,而现有的轻量级分割
网络又极大地影响了分割精度,所以如何设计推理速度和分割精度平衡的实时语义分割
网络实现城市道路场景的高效感知具有重要的研究意义与应用价值。
由于城市道路场景中物体数量众多且尺寸多样,因此城市道路场景下的分割网络需
要提取充足的多尺度上下文信息和空间信息。虽然现有双分支实时语义分割网络利用上
下文分支和空间分支独立提取上下文信息和空间信息,但其仍存在浅层特征提取结构冗
余和双分支信息交互差等问题,未能很好地平衡网络推理速度和分割精度。因此,本文
通过优化双分支网络架构,设计了一种基于双分支交互的实时语义分割网络,优化包含
三个方面:首先,提出快速下采样模块建立共享骨干以减少浅层特征提取的结构冗余;
其次,提出多层跨越连接残差单元建立上下文分支,并添加多层级联金字塔池化模块以
充分提取多尺度上下文信息;最后,提出相关度引导交互模块促进上下文分支和空间分
支的交互,帮助空间分支更准确地解析空间信息。这种双分支交互的网络结构有效解决
了多尺度物体的分割问题,并且实现了推理速度和分割精度的平衡。
除此之外,城市道路场景中的物体还具有形状多样的特点,且各物体之间的空间位
置关系异常复杂,这些因素导致场景中存在某些难以准确分割的区域,例如条形物体及
相邻或遮挡物体所在的区域。针对这类困难区域,本文在双分支交互实时语义分割网络
的基础上,设计了一种基于形状感知和边缘辅助的实时语义分割网络。具体而言,通过
向上下文分支引入条形上下文感知模块来改善条形物体的分割效果。同时,利用多尺度
特征图构建边缘辅助监督分支,将边缘信息的提取设计成一个独立的像素二分类任务,
并将其作为约束增强上下文信息和语义信息的融合。此方法在略微牺牲推理速度的情况
下,进一步增强了网络在困难区域中的表现。
关键词:实时语义分割;双分支交互;条形上下文感知;边缘辅助
城市道路场景下双分支实时语义分割算法研究
ABSTRACT
Inrecentyears,withthecontinuousaccelerationofurbanizationandtherapid
developmentofartificialintelligence,unmanneddrivingtasksinurbanroadsceneshave
receivedwidespreadattentionfromtheindustry.Duetothesafetyrequirementsofunmanned
drivingtasksandthecomplexityofurbanroadscenes,achievingreal-timeandaccurate
environmentalperceptionbymachineshasbecometheresearchfocusofunmanneddriving
tasks.Semanticsegmentationtaskasthebasisofenvironmentalperceptionhasgreat
significancefortheunmanneddrivingfield.However,usingexistingsemanticsegmentation
networksforhigh-precisionenvironmentalperceptionrequiresalotof