基于多角度图像的建筑物三维重建
摘要
随着人工智能和深度学习的飞速发展,建筑物的三维重建不仅是一个概念,它在城
建规划、国土资源、灾害监测与评估,测绘领域等方面发挥着不可替代的作用。基于多
视图的三维重建技术在建筑物三维重建方面受到越来越广泛的关注。经典的三维重建方
法通过使用深度传感设备,从多个视角获取物体具有深度信息的图像,以便恢复其原始
的三维结构。由于扫描重建对象的所有表面并不总是可行的,可能重建的三维结构会出
现塌陷、空洞等问题,并且在处理多视角图像时需要消耗更多的计算资源。同时和传统
的立体像对相比,多角度图像在获取比较丰富更为全面的建筑物目标信息的同时,也减
少了因为传感器姿态角度和位置而造成的对拍摄区域产生的遮挡问题。因此,研究如何
充分利用无人机航拍资源,实现高效、更加精细、快速地基于多角度图像的建筑物三维
重建,还原建筑物区域的形貌和三维结构等信息,对于社会及学界都有着极为重要的研
究价值与应用意义。
本文采用改进的增量式SFM方法实现建筑物场景的稀疏点云重建。因为寻找可在
多个视图中重复的局部特征是稀疏三维重建的基础,经典图像匹配式一次性地检测每个
图像的关键点,这可能会产生局部性差的特征,对于误差较大的特征,会影响最终重建
的结果。因此提出了一种从多个视图进行关键点细化和BA优化的新方法,通过直接对
齐来自多个视图的低级图像信息来细化SFM的两个关键步骤:首先在进行几何估计之
前,调整初始关键点的位置,随后优化点和相机姿态作为后处理。这种细化对大的检测
噪声和外观变化具有一定的鲁棒性,显著提高了在三角化,相机姿态估计的SFM稀疏
重建的精度。
在稀疏重建后,利用MVS方法实现建筑物场景的稠密点云重建,多视图立体MVS
旨在从多幅图像中获取真实世界场景的三维密集点云,传统的MVS方法存在着在没有
足够的纹理和光照条件发生剧烈变化的场景中,会使密集匹配变得困难的情况,导致不
完整的重建,为了缓解这一局限性,本文提出了一个自适应聚合的递归多视图立体网络,
其中的视图内特征聚合模块用于鲁棒的特征提取,其中上下文感知特征自适应地聚合到
具有不同纹理丰富度的多个尺度和区域。另一个视图间代价体聚合模块用于多视图代价
体聚合,其通过在良好匹配的视图对上分配更高的权重来克服复杂场景中变化遮挡的困
难。与现有方法相比,该框架能够获得更准确的深度图,生成更密集和完整的点云。
关键词:建筑物三维重建;从运动恢复结构;深度图估计;多视图立体
基于多角度图像的建筑物三维重建
ABSTRACT
Withtherapiddevelopmentofartificialintelligenceanddeeplearning,3D
reconstructionofbuildingsisnotonlyaconcept,itplaysanirreplaceableroleinurban
planning,landresources,disastermonitoringandassessment,andmappingfields.
Multi-view-based3Dreconstructiontechniquesarereceivingmoreandmoreattentionin3D
reconstructionofbuildings.Classical3Dreconstructionmethodsacquireimagesofobjects
withdepthinformationfrommultipleviewsbyusingdepth-sensingdevicesinorderto
recovertheiroriginal3Dstructures.Sinceitisnotalwaysfeasibletoscanallsurfacesofthe
reconstructedobject,itispossible