第54卷第7期红外与激光工程2025年7月
Vol.54No.7InfraredandIJul.2025
LaserEngineering
深度学习助力全息元宇宙虚实融合场景生成与呈现:
发展与展望(特邀
何泽浩1,高云晖?,曹良才?,张
岩1*
(1.首都师范大学物理系,北京100048;
2.清华大学精密仪器系,北京100084)
摘要:元宇宙是互联网变革的先导性和支撑性技术,表明了信息维度扩展和沉浸体验革新是互联网
的未来发展趋势。数字三维内容是元宇宙的核心要素,也是承载信息和传递反馈的主要媒介。基于数
字染的三维内容生成和基于全息显示的三维内容呈现,在图像效果、设备成本和应用灵活性等方面
优势显著,在元宇宙领域内具有广阔前景。文中比较了常用数字染技术的性能表现,介绍了单目深
度估计在真实场景三维数字化任务中的作用,综述了有监督和无监督两类基于人工智能的单目深度估
计技术的发展历程,强调了突破深度估计精度和速度瓶颈是单目深度估计技术在元宇宙内容生成领域
的主要挑战,进而介绍了潜在解决方案,包括回归估计区间优化、特征参数允余压缩和多维度特征关联
等;介绍了人工智能技术在计算全息图生成任务中的应用,综述了数据驱动和模型驱动两类计算全息
图生成网络的发展历程,总结了全息显示结果可重构深度范围受限是计算全息图生成网络在元宇宙内
容呈现领域的主要挑战,进而介绍了潜在的解决方案,包括全息图频率成分滤波、初始计算条件优化和
模型收敛路径选择等。总之,提升三维内容生成和呈现的质量和效率,是元宇宙对计算全息三维显示
提出的必然要求。
关键词:元宇宙;深度估计;计算全息;三维成像;三维显示
中图分类号:0436文献标志码:AD0I:10.3788/IRL
引用格式:HEZehao,GAOYunhui,CAOLiangcai,etal.Deeplearningempowersgenerationandpresentationofvirtual-
realfusionscenariosinholographicmetaverse:developmentandprospects(invited)[J].InfraredandLaserEngineering,
2025,54(7)
何泽浩,高云晖,深度字助刀能头融合场京成气与呈现:发展与展望(特邀)[].红外与激光工
程,2025,54(7)
0引言实割裂升级为虚实融合,人机交互更加高效。我国相
关部门陆续出台了《虚拟现实与行业应用融合发展行
元宇宙是一个与现实世界相互平行、彼此影响并
且始终在线的数字虚拟世界[-2]。用户可在元宇宙中
开展虚拟购物、在线学习、线上社交和博物馆游览等宙在国家战略规划中的重要地位。
活动。2021年,Facebook公司更名为Meta,计划重点数字三维内容是元宇宙的核心资产,对于元宇宙
投人元宇宙行业,极大推动了元宇宙行业的发展。元的作用等同于真实三维物体之于现实宇宙,是承载信
宇宙是互联网变革的先导性和支撑性技术,揭示了互息和传递反馈的媒介。三维内容的生成和呈现,是实
联网的两大发展趋势:一是信息维度由二维视窗升级现元宇宙的基础,也是学术界与产业界重点探索的方
为三维视界