证券研究报告|行业专题研究
2025年05月24日
智能驾驶技术的当下与未来:
头部玩家的探索与启示
打造极致专业与效率;;
智驾要普及,光“模仿人类”不够,必须“超越人类”
第一个问题:智驾能否普及?人类会不会永远不敢把生命交给智能驾驶?或者渗透率的上限很低?
Eg.一个关于“电梯”发展早期的例子:从工业革命时期开始,
升降机就已经可以实现上下移动物体或人的基本功能,但直到纽 1853-1854年举办水晶宫世界博览会后,升降机才被人们视 。ElishaGravesOtis在博览会上以大胆时尚的方式,推出其安全制动装置。他将平台式升降机升至10米高度,然后由其助手剪断电梯绳索。平台并没有坠到地面,他向目瞪口呆的观众鞠躬,并宣布“安然无恙!”
由此可见,,人类才会放心将生命交给技术。;
智驾要普及,光“模仿人类”不够,必须“超越人类”
第二个问题:靠模仿人类,当智驾模型达到人类司机的优秀水平时,能否普及?
A:尤其是涉及到人身安全,人性对“自己”和对“技术”的能力存在“双标”。只有远超出人类驾驶水平的智驾技术,才能够大规模普及。;;;;;;;;;;;
业界头部玩家的探索——小马智行
?小马智行联合创始人、CTO楼天城表示,世界模型是车端模型的factory(工厂),L4自动驾驶技术的真正差别在“工厂”的精度,因为它会决定它所生产的产品,即车端模型的上限。
?通过AI生成技术,构造训练车端模型的环境,这包括道路情况,路上其他车和人的行为,还有各主体间的交互,然后再用强化学习方法,让车端系统在这个训练环境里自己进化。
?小马自研的“世界模型(PonyWorld)+虚拟司机(VirtualDriver)”是全无人驾驶实现规模部署的关键技术。
“世界模型”通过构建高真实性的训练环境和行为评估系统,每周可生成超过100亿英里的自动驾驶数据集。
“虚拟司机”系统在世界模型中持续自我进化,已实现在更小算力、量产化硬件下超越人类水准的驾驶表现,特别在极端低概率场景应对能力上取得了突破性进展。;;;
自动驾驶技术超越人类智驾的时间表——价值拐点并不遥远
?特斯拉:计划在2025年6月将Robotaxi引入奥斯汀,依赖原有ModelY车型;大规模完全自动驾驶预计将在2026年年中左右实现。(2025Q1财报会)
?小鹏:将在2025年年中推出V6全新大版,即准L3级别的高阶自动驾驶技术,这标志着小鹏自动驾驶能力将全面超越FSDV13。到2025年底,小鹏计划推出真正的L3级别自动驾驶软件(2025.02何小鹏微博);到2026年还将规模量产支持L4低速场景无人驾驶的车型。(2024Q4财报会)目前,小鹏汽车用于训练基座模型的视频数据量高达2000万clips,这一数字今年将增加到2亿clips。(2025.4香港之夜)
?理想:理想在AItalk上表示,要在2025年实现L3级别智能驾驶,三年内进入L4级别。(2024.12AITalk)
?华为:华为智能驾驶产品线总裁李文广表示,高速L3级别的自动驾驶技术有望在2025年在部分城市率先启动试点商用,到2026年这项技术有望实现更大范围的规模化商业应用;华为的目标是在2027年实现城区L4级别自动驾驶技术的规模化商用,而在无人干线物流领域,这一时间点则被定在了2028年。
?Momenta:首批车端无人的Robotaxi将于2025年年底开始试运营。
?小马智行:2025年4月上海车展发布的第七代车规级自动驾驶系统方案实现Robotaxi的100%车规级量产。
年,小马智行将全力冲刺的大规模商业化,向外界证明自动驾驶大规模商业化的可行性。;;;;;;;;
DriveVLM是在传统的自动驾驶系统上,增加了大视觉语言模型(VLM)的能力。由于VLM在视觉理解和推理方面的能力突出,所以结合该大模型能力后,
DriveVLM不仅具备基本的自动驾驶能力,而且还能够理解输入的图像信息,并作出对应驾驶决策。
?摄像头输入的图像序列先由视觉编码器进行处理,生成图像tokens,并通过自注意力机制捕捉其中的重要特征,与VLM的组成部分大语言模型进行对齐。
?随后,大语言模型通过思维链(chain-of-thought,CoT)进行推理,主要包含三个模块,场景描