计算机行业智能驾驶技术的当下与未来：头部玩家的探索与启示.pptx

基本信息

文件名称：计算机行业智能驾驶技术的当下与未来：头部玩家的探索与启示.pptx

文件大小：2.09 MB

总页数：53 页

更新时间：2025-06-02

总字数：约1千字

文档摘要

▎1、软件侧：从“模仿人类”到“超越人类”、从“聋哑司机”到“司机助理”;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;语言模型、多模态模型被引入智能驾驶领域——EMMA（谷歌旗下Waymo）

事实上，VLA模型最早见于机器人行业。2023年7月28日，谷歌DeepMind推出了全球首个控制机器人的视

觉语言动作（VLA）模型RT-2。

2024年10月底，谷歌旗下自动驾驶公司Waymo推出了一个基于端到端的自动驾驶多模态模型EMMA。;21;22;23;24;25;26;27;28;29;30;31;32;33;34;这一阶段来看，除了以上的算法差异，各家的差异还会如何体现？

1）云端：

云端算力怎么样？

2023年6月，特斯拉自动驾驶负责人AshokElluswamy在CVPR2023上表示“训练所有这些模型需要大量的计算资源，这就是为什么特斯拉致力于成为计算领域的世界领导者”。

数据获取？

李想表示，Vision和Action的数据比较难以获得，车辆装满传感器后可以采集物理世界的数据，有人在车上驾驶就能采集到

Action的数据。

数据基础设施怎么样？数据访问效率如何？

小鹏世界基座模型负责人刘博士介绍：多模态模型训练的主要瓶颈不仅是GPU，也需要解决数据访问的效率问题。小鹏汽车自主开发了底层的数据基础设施（DataInfra），使数据上传规模提升22倍、训练中的数据带宽提升15倍；通过联合优化GPU/CPU以及网络I/O，最终使模型训练速度提升了5倍。

模型规模有多大？

小鹏世界基座模型负责人刘博士表示：“过去一年，我们做了大量实验，在10亿、30亿、70亿、720亿参数的模型上都看到了明显的规模法则效应：参数规模越大，模型的能力越强。同样的模型大小，训练数据量越大，模型的能力也会越强。”

2）车端：

车端算力怎么样？

地平线余凯表示：今年行业内主要在发力L2，对于算力的需求为100+TOPS，2028年将会规模实现L3，对于算力的需求将会达到

500-1000+TOPS，2030年实现L4，对于算力的需求是2000+TOPS，2035年间实现L5时则需要5000+TOPS算力。

35;36;37;38;39;40;41;42;43;44;;

厂家;47;48;49;50;51;52;53;54