基本信息
文件名称:计算机行业智能驾驶技术的当下与未来:头部玩家的探索与启示.pptx
文件大小:2.09 MB
总页数:53 页
更新时间:2025-06-02
总字数:约1千字
文档摘要

▎1、软件侧:从“模仿人类”到“超越人类”、从“聋哑司机”到“司机助理”;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;语言模型、多模态模型被引入智能驾驶领域——EMMA(谷歌旗下Waymo)

事实上,VLA模型最早见于机器人行业。2023年7月28日,谷歌DeepMind推出了全球首个控制机器人的视

觉语言动作(VLA)模型RT-2。

2024年10月底,谷歌旗下自动驾驶公司Waymo推出了一个基于端到端的自动驾驶多模态模型EMMA。;21;22;23;24;25;26;27;28;29;30;31;32;33;34;这一阶段来看,除了以上的算法差异,各家的差异还会如何体现?

1)云端:

云端算力怎么样?

2023年6月,特斯拉自动驾驶负责人AshokElluswamy在CVPR2023上表示“训练所有这些模型需要大量的计算资源,这就是为什么特斯拉致力于成为计算领域的世界领导者”。

数据获取?

李想表示,Vision和Action的数据比较难以获得,车辆装满传感器后可以采集物理世界的数据,有人在车上驾驶就能采集到

Action的数据。

数据基础设施怎么样?数据访问效率如何?

小鹏世界基座模型负责人刘博士介绍:多模态模型训练的主要瓶颈不仅是GPU,也需要解决数据访问的效率问题。小鹏汽车自主开发了底层的数据基础设施(DataInfra),使数据上传规模提升22倍、训练中的数据带宽提升15倍;通过联合优化GPU/CPU以及网络I/O,最终使模型训练速度提升了5倍。

模型规模有多大?

小鹏世界基座模型负责人刘博士表示:“过去一年,我们做了大量实验,在10亿、30亿、70亿、720亿参数的模型上都看到了明显的规模法则效应:参数规模越大,模型的能力越强。同样的模型大小,训练数据量越大,模型的能力也会越强。”

2)车端:

车端算力怎么样?

地平线余凯表示:今年行业内主要在发力L2,对于算力的需求为100+TOPS,2028年将会规模实现L3,对于算力的需求将会达到

500-1000+TOPS,2030年实现L4,对于算力的需求是2000+TOPS,2035年间实现L5时则需要5000+TOPS算力。

35;36;37;38;39;40;41;42;43;44;;

厂家;47;48;49;50;51;52;53;54