刘挺8675刘挺8675刘挺8675
T/CSAE85—2024
车载智能座舱大模型交互意图理解与执行能力测试评价方法
757575
1范围666
刘挺8刘挺8刘挺8
本文件规定了汽车智能座舱大模型人机交互意图理解及执行能力的评价指标体系、要求及测试方法。
本文件适用于汽车智能座舱领域大语言模型在产品定义、开发、验收及测试阶段的能力评价。评价
对象包括:
a)大语言模型对用户交互意图的理解能力水平;
b)大语言模型对用户下发指令的执行能力水平,涵盖执行的质量与效率。
挺8675挺8675挺8675
2规范性引用文件
刘刘刘
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T44373—2024智能网联汽车术语和定义
555
GB/T36464.5—2018信息技术智能语音交互系统第5部分:车载终端
刘挺867刘挺867刘挺867
3术语和定义
GB/T44373—2024界定的及下列术语和定义适用于本文件。
3.1
675675675
生成式人工智能artificialintelligencegeneratedcontent;AIGC
刘挺8刘挺8刘挺8
基于算法、模型、规则,通过对海量数据进行学习和分析,自主生成文本、图像、音频、视频或代
码等内容的技术。
3.2
675675675
大语言模型largelanguagemodel;LLM
刘挺8刘挺8刘挺8
在海量文本数据上进行预训练,参数规模巨大,具备强大的自然语言理解、生成和推理能力的深度
学习模型。
3.3
867586758675
车载智能座舱大模型in-vehiclecockpitlargemodel;ICLM
刘挺刘挺刘挺
针对汽车智能座舱场景进行大规模数据预训练并优化或微调的语言模型。
1
刘挺8675刘挺8675