基本信息
文件名称:T_CAPT 012—2024(新闻行业大规模预训练模型研发数据要求).pdf
文件大小:371.91 KB
总页数:20 页
更新时间:2025-03-23
总字数:约3.43万字
文档摘要
ICS35.240
CCSL67
CAPT
团体标准
T/CAPT012—2024
台
平
息
新闻行业大规模预训练模型研发数据
信
要求
准
NewsIndustry—Large-scalepre-trainedmodels—Requirementsforresearchand
developmentdata
标
体
团
国
全
2024-12-18发布2024-12-18实施
中国新闻技术工作者联合会??发布
T/CAPT012—2024
目次
前言II
台
引言III
1范围1
2规范性引用文件1
平
3术语和定义1
4训练数据使用场景2
4.1概述2
4.2预训练阶段要求2
息
4.3指令微调阶段要求2
4.4多模态场景下要求7
5训练数据评价8
信
5.1概述8
5.2评价维度8
5.3评测执行9
5.4评测方法9
准
参考文献16
标
体
团
国
全
I
T/CAPT012—2024
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
起草。台
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中国新闻技术工作者联合会新闻信息标准化分会秘书处和新华通讯社通信技术局联合提
出。
本文件由中国新闻技术工作者联合会归口。