基本信息
文件名称:T_CAPT 012—2024(新闻行业大规模预训练模型研发数据要求).pdf
文件大小:371.91 KB
总页数:20 页
更新时间:2025-03-23
总字数:约3.43万字
文档摘要

ICS35.240

CCSL67

CAPT

团体标准

T/CAPT012—2024

新闻行业大规模预训练模型研发数据

要求

NewsIndustry—Large-scalepre-trainedmodels—Requirementsforresearchand

developmentdata

2024-12-18发布2024-12-18实施

中国新闻技术工作者联合会??发布

T/CAPT012—2024

目次

前言II

引言III

1范围1

2规范性引用文件1

3术语和定义1

4训练数据使用场景2

4.1概述2

4.2预训练阶段要求2

4.3指令微调阶段要求2

4.4多模态场景下要求7

5训练数据评价8

5.1概述8

5.2评价维度8

5.3评测执行9

5.4评测方法9

参考文献16

I

T/CAPT012—2024

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。台

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由中国新闻技术工作者联合会新闻信息标准化分会秘书处和新华通讯社通信技术局联合提

出。

本文件由中国新闻技术工作者联合会归口。