基本信息
文件名称:4.《高质量数据集 质量评测规范》标准草案.pdf
文件大小:1.19 MB
总页数:13 页
更新时间:2025-05-17
总字数:约1.49万字
文档摘要

ICS35.240.01

CCSL70

中华人民共和国国家标准

GB/TXXXXX—XXXX

`

高质量数据集质量评测规范

Highqualitydataset—Specificationforqualityevaluationandtest

(点击此处添加与国际标准一致性程度的标识)

(草案)

在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。

XXXX-XX-XX发布XXXX-XX-XX实施

GB/TXXXXX—XXXX

目次

前言II

引言III

1范围1

2规范性引用文件1

3术语和定义1

4质量评测2

质量指标2

指标要求2

4.2.1文档完整性2

4.2.2质量合规性2

4.2.3场景适用性2

评测细则3

4.3.1文档完整性3

4.3.2质量合规性3

4.3.3场景适用性5

评测说明5

4.4.1总体说明5

4.4.2补充说明6

参考文献7

I

GB/TXXXXX—XXXX

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

本文件由全国数据标准化技术委员会(SAC/TC609)提出并归口。

本文件起草单位:

本文件主要起草人:

II

GB/TXXXXX—XXXX

引言

当前,随着新一代信息技术持续快速发展,人工智能正加速融入各行业领域,赋能实体经济高质量

发展。数据集是开发和训练人工智能模型的基础,开发和训练高质量的模型对数据集的质量要求也越来

越高。对数据集进行质量评测是评判其是否“高质量”的基本路径,也是“以评促建”保障高质量数据

集建设的重要手段,然而,我国高质量数据集质量评测目前仍缺乏统一的标准规范。制定高质量数据集

质量评测规范,明确其质量评测的质量指标、指标要求、评测细则、评测说明,为组织机构开展高质量

数据集质量评测工作提供指导,对于提升数据集优质供给,促进数据集流通使用,有力支持人工智能模

型开发和训练,更好赋能经济社会发展至关重要。

III

GB/TXXXXX—XXXX

高质量数据集质量评测规范

1范围

本文件规范了高质量数据集的质量评测,明确了质量指标、指标要求、评测细则、评测说明。

本文件可为组织机构开展高质量数据集质量评测工作提供指导。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T36344-2018信息技术数据质量评价指标

GB/TXXXXX-X