基本信息
文件名称:TUNP 253-2024 语音数据标注系统技术规范.docx
文件大小:97.97 KB
总页数:14 页
更新时间:2025-03-28
总字数:约7.45千字
文档摘要

ICS

UNSPSC

35.080

43.23.34

CCS

L77

团 体 标 准

T/UNP253—2024

语音数据标注系统技术规范

Technicalspecificationforspeechdataannotationsystem

2024-11-07发布 2024-11-07实施

中国联合国采购促进会 发布

T/UNP253

T/UNP253—2024

T/UNP253

T/UNP253—2024

I

I

II

II

目 次

前言 III

引言 IV

1范围 1

2规范性引用文件 1

3术语、定义和缩略语 1

术语和定义 1

缩略语 1

4系统架构 1

5功能要求 2

音频导入与管理 2

标注工具 2

5.2.1时间轴标注 2

5.2.2文本转录 2

5.2.5分类标注 2

5.2.6质量检查工具 3

协作与管理功能 3

5.3.1多人协作 3

5.3.2任务分配与管理 3

导出与集成功能 3

5.4.1数据导出 3

5.4.2与机器学习框架集成 3

6性能要求 3

高效率性 3

并行性 4

可靠性 4

容错性 4

用户友好性 4

7数据要求 4

输入数据格式 4

输出数据格式 5

8安全要求 5

系统安全 5

数据安全 5

8.2.1数据完整性 5

8.2.2数据储存 5

8.2.3数据传输 5

8.2.4数据备份 5

8.2.5数据恢复 5

9运维要求 5

10评价与改进 6

参考文献 7

T/UNP253

T/UNP253—2024

T/UNP253

T/UNP253—2024

III

III

IV

IV

前 言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由武汉铃声科技有限公司提出。

本文件由中国联合国采购促进会归口。

本文件起草单位:武汉铃声科技有限公司、武汉励为企业管理咨询有限公司、湖北达慕星客商贸有限责任公司、湖北国威时代信息技术有限公司、武汉锐佳讯科技有限公司。

本文件主要起草人:郑伟莲、卢蹁跹、余汉汉、李嘉茵、胡彬。

引 言

为助力中国企业参与国际贸易,推动企业高质量发展,中国联合国采购促进会依托联合国采购体系,制定服务于国际贸易的系列标准,这些标准在国际贸易过程中发挥了越来越重要的作用,对促进贸易效率提升,减少交易成本和不确定性,确保产品质量与安全,增强消费者信心具有重要的意义。

联合国标准产品与服务分类代码(UNSPSC,UnitedNationsStandardProductsandServicesCode)是联合国制定的标准,用于高效、准确地对产品和服务进行分类。在全球国际化采购中发挥着至关重要的作用,它为采购商和供应商提供了一个共同的语言和平台,促进了全球贸易的高效、有序发展。

围绕UNSPSC进行相关产品、技术和服务团体标准的制定,对助力企业融入国际采购,提升国际竞争力具有十分重要的作用和意义。

本文件采用UNSPSC分类代码由6位组成,对应原分类中的大类、中类和小类并用小数点分割。

本文件UNSPSC代码为“43.23.34”,由3段组成。其中:第1段为大类,“43”表示“信息技术广播和电信”,第2段为中类,“23”表示“软件”,第3段为小类,“34”表示“实用程序和设备驱动程序软件”。

T/UNP253

T/UNP253—2024

T/UNP253

T/UNP253—2024

PAGE

PAGE1

PAGE

PAGE2

语音数据标注系统技术规范

范围

本文件规定了语音数据标注系统的系统架构、功能要求、性能要求、数据要求、安全要求、运维要求和评价与改进。

本文件适用于规范语音数据标注系统的设计与建设。

规范性引用文件

本文件没有规范性引用文件。

术语、定义和缩略语

术语和定义

下列术语和定义适用于本文件。

3.1.1

数据标注 datalabeling

给数据样本指定目标变量和赋值的过程。[来源:GB/T42755—2023,3.1]

3.1.2

语音识别 speechrecognition

将人类的声音信号转化为文字或指令的过程。[来源:GB/T21023—2007,3.1]