基本信息
文件名称:数据标注实训(中级)课件 ch04 语音采集与质检实训.pptx
文件大小:11.19 MB
总页数:31 页
更新时间:2025-08-20
总字数:约5.33千字
文档摘要

语音采集与质检实训

数据标注实训(中级)

第四章

认识语音采集

认识语音采集

语音采集是语音标注中常见的任务类型,其主要目的是为特定场景下的语音智能技术落地提供基础数据。语音采集的任务,简单来说就是录语音。语音的录制通常采用普通录音设备即可,例如手机录音、录音笔等。采集得到的语音数据通常被用于AI语音识别、唤醒、对话等不同领域。

一般来说,语音采集对于环境、语种、语速等都是有严格要求的,并且不同的任务细节要求也是不同的,但整体的采集方式、原则及属性要求等是大同小异的。常见的要求有如下几方面:

(1)语音采集要注意选择合适的内容且语速适中;

(2)采集过程中要避免错读、多读、漏读、咳嗽、卡顿