基本信息
文件名称:2025年低质量标注数据清洗习题(含答案与解析).docx
文件大小:15.29 KB
总页数:11 页
更新时间:2025-09-08
总字数:约7.57千字
文档摘要
2025年低质量标注数据清洗习题(含答案与解析)
一、单选题(共15题)
1.在标注数据清洗过程中,以下哪种方法可以有效去除重复数据?
A.数据去重算法
B.数据标准化
C.数据增强
D.数据归一化
答案:A
解析:数据去重算法是标注数据清洗中去除重复数据的主要方法。通过比较数据记录之间的相似度,识别并删除重复的记录,可以减少数据冗余,提高后续处理效率。参考《数据清洗与预处理技术指南》2025版4.2节。
2.在进行多标签标注时,以下哪种方法有助于减少标注偏差?
A.人工标注
B.主动学习
C.多标签分类模型
D.标注数据清洗
答案:B
解析:主动学习通过让模型选