基本信息
文件名称:2025年低质量标注数据清洗习题(含答案与解析).docx
文件大小:15.29 KB
总页数:11 页
更新时间:2025-09-08
总字数:约7.57千字
文档摘要

2025年低质量标注数据清洗习题(含答案与解析)

一、单选题(共15题)

1.在标注数据清洗过程中,以下哪种方法可以有效去除重复数据?

A.数据去重算法

B.数据标准化

C.数据增强

D.数据归一化

答案:A

解析:数据去重算法是标注数据清洗中去除重复数据的主要方法。通过比较数据记录之间的相似度,识别并删除重复的记录,可以减少数据冗余,提高后续处理效率。参考《数据清洗与预处理技术指南》2025版4.2节。

2.在进行多标签标注时,以下哪种方法有助于减少标注偏差?

A.人工标注

B.主动学习

C.多标签分类模型

D.标注数据清洗

答案:B

解析:主动学习通过让模型选