基本信息
文件名称:2025年大模型训练数据清洗去噪试题答案及解析.docx
文件大小:14.65 KB
总页数:7 页
更新时间:2025-09-29
总字数:约6.32千字
文档摘要
2025年大模型训练数据清洗去噪试题答案及解析
一、单选题(共15题)
1.在数据清洗过程中,以下哪种方法可以有效去除数据集中的异常值?
A.使用标准差筛选法
B.使用中位数筛选法
C.使用四分位数筛选法
D.以上都是
2.以下哪种技术可以帮助大模型在训练过程中去除噪声数据?
A.数据增强
B.数据清洗
C.模型正则化
D.优化器调整
3.在处理大规模数据集时,以下哪种数据清洗策略最为高效?
A.硬删除
B.软删除
C.数据抽样
D.数据分区
4.以下哪项不是数据清洗中的去噪步骤?
A.去除重复记录
B.去除缺失值
C.数据归一化
D.去除异常值
5