基本信息
文件名称:2025年大模型训练数据清洗去噪试题答案及解析.docx
文件大小:14.65 KB
总页数:7 页
更新时间:2025-09-29
总字数:约6.32千字
文档摘要

2025年大模型训练数据清洗去噪试题答案及解析

一、单选题(共15题)

1.在数据清洗过程中,以下哪种方法可以有效去除数据集中的异常值?

A.使用标准差筛选法

B.使用中位数筛选法

C.使用四分位数筛选法

D.以上都是

2.以下哪种技术可以帮助大模型在训练过程中去除噪声数据?

A.数据增强

B.数据清洗

C.模型正则化

D.优化器调整

3.在处理大规模数据集时,以下哪种数据清洗策略最为高效?

A.硬删除

B.软删除

C.数据抽样

D.数据分区

4.以下哪项不是数据清洗中的去噪步骤?

A.去除重复记录

B.去除缺失值

C.数据归一化

D.去除异常值

5