基本信息
文件名称:2025年大模型训练数据清洗去噪专项卷答案及解析.docx
文件大小:15.63 KB
总页数:7 页
更新时间:2025-09-26
总字数:约7.01千字
文档摘要

2025年大模型训练数据清洗去噪专项卷答案及解析

一、单选题(共15题)

1.以下哪项操作是数据清洗去噪过程中的关键步骤?

A.数据抽样

B.填充缺失值

C.特征选择

D.数据标注

2.在大模型训练数据清洗过程中,如何处理类别不平衡的数据集?

A.使用权重调整

B.过采样

C.降采样

D.丢弃少数类样本

3.在处理大规模数据集时,哪种方法可以减少内存消耗并提高处理速度?

A.数据压缩

B.数据去重

C.数据分区

D.数据索引

4.在清洗文本数据时,如何去除停用词?

A.使用正则表达式

B.使用NLP库函数

C.手动编写规则

D.以上都是

5.以下哪