基本信息
文件名称:2025年大模型训练数据清洗去噪专项卷答案及解析.docx
文件大小:15.63 KB
总页数:7 页
更新时间:2025-09-26
总字数:约7.01千字
文档摘要
2025年大模型训练数据清洗去噪专项卷答案及解析
一、单选题(共15题)
1.以下哪项操作是数据清洗去噪过程中的关键步骤?
A.数据抽样
B.填充缺失值
C.特征选择
D.数据标注
2.在大模型训练数据清洗过程中,如何处理类别不平衡的数据集?
A.使用权重调整
B.过采样
C.降采样
D.丢弃少数类样本
3.在处理大规模数据集时,哪种方法可以减少内存消耗并提高处理速度?
A.数据压缩
B.数据去重
C.数据分区
D.数据索引
4.在清洗文本数据时,如何去除停用词?
A.使用正则表达式
B.使用NLP库函数
C.手动编写规则
D.以上都是
5.以下哪