基本信息
文件名称:2026最新大数据分析师数据挖掘案例真题题库试题及答案.docx
文件大小:30.51 KB
总页数:16 页
更新时间:2026-03-30
总字数:约7.27千字
文档摘要
2026最新大数据分析师数据挖掘案例练习题题库试题及答案
一、单项选择题(每题2分,共20分)
1.在数据清洗过程中,处理缺失值时若某特征缺失率超过70%且无法通过业务逻辑补全,最合理的处理方式是()
A.用均值填充
B.用中位数填充
C.直接删除该特征
D.用随机森林预测填充
答案:C
解析:当特征缺失率过高(通常超过70%)且无业务意义时,保留该特征会引入大量噪声,删除是更优选择。
2.以下哪种方法不属于特征工程中的降维技术?()
A.主成分分析(PCA)
B.线性判别分析(LDA)
C.独热编码(OneHotEncoding)