基本信息
文件名称:2026最新大数据分析师数据挖掘案例真题题库试题及答案.docx
文件大小:30.51 KB
总页数:16 页
更新时间:2026-03-30
总字数:约7.27千字
文档摘要

2026最新大数据分析师数据挖掘案例练习题题库试题及答案

一、单项选择题(每题2分,共20分)

1.在数据清洗过程中,处理缺失值时若某特征缺失率超过70%且无法通过业务逻辑补全,最合理的处理方式是()

A.用均值填充

B.用中位数填充

C.直接删除该特征

D.用随机森林预测填充

答案:C

解析:当特征缺失率过高(通常超过70%)且无业务意义时,保留该特征会引入大量噪声,删除是更优选择。

2.以下哪种方法不属于特征工程中的降维技术?()

A.主成分分析(PCA)

B.线性判别分析(LDA)

C.独热编码(OneHotEncoding)