基本信息
文件名称:2026年数据分析师数据挖掘实践考核试题及答案.docx
文件大小:31.34 KB
总页数:17 页
更新时间:2026-03-25
总字数:约7.49千字
文档摘要

2026年数据分析师数据挖掘实践考核试题及答案

一、单项选择题(共10题,每题2分,共20分)

1.以下哪项是处理数据集中类别不平衡问题的常用方法?

A.对多数类进行上采样(Oversampling)

B.对少数类进行下采样(Undersampling)

C.调整分类阈值(ThresholdAdjustment)

D.对特征进行主成分分析(PCA)

2.在决策树算法中,若某特征的信息增益为0.3,基尼增益为0.2,则以下说法正确的是?

A.该特征对分类的贡献更大(基于信息增益准则)

B.基尼增益更适合连续型特征

C.信息增益倾向于选择取