基本信息
文件名称:2026最新大数据分析师数据挖掘真题及答案.docx
文件大小:32.62 KB
总页数:15 页
更新时间:2026-03-28
总字数:约6.7千字
文档摘要

2026最新大数据分析师数据挖掘练习题及答案

一、单项选择题(共10题,每题2分,共20分)

1.在数据预处理中,针对“年龄”字段的缺失值(缺失比例15%),且该字段与目标变量高度相关时,最合理的处理方法是()。

A.直接删除缺失行

B.用全局均值填充

C.用同类别(如性别)的均值填充

D.用随机值填充

2.以下哪个指标用于衡量分类模型对正类样本的识别能力?()

A.准确率(Accuracy)

B.精确率(Precision)

C.召回率(Recall)

D.F1值

3.Kmeans算法的核心目标是最小化()。

A.