基本信息
文件名称:2026年数据挖掘师岗位数据清洗处理考试试题及答案解析.docx
文件大小:30.36 KB
总页数:13 页
更新时间:2026-03-24
总字数:约5.57千字
文档摘要

2026年数据挖掘师岗位数据清洗处理考试试题及答案解析

一、单项选择题(共10题,每题2分,共20分)

1.以下哪项不属于数据清洗的核心目标?

A.消除数据中的噪声

B.纠正数据中的错误

C.直接提升模型预测精度

D.统一数据格式

2.某医疗数据集的“血糖值”字段中,缺失值的出现与“是否患有糖尿病”字段强相关,但与“血糖值”本身无关,这种缺失类型属于?

A.MCAR(完全随机缺失)

B.MAR(随机缺失)

C.MNAR(非随机缺失)

D.系统性缺失

3.以下哪种方法最适合检测服从正态分布的数值型数据中的异常值?

A.箱线图