基本信息
文件名称:2026年数据分析与挖掘考试试题及答案.docx
文件大小:31 KB
总页数:17 页
更新时间:2026-03-29
总字数:约7.27千字
文档摘要

2026年数据分析与挖掘考试试题及答案

一、单项选择题(共10题,每题2分,共20分)

1.以下哪种方法最适用于处理数值型数据中的异常值?

A.直接删除异常值

B.用均值替代异常值

C.用上下四分位数区间(IQR)确定异常值范围后修正

D.将异常值标记为缺失值后填充

答案:C

解析:直接删除(A)可能导致数据丢失;均值替代(B)对极端值敏感;IQR方法(C)通过Q11.5IQR和Q3+1.5IQR确定合理范围,是处理数值型异常值的常用方法;标记为缺失值(D)需进一步填充,非最优。

2.在计算两个变量的相关系数时,若数据存在严重的非线性关系,以下哪种