基本信息
文件名称:数据预处理与特征工程方法原理及 Python 实践知到智慧树期末考试答案题库2025年华东师范大学.docx
文件大小:14.81 KB
总页数:7 页
更新时间:2025-06-03
总字数:约4.42千字
文档摘要

数据预处理与特征工程方法原理及Python实践知到智慧树期末考试答案题库2025年华东师范大学

随机选出1个少数类样本观测,取值为a;找出其k个邻居,从k个邻居中任选1个邻居,其取值为b;生成(0,1)中的随机数r;将a+r*(b-a)加入数据集之中。这一方法属于()。

答案:过采样

随机回归插补是在()的基础上引入随机性。

答案:预测值

重复值、无效值和错误值都属于脏数据,可能导致后续数据分析结果不准确,一般可以通过删除或替换予以处理。()

答案:对

采用等频分组方法将一个变量取值分为4个区间,应采用的分割点为()。

答案:25%、50%、75%分位数

采用局部离群点因子方法识别