基本信息
文件名称:国开电大4399大数据分析与挖掘技术形考任务答案解析.docx
文件大小:55.66 KB
总页数:51 页
更新时间:2025-08-30
总字数:约3.09万字
文档摘要
国开电大4399大数据分析与挖掘技术形考任务答案解析
一、单选题(共50题)
1.
在大数据预处理过程中,以下哪项操作主要用于处理缺失值?
A.数据标准化
B.数据归一化
C.均值填补
D.主成分分析
【选项】
A.数据标准化
B.数据归一化
C.均值填补
D.主成分分析
【参考答案】C
【解析】均值填补是处理缺失值的常用方法,通过用变量的平均值替换缺失值以减少数据偏差。A、B选项为数据缩放方法,用于消除量纲影响;D选项为降维技术,与缺失值处理无关。
2.
关于K均值聚类算法,以下描述正确的是:
A.属于层次聚类方法
B.需要预先指定聚类数量
C.对异常值不敏感