基本信息
文件名称:国开电大4399大数据分析与挖掘技术形考任务答案解析.docx
文件大小:55.66 KB
总页数:51 页
更新时间:2025-08-30
总字数:约3.09万字
文档摘要

国开电大4399大数据分析与挖掘技术形考任务答案解析

一、单选题(共50题)

1.

在大数据预处理过程中,以下哪项操作主要用于处理缺失值?

A.数据标准化

B.数据归一化

C.均值填补

D.主成分分析

【选项】

A.数据标准化

B.数据归一化

C.均值填补

D.主成分分析

【参考答案】C

【解析】均值填补是处理缺失值的常用方法,通过用变量的平均值替换缺失值以减少数据偏差。A、B选项为数据缩放方法,用于消除量纲影响;D选项为降维技术,与缺失值处理无关。

2.

关于K均值聚类算法,以下描述正确的是:

A.属于层次聚类方法

B.需要预先指定聚类数量

C.对异常值不敏感