基本信息
文件名称:《大数据导论》第五章测试题及参考答案.docx
文件大小:27.16 KB
总页数:14 页
更新时间:2025-09-19
总字数:约5.4千字
文档摘要
《大数据导论》第五章测试题及参考答案
一、单项选择题(每题2分,共10分)
1.以下关于分布式计算框架的描述中,错误的是()。
A.MapReduce通过“分而治之”思想将任务分解为Map和Reduce阶段
B.Spark的RDD(弹性分布式数据集)支持内存计算,适合迭代式算法
C.Flink是基于微批处理的流处理框架,而Storm是真正的实时流处理框架
D.HadoopYARN负责资源管理和任务调度,分离了计算资源与应用逻辑
2.大数据处理中,数据清洗的核心目标是()。
A.减少数据存储量
B.消除数据中的噪声、缺失值和不一致性
C