基本信息
文件名称:2025年大数据类试题和答案.docx
文件大小:25.82 KB
总页数:15 页
更新时间:2026-03-22
总字数:约5.67千字
文档摘要
2025年大数据类试题和答案
一、单项选择题(每题2分,共20分)
1.以下哪项不属于数据清洗的主要目的?
A.去除重复数据
B.填充缺失值
C.减少数据存储量
D.纠正数据中的错误格式
答案:C
2.HDFS默认的块大小在2025年主流配置中通常为?
A.32MB
B.64MB
C.128MB
D.256MB
答案:D(注:随硬件发展,2025年HDFS块大小普遍提升至256MB以降低元数据管理开销)
3.关于SparkRDD的特性,以下描述错误的是?
A.不可变性(Immutable)
B.自动容错(Faul