基本信息
文件名称:2025年大数据试题及答案.docx
文件大小:24.94 KB
总页数:15 页
更新时间:2026-03-21
总字数:约5.62千字
文档摘要
2025年大数据试题及答案
一、单项选择题(每题2分,共20分)
1.以下关于HDFS副本机制的描述中,错误的是()
A.默认副本数为3
B.第一个副本存储在客户端所在节点(若客户端不在集群中则随机选择)
C.第二个副本存储在与第一个副本不同的机架
D.第三个副本存储在与第二个副本相同的机架
2.Spark中,RDD的transformation操作是()
A.立即执行并提供结果
B.延迟执行,构建计算血缘
C.直接触发Shuffle过程
D.仅支持窄依赖操作
3.数据倾斜(DataSkew)的典型表现是()
A.任务执