基本信息
文件名称:2025年大数据试题及答案.docx
文件大小:24.94 KB
总页数:15 页
更新时间:2026-03-21
总字数:约5.62千字
文档摘要

2025年大数据试题及答案

一、单项选择题(每题2分,共20分)

1.以下关于HDFS副本机制的描述中,错误的是()

A.默认副本数为3

B.第一个副本存储在客户端所在节点(若客户端不在集群中则随机选择)

C.第二个副本存储在与第一个副本不同的机架

D.第三个副本存储在与第二个副本相同的机架

2.Spark中,RDD的transformation操作是()

A.立即执行并提供结果

B.延迟执行,构建计算血缘

C.直接触发Shuffle过程

D.仅支持窄依赖操作

3.数据倾斜(DataSkew)的典型表现是()

A.任务执