基本信息
文件名称:2025年大数据工程师职业资格认证考试题库(附答案和详细解析)(1021).docx
文件大小:20.87 KB
总页数:12 页
更新时间:2025-11-06
总字数:约8.85千字
文档摘要
大数据工程师职业资格认证考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪项是Hadoop分布式文件系统(HDFS)的核心设计目标?
A.支持低延迟数据访问
B.处理海量小文件
C.高容错性和高吞吐量
D.支持事务性操作
答案:C
解析:HDFS的设计目标是为运行在通用硬件上的大规模数据集提供高容错性存储,并通过流式数据访问模式实现高吞吐量(C正确)。HDFS不适合低延迟访问(A错误),对小文件存储效率低(B错误),不支持事务性操作(D错误)。
以下哪个组件是Spark的核心抽象,用于表示不可变、可分区的分布式数据集?
A.DataFrame
B.RDD(弹性分布式数