基本信息
文件名称:大数据开发工程师招聘笔试题与参考答案(某大型国企)2025年.docx
文件大小:27.98 KB
总页数:14 页
更新时间:2025-11-02
总字数:约6.05千字
文档摘要

大数据开发工程师招聘笔试题与参考答案(某大型国企)2025年

一、基础理论题(共30分)

1.分布式存储与计算(10分)

(1)HDFS的默认副本机制是什么?NameNode如何管理数据块位置?若集群中某DataNode宕机,HDFS如何保证数据可用性?

(2)对比SparkRDD与FlinkDataStream的设计理念差异,说明各自适用的业务场景。

2.数据处理模型(10分)

(1)简述Hive的元数据存储架构,若Hive元数据库宕机,对正在运行的MapReduce任务有何影响?为什么?

(2)Kafka的ISR(In-SyncReplicas)机制