基本信息
文件名称:大数据工程师面试题及答案好用宝典.docx
文件大小:40.67 KB
总页数:10 页
更新时间:2025-12-29
总字数:约4.12千字
文档摘要

第PAGE页共NUMPAGES页

2026年大数据工程师面试题及答案好用宝典

一、选择题(共5题,每题2分)

1.在Hadoop生态系统中,以下哪个组件主要用于分布式存储?

A.HBase

B.Hive

C.HDFS

D.YARN

2.下列哪种算法不适合用于大规模数据集的聚类分析?

A.K-Means

B.DBSCAN

C.HierarchicalClustering

D.Apriori

3.在Spark中,以下哪个操作属于转换操作(Transformation)?

A.`collect()`

B.`map()`

C.`reduce()`

D.`t