基本信息
文件名称:大数据工程师面试题及答案好用宝典.docx
文件大小:40.67 KB
总页数:10 页
更新时间:2025-12-29
总字数:约4.12千字
文档摘要
第PAGE页共NUMPAGES页
2026年大数据工程师面试题及答案好用宝典
一、选择题(共5题,每题2分)
1.在Hadoop生态系统中,以下哪个组件主要用于分布式存储?
A.HBase
B.Hive
C.HDFS
D.YARN
2.下列哪种算法不适合用于大规模数据集的聚类分析?
A.K-Means
B.DBSCAN
C.HierarchicalClustering
D.Apriori
3.在Spark中,以下哪个操作属于转换操作(Transformation)?
A.`collect()`
B.`map()`
C.`reduce()`
D.`t