基本信息
文件名称:大数据处理技能实战测试与答案分析.docx
文件大小:40.5 KB
总页数:14 页
更新时间:2025-09-15
总字数:约4.47千字
文档摘要
第PAGE页共NUMPAGES页
大数据处理技能实战测试与答案分析
#大数据处理技能实战测试
一、单选题(共10题,每题2分)
1.下列哪种存储格式最适合进行大数据量、低延迟的实时查询?
A.Parquet
B.Avro
C.ORC
D.CSV
2.在Hadoop生态中,负责分布式文件存储系统的组件是?
A.YARN
B.Hive
C.HDFS
D.MapReduce
3.以下哪种算法通常用于大规模数据集的聚类分析?
A.决策树
B.K-Means
C.朴素贝叶斯
D.逻辑回归
4.Spark中,哪种模式适合交互式数据分析和探索?
A.离线批处