基本信息
文件名称:大数据处理技能实战测试与答案分析.docx
文件大小:40.5 KB
总页数:14 页
更新时间:2025-09-15
总字数:约4.47千字
文档摘要

第PAGE页共NUMPAGES页

大数据处理技能实战测试与答案分析

#大数据处理技能实战测试

一、单选题(共10题,每题2分)

1.下列哪种存储格式最适合进行大数据量、低延迟的实时查询?

A.Parquet

B.Avro

C.ORC

D.CSV

2.在Hadoop生态中,负责分布式文件存储系统的组件是?

A.YARN

B.Hive

C.HDFS

D.MapReduce

3.以下哪种算法通常用于大规模数据集的聚类分析?

A.决策树

B.K-Means

C.朴素贝叶斯

D.逻辑回归

4.Spark中,哪种模式适合交互式数据分析和探索?

A.离线批处