基本信息
文件名称:2025年大数据分析应用考试题库及答案.docx
文件大小:29.79 KB
总页数:21 页
更新时间:2025-09-10
总字数:约8.55千字
文档摘要

2025年大数据分析应用考试题库及答案

一、单项选择题

1.以下哪种数据格式常用于存储大数据,并且具有自我描述性和灵活性?

A.CSV

B.XML

C.JSON

D.Parquet

答案:D。Parquet是一种列式存储格式,具有自我描述性和灵活性,适合大数据存储和处理。CSV是简单的文本格式,缺乏自我描述性;XML和JSON常用于数据交换,但在大数据存储方面,Parquet的性能更优。

2.在Hadoop生态系统中,负责资源管理和任务调度的是?

A.HDFS

B.MapReduce

C.YARN

D.HBase

答案:C。YARN负责Hadoop集