2025年知识竞赛-大数据智能办公系统知识考试近5年真题荟萃附答案.docx

基本信息

文件名称：2025年知识竞赛-大数据智能办公系统知识考试近5年真题荟萃附答案.docx

文件大小：29.1 KB

总页数：19 页

更新时间：2025-05-27

总字数：约8.06千字

文档摘要

（图片大小可自由调整）

2025年知识竞赛-大数据智能办公系统知识考试近5年真题荟萃附答案

第I卷

一.参考题库(共80题)

1.kafka是一个日志收集系统

2.spark读取hdfs数据是调用哪个技术实现的（）

A、spark？core

B、spark？streaming

C、mapreduce

D、Grophx

3.下列关于set和list集合说法错误的是（）

A、set集合无序可重复

B、list集合有序可重复

C、set集合有序不可重复

D、list集合有序不可重复

4.sorted会将所给的对象进行排序，请说出下列程序输出结果为vala3=Array（1，2，3，4，5，100，7）valcs=a3.sorted；for（jA、123457100

B、234571001

C、457100123

D、100754321

5.以下哪些属于数值类型？（）

A、Int

B、String

C、Float

D、Long

6.下列选项中在scala中定义函数使用哪个关键字符（）

A、=

B、=》

C、

7.Flume有两个主要的版本，目前使用的版本是哪个（）

A、NG版本

B、OG版本

C、DG版本

D、MG版本

8.编写spark源码的是以下哪几种语言（）

A、本地（local模式）

B、stanalone模式

C、yarn模式

D、mesos模式

9.DAG调度器会将结果以什么样的形式传给Task调度器（）

A、TaskSet

B、Task

C、DAG

D、Job

10.一定要在第一行调用主构造器

11.spark中弹性分布式数据集指的是哪个（）

A、RDD

B、Driver

C、Master

D、Map

12.driver的作用包括和worker建立相应的连接

13.reduce求和输出结果为varlist1=list1（1，2，3，4）varsum=list1.reduce（_+_）println（sum）（）

A、10

B、1

C、4

D、以上答案都不对

14.有一段如下代码，其中打印出来结果先后顺序为println（lazy变量演示）lazyvalls={println（I’mtoolazy）}println（afterlazyVal）valshow=ls（）

A、lazy变量演示afterlazyValI’mtoolazy

B、lazy变量演示I’mtoolazyafterlazyVal

C、I’mtoolazylazy变量演示afterlazyVal

D、afterlazyVallazy变量演示I’mtoolazy

15.在scala中所有类型都继承自Object

16.Spark对比Hadoop来说有如下优势？（）

A、以Java虚拟机为目标运行环境将面向对象和函数式编程语言完美结合

B、使用Scala可编写出更加精简优雅的程序

C、Scala的并发编程非常强大

D、Scala可以访问任何Java类库，从而不用一切从头开始

17.interSection算子对源RDD和参数RDD求交集后返回一个新的RDD

18.spring中关于bean的说法错误的是（）

A、bean的创建和spring没有关系

B、都是通过new出来的

C、其实例保存在spring容器中

D、在spring技术中是基于组件的

19.在scala中如果使用for循环，其格式必须如下for（vari=0；i10；i++）{}

20.函数可以作为返回值

21.DataFrames配合JDBC，它还可以读取外部关系型数据库系统

22.一个application就是一个spark程序

23.在scala中对于列表的操作，那些说法说法正确vart=List（1，2，3）vart2=List（4，5