基本信息
文件名称:2025年知识竞赛-大数据智能办公系统知识考试近5年真题荟萃附答案.docx
文件大小:29.1 KB
总页数:19 页
更新时间:2025-05-27
总字数:约8.06千字
文档摘要

(图片大小可自由调整)

2025年知识竞赛-大数据智能办公系统知识考试近5年真题荟萃附答案

第I卷

一.参考题库(共80题)

1.kafka是一个日志收集系统

2.spark读取hdfs数据是调用哪个技术实现的()

A、spark?core

B、spark?streaming

C、mapreduce

D、Grophx

3.下列关于set和list集合说法错误的是()

A、set集合无序可重复

B、list集合有序可重复

C、set集合有序不可重复

D、list集合有序不可重复

4.sorted会将所给的对象进行排序,请说出下列程序输出结果为vala3=Array(1,2,3,4,5,100,7)valcs=a3.sorted;for(jA、123457100

B、234571001

C、457100123

D、100754321

5.以下哪些属于数值类型?()

A、Int

B、String

C、Float

D、Long

6.下列选项中在scala中定义函数使用哪个关键字符()

A、=

B、=》

C、

7.Flume有两个主要的版本,目前使用的版本是哪个()

A、NG版本

B、OG版本

C、DG版本

D、MG版本

8.编写spark源码的是以下哪几种语言()

A、本地(local模式)

B、stanalone模式

C、yarn模式

D、mesos模式

9.DAG调度器会将结果以什么样的形式传给Task调度器()

A、TaskSet

B、Task

C、DAG

D、Job

10.一定要在第一行调用主构造器

11.spark中弹性分布式数据集指的是哪个()

A、RDD

B、Driver

C、Master

D、Map

12.driver的作用包括和worker建立相应的连接

13.reduce求和输出结果为varlist1=list1(1,2,3,4)varsum=list1.reduce(_+_)println(sum)()

A、10

B、1

C、4

D、以上答案都不对

14.有一段如下代码,其中打印出来结果先后顺序为println(lazy变量演示)lazyvalls={println(I’mtoolazy)}println(afterlazyVal)valshow=ls()

A、lazy变量演示afterlazyValI’mtoolazy

B、lazy变量演示I’mtoolazyafterlazyVal

C、I’mtoolazylazy变量演示afterlazyVal

D、afterlazyVallazy变量演示I’mtoolazy

15.在scala中所有类型都继承自Object

16.Spark对比Hadoop来说有如下优势?()

A、以Java虚拟机为目标运行环境将面向对象和函数式编程语言完美结合

B、使用Scala可编写出更加精简优雅的程序

C、Scala的并发编程非常强大

D、Scala可以访问任何Java类库,从而不用一切从头开始

17.interSection算子对源RDD和参数RDD求交集后返回一个新的RDD

18.spring中关于bean的说法错误的是()

A、bean的创建和spring没有关系

B、都是通过new出来的

C、其实例保存在spring容器中

D、在spring技术中是基于组件的

19.在scala中如果使用for循环,其格式必须如下for(vari=0;i10;i++){}

20.函数可以作为返回值

21.DataFrames配合JDBC,它还可以读取外部关系型数据库系统

22.一个application就是一个spark程序

23.在scala中对于列表的操作,那些说法说法正确vart=List(1,2,3)vart2=List(4,5