(图片大小可自由调整)
2025年知识竞赛-大数据智能办公系统知识考试近5年真题荟萃附答案
第I卷
一.参考题库(共80题)
1.kafka是一个日志收集系统
2.spark读取hdfs数据是调用哪个技术实现的()
A、spark?core
B、spark?streaming
C、mapreduce
D、Grophx
3.下列关于set和list集合说法错误的是()
A、set集合无序可重复
B、list集合有序可重复
C、set集合有序不可重复
D、list集合有序不可重复
4.sorted会将所给的对象进行排序,请说出下列程序输出结果为vala3=Array(1,2,3,4,5,100,7)valcs=a3.sorted;for(jA、123457100
B、234571001
C、457100123
D、100754321
5.以下哪些属于数值类型?()
A、Int
B、String
C、Float
D、Long
6.下列选项中在scala中定义函数使用哪个关键字符()
A、=
B、=》
C、
7.Flume有两个主要的版本,目前使用的版本是哪个()
A、NG版本
B、OG版本
C、DG版本
D、MG版本
8.编写spark源码的是以下哪几种语言()
A、本地(local模式)
B、stanalone模式
C、yarn模式
D、mesos模式
9.DAG调度器会将结果以什么样的形式传给Task调度器()
A、TaskSet
B、Task
C、DAG
D、Job
10.一定要在第一行调用主构造器
11.spark中弹性分布式数据集指的是哪个()
A、RDD
B、Driver
C、Master
D、Map
12.driver的作用包括和worker建立相应的连接
13.reduce求和输出结果为varlist1=list1(1,2,3,4)varsum=list1.reduce(_+_)println(sum)()
A、10
B、1
C、4
D、以上答案都不对
14.有一段如下代码,其中打印出来结果先后顺序为println(lazy变量演示)lazyvalls={println(I’mtoolazy)}println(afterlazyVal)valshow=ls()
A、lazy变量演示afterlazyValI’mtoolazy
B、lazy变量演示I’mtoolazyafterlazyVal
C、I’mtoolazylazy变量演示afterlazyVal
D、afterlazyVallazy变量演示I’mtoolazy
15.在scala中所有类型都继承自Object
16.Spark对比Hadoop来说有如下优势?()
A、以Java虚拟机为目标运行环境将面向对象和函数式编程语言完美结合
B、使用Scala可编写出更加精简优雅的程序
C、Scala的并发编程非常强大
D、Scala可以访问任何Java类库,从而不用一切从头开始
17.interSection算子对源RDD和参数RDD求交集后返回一个新的RDD
18.spring中关于bean的说法错误的是()
A、bean的创建和spring没有关系
B、都是通过new出来的
C、其实例保存在spring容器中
D、在spring技术中是基于组件的
19.在scala中如果使用for循环,其格式必须如下for(vari=0;i10;i++){}
20.函数可以作为返回值
21.DataFrames配合JDBC,它还可以读取外部关系型数据库系统
22.一个application就是一个spark程序
23.在scala中对于列表的操作,那些说法说法正确vart=List(1,2,3)vart2=List(4,5