基本信息
文件名称:2025年知识竞赛-大数据智能办公系统知识考试近5年真题集锦(频考类试题)带答案.docx
文件大小:29.48 KB
总页数:19 页
更新时间:2025-05-27
总字数:约8.54千字
文档摘要

(图片大小可自由调整)

2025年知识竞赛-大数据智能办公系统知识考试近5年真题集锦(频考类试题)带答案

第I卷

一.参考题库(共80题)

1.函数在scala中的地位说法正确的有哪些选项()

A、一等公民

B、可以独立定义

C、不能独立定义

D、函数不能赋值给变量

2.sortWith会将所给的对象进行给定升降序排序,请说出下列程序输出结果为vala3=Array(4,5,100,7)B22valcs=a3.sortWith(__);for(jA、100754

B、457100

C、754100

D、541007

3.spark架构中会出现控制算子的原因是以下哪个选项()

A、spark备份的安全原因

B、spark用户的要求

C、兼容hive

D、兼容hbase

4.spark是由以下哪个机构研发出来的()

A、阿里学院

B、美国伯克利分校

C、麻省理工大学

D、复旦大学

5.spark中的图计算框架是()

A、sparkcore

B、sparkstreaming

C、mlbase

D、Grophx

6.Spark?是在?Scala?语言中实现的,它将?Scala?用作其应用程序框架

7.使用大部分语言编写的程序都可以和kafka服务器通信

8.etl处理完成的数据可以存在以下哪些组件中()

A、hdfs

B、hive

C、hbase

D、mapreduce

9.driver的特性的说法,哪些是正确的()

A、driver只有一个创建连接的功能

B、driver可以分发task任务

C、driver可以对task任务的执行情况进行检测

D、driver可以回收task运行的结果

10.以下哪些属于持久化算子?()

A、cache

B、persist

C、checkpoint

D、count

11.在scala中关于高阶函数描述错误的是:()

A、在程序中应该首先被定义的函数

B、将函数作为参数其他函数的参数使用

C、执行时间长的函数

D、函数的方法体比较长

12.安装Hbase的压缩包,使用的Linux命令是()

A、tar?-zxvf

B、tar?-zx

C、tar?-s

D、tar?-nf

13.Linux中重启系统的指令有哪些()

A、reboot

B、halt

C、shutdown-r

D、shutdown-h

14.flume架构中的sink组纪检能够将数据存储到hbase中

15.spark生态圈没有能够实时计算的框架

16.rdd是由一系列的什么组成的()

A、job

B、driver

C、partition

D、worker

17.Spark生态系统已经发展成为一个包含多个子项目的集合,其中包含SparkSQL、SparkStreaming、GraphX、MLlib等子项目

18.Hive?是建立在Hadoop?之上的,所有?Hive?的数据都是存储在HDFS?中的

19.在HBase框架中,下面哪些选项被使用()

A、HDFS

B、GridFS

C、Zookeeper

D、EXT3

20.以下组件哪个不是Flume的组成部分()

A、source

B、sink

C、channel

D、topic

21.flume的source可以获取哪些数据()

A、某个端口的文本数据

B、指定目录内的数据变更

C、基于http的数据源

D、其他agent传送过来的数据

22.agent组件中不包含哪个?()

A、source

B、sink

C、channel

D、broker

23.关于