ict大数据习题库(附答案解析)
一、单选题(共30题,每题1分,共30分)
1.Flink的窗口,按窗口行为划分不包含以下哪种?
A、会话窗日
B、滑动窗口
C、容量窗口
D、滚动窗口
正确答案:C
答案解析:窗口按窗口行为划分主要有滚动窗口、滑动窗口和会话窗口,不包含容量窗口。
2.在FusionInsightHD中,以下()不属于Hive的流控特性。
A、支持对已建立的总连接数做阈值控制
B、支持对每个用户已经建立的连接数做阈值控制
C、支持对某个特定用户已建立的连接数做阈值控制
D、支持对单位时间内所建立的连接数做阈值控制
正确答案:C
答案解析:在FusionInsightHD中,Hive的流控特性包括支持对已建立的总连接数做阈值控制、支持对每个用户已经建立的连接数做阈值控制、支持对单位时间内所建立的连接数做阈值控制等,但不包括对某个特定用户已建立的连接数做阈值控制。
3.以下哪个适合运行在通用计算型弹性云服务器实例上?
A、大型游戏
B、轻量级数据库
C、机器学习
D、超大内存数据库
正确答案:B
答案解析:轻量级数据库对资源的需求相对较为适中,通用计算型弹性云服务器实例可以满足其运行要求。超大内存数据库通常需要专门的高内存型云服务器来提供足够的内存支持;大型游戏一般对图形处理能力等有较高要求,更适合图形处理型云服务器;机器学习任务可能需要强大的计算能力和并行处理能力,通用计算型弹性云服务器可能不太能充分满足其需求,可能更适合高性能计算型云服务器。
4.为保证流应用的快照存储的可靠性,快照主要存储在:()。
A、本地文件系统中
B、JobManager的内存中
C、HDFS中
D、可靠性高的单击数据库中
正确答案:C
答案解析:HDFS具有高容错性、高可扩展性等特点,能保证数据的可靠性存储。流应用的快照存储在HDFS中可以借助HDFS的这些特性来确保快照数据的可靠保存。本地文件系统相对来说可靠性不如HDFS;JobManager的内存易失,不能保证快照存储的可靠性;单机数据库也存在单点故障等问题,可靠性不如HDFS。
5.使用mysqldump导出数据时,通过()参数指定要迁移的数据库名称。
A、DB_NAME
B、DB_USER
C、DB_ADDRESS
D、DB_PORT
正确答案:A
答案解析:在使用mysqldump导出数据时,使用“DB_NAME”这样的格式指定要迁移的数据库名称。例如:mysqldump-u用户名-p密码数据库名导出文件名.sql,这里的数据库名就是具体要指定的要迁移的数据库名称。而B选项DB_USER是数据库用户,C选项DB_ADDRESS是数据库地址,D选项DB_PORT是数据库端口,均不符合题意。
6.关于虚拟网关的描述,以下错误的是?
A、删除虚拟网关时无需删除与其绑定的虚拟接口
B、虚拟网关绑定与用户本地数据中心连接的VPC
C、配置虚拟网关时,只可以配置与虚拟网关直连的VPC
D、虚拟网关是物理专线的接入路由器
正确答案:D
7.(____)是分类错误的样本数占样本总数的比例。
A、错误率
B、误差
C、精度
D、正确率
正确答案:A
答案解析:错误率是分类错误的样本数占样本总数的比例。而精度是分类正确的样本数占样本总数的比例;正确率表述不准确;误差是测量值与真实值之间的差异,与分类错误样本数占比无关。
8.数据库利用()进行死锁检测。
A、DAG
B、RPC
C、WFG
D、DLC
正确答案:C
9.关于Hive建表基本操作,描述正确的是:()。
A、一旦表建好,不可再修改表名
B、一旦表建好,不可再增加新列
C、创建外表时需要指定external关键字
D、一旦表建好,不可再修改列名
正确答案:C
答案解析:创建外表时需要指定external关键字。在Hive中,创建外表时确实需要使用external关键字来表明该表是外部表。而对于表名、列名等是可以进行修改的,比如使用ALTERTABLE语句可以修改表名、增加列、修改列名等操作。所以选项A、B、D错误。
10.以下()不属于VDC管理员权限。
A、管理云资源池
B、创建项目
C、设置阈值
D、导出应用
正确答案:A
11.当(____)时,可以不考虑RDD序列化处理。
A、完成成本比较高的操作后
B、执行容易失败的操作之前
C、RDD被重复利用
D、实时性要求高
正确答案:D
12.数据湖探索(DataLakeInsight,简称DLI)是支持以下()形式的大数据计算分析服务。
A、流式处理
B、批处理
C、流批一体
D、都不支持
正确答案:C
13.下列选项不支持创建采集元数据任务时添加数据分类,实现自动识别的为:()。
A、RDS(Mysql)
B、DWS
C、DLI