2024年ict大数据考试模拟题及答案(附解析)
一、单选题(共60题,每题1分,共60分)
1.以下哪些选项不属于大数据时代到来的必要条件?
A、网络带宽提升
B、存储设备容量提升
C、CPU计算性能提升
D、超级计算机的出现
正确答案:D
答案解析:大数据时代到来的必要条件包括网络带宽提升以支持数据的快速传输、存储设备容量提升以存储海量数据、CPU计算性能提升以处理大规模数据。超级计算机在大数据时代之前就已出现,它不是大数据时代到来的必要条件。
2.不属于日常监控告警的级别的选项是:()。
A、次重要告警
B、重要告警
C、普通告警
D、紧急告警
正确答案:C
3.关于Kerberos的TGT以下说法错误的是:()。
A、TGT全称为票据授权服务票据,主要由KDC服务器生成
B、TGT一次生成之后,可以无限期使用。
C、TGT在客户端的存在方式可以是在内存中存储,也可以在本地以文件的形式存储。
D、TGT中主要的信息有当前该票据的有效时长和授予该TGT的服务端IP以及分发给的客户端名称。
正确答案:B
答案解析:TGT全称为票据授权服务票据,主要由KDC服务器生成,选项A正确。TGT是有一定有效期的,不是可以无限期使用,选项B错误。TGT在客户端的存在方式可以是在内存中存储,也可以在本地以文件的形式存储,选项C正确。TGT中主要的信息有当前该票据的有效时长和授予该TGT的服务端IP以及分发给的客户端名称,选项D正确。
4.下列哪项设备用于数据库审计()。
A、DAS
B、VSCAN
C、UMA
D、ASG
正确答案:A
5.若采用留出法将数据集D划分为训练集S和测试集T,其中D包含1300个样本,S包含700个样本,模型在T上有60个样本分类错误,那么该模型的精度为(____)。
A、95.40%
B、90%
C、10%
D、4.90%
正确答案:B
答案解析:首先计算测试集T的样本数量,T=D-S=1300-700=600个样本。然后计算正确分类的样本数,为600-60=540个样本。精度=正确分类的样本数/测试集样本数=540/600=0.9,即90%。所以该模型的精度大于90%,答案选B。
6.DRS查看迁移任务中的迁移日志,不能看到的是:()。
A、创建用户
B、时间
C、级别
D、描述
正确答案:A
答案解析:迁移日志中通常会记录时间、级别、描述等信息,用于反映迁移任务的执行情况和相关细节,但一般不会记录创建用户的操作内容。
7.一般情况下,若要提高Elasticsearch检索效率,可以采取什么操作?
A、增加EsMaster节点
B、使用Hive做底层存储
C、调整索引分片数
D、压缩索引
正确答案:C
答案解析:在Elasticsearch中,调整索引分片数是提高检索效率的一种有效操作。合理的分片数设置可以使数据分布更均匀,减少单个分片的数据量,从而加快检索速度。增加EsMaster节点不一定能直接提高检索效率,还可能带来管理复杂度增加等问题。使用Hive做底层存储与Elasticsearch本身提高检索效率并无直接关联。压缩索引虽然能减少存储空间,但不一定能显著提高检索效率。
8.Apriori是一种(____)算法。
A、关联分析
B、聚类分析
C、决策树
D、强化学习
正确答案:A
答案解析:Apriori算法是一种用于关联分析的算法,用于发现数据集中项集之间的关联关系。它通过逐层搜索的方式,从候选频繁项集中找出真正的频繁项集,从而挖掘出有价值的关联规则。聚类分析是将数据对象分组为不同的类或簇;决策树是基于树结构进行决策的方法;强化学习是智能体在环境中通过不断试错来学习最优策略的过程。这些都与Apriori算法的功能不同。
9.虚拟机镜像默认会安装如下组件,其中()组件可优化虚拟机IO性能。
A、VMTool
B、CLOUD-INIT
C、NTP
D、SSH
正确答案:A
答案解析:VMTool是一款VMware提供的增强工具包,安装后可以优化虚拟机的性能,包括提升虚拟机的图形显示性能、增强虚拟机与主机之间的文件共享、优化虚拟机的IO性能等。CLOUD-INIT主要用于云环境下的初始化配置。NTP用于网络时间协议,确保系统时间准确。SSH是用于远程登录和文件传输的协议,它们都不主要用于优化虚拟机IO性能。
10.以下()数据不属于半结构化数据。
A、HTML
B、XML
C、二维表
D、JSON
正确答案:C
答案解析:半结构化数据是介于完全结构化数据(如关系型数据库中的二维表数据)和无结构数据(如纯文本)之间的数据,它具有一定的结构,但不像完全结构化数据那样严格。HTML、XML、JSON都属于半结构化数据,而二维表是典型的结构化数