开放系统《大数据技术概论》期末机考真题及答案(第101套)
(试卷号:24154,前5-10个题相同则整套相同,Ctrl+F查找更快捷,祝同学们取得优异成绩!)
第一大题、判断题
1、在数据分析中,数据可视化只是—种辅助工具,不具有实际的分析功能。(答案附试卷后)
2、大数据在诸如消费者行为监测、市场趋势分析等—系列商业领域都有广泛的应用。(答案附试
卷后)
3、聚类分析是—种常用的无监督学习方法,用于发现数据集中的模式或结构。(答案附试卷后)
4、MapReduce可以通过在存储数据的节点上进行有效地任务调度来减少对网络资源的浪费,并且
因为所有节点都在并行处理数据,可以大幅度缩短处理时间。(答案附试卷后)
5、关系数据库是用来存储和访问具有彼此相关性数据的数据库。(答案附试卷后)
6、大数据预处理阶段不包括数据插补步骤。(答案附试卷后)
7、数据预处理的—种方法是数据归—化,它将所有数据缩放到—个固定的范围中,以消除数据之
间的尺度差异。(答案附试卷后)
8、黑客技术的非法入侵是大数据隐私保护所面临的主要威胁之—。(答案附试卷后)
9、数据可视化的作用仅限千将抽象的数据进行可视表达,无法帮助我们发现数据中的规律和特
征。(答案附试卷后)
10、大数据科学不仅包括数据采集和数据分析,还涵括数据预处理、数据存储和数据管理等环节。
(答案附试卷后)
第二大题、单选题
1、按照预先设定的搜索规则,编写程序自动浏览并下载目标网页信息的数据采集方法称作(答案
附试卷后)
【A】系统日志信息数据采集方法
【B】ETL工具数据采集方法
(C】网络爬虫数据采集方法
【D】传感器数据采集方法
2、。
下列关千离散化改处理的描述中,错误的是(答案附试卷后)
【A]离散化处理可以提高大数据处理的效率
(Bl在调查问卷中,离散化处理可以得到更高的响应率
(C】数据经过离散化后,可以获得更好的模型解释性
(D]离散化处理不会影响预测精度
3、分位数分组的基本思想是将样本(答案附试卷后),各组所包含的样本个数相同。
【A】等分成若干份
【B】按属性值大小排序
【C】随机分组
【D】按序分组
4、下列数据库中,属于文档数据库的是(答案附试卷后)。
【A】:Redis
【B】:Neo4j
【C】:HBase
【D】:MongoDB
5、HDFS中,如何确保数据的可靠性?(答案附试卷后)
【A】不断增加数据的存储空间
【B】对数据进行冗余存储,即保存多个数据备份,并将这些备份存储到不同的节点
【】将所有数据存储在—台计算机服务器上
【D]频繁清理数据
6、在Hadoop的HDFS架构中,以下哪项功能不是主节点(NameNode)的职责(答案附试卷
后)?
【A】管理文件系统命名空间
【B]维护文件系统树及元数据
(】存储实际的数据块
(D]管理文件系统的客户端应用
7、在Hadoop生态系统中,主要负责跨节点存储结构化或非结构化数据,并以日志文件的形式管理
数据的组件是(答案附试卷后)。
:
【A】HDFS
【B】:MapReduce
【C】:YARN