(图片大小可自由调整)
2025年商业经济行业技能考试-数据挖掘工程师考试近5年真题荟萃附答案
第I卷
一.参考题库(共80题)
1.ROLAP是基于()的OLAP实现,而MOLAP是基于多维数据结构组织的OLAP实现。
2.简述联机分析处理的四个特征?
3.给定基本方体,方体的物化有三种选择:()、()和()
4.下面的数据挖掘的任务中,()将决定所使用的数据挖掘功能。
A、选择任务相关的数据
B、选择要挖掘的知识类型
C、模式的兴趣度度量
D、模式的可视化表示
5.常见的聚类算法可以分为几类?
6.为什么朴素贝叶斯分类称为“朴素”的?简述朴素贝叶斯分类优缺点。
7.考虑如下的频繁3-项集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。 (a)根据Apriori算法的候选项集生成方法,写出利用频繁3-项集生成的所有候选4-项集。 (b)写出经过剪枝后的所有候选4-项集。
8.定量属性可以是整数值或者是连续值。
9.数据仓库在技术上的工作过程是()。
A、数据的抽取
B、存储和管理
C、数据的表现
D、数据仓库设计
10.数据归约的目的是()。
A、填补数据种的空缺值
B、集成多个数据源的数据
C、得到数据集的压缩表示
D、规范化数据
11.计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?()
A、算术平均值
B、截尾均值
C、中位数
D、众数
12.以下属于分类器评价或比较尺度的有()。
A、预测准确度
B、召回率
C、模型描述的简洁度
D、计算复杂度
13.数据挖掘技术对聚类分析的要求有哪几个方面?
14.下面哪种分类方法是属于神经网络学习算法?()
A、判定树归纳
B、贝叶斯分类
C、后向传播分类
D、基于案例的推理
15.何谓粒度?它对数据仓库有什么影响?按粒度组织数据的方式有哪些?
16.简述数据分类的两步过程。
17.以下哪些分类方法可以较好地避免样本的不平衡问题,()。
A、KNN
B、SVM
C、Bayes
D、神经网络
18.简述数据仓库与数据挖掘的关系?
19.简述数据仓库系统设计过程?
20.数据挖掘定义是什么?
21.OLAP技术的核心是()
A、在线性
B、对用户的快速响应
C、互操作性
D、多维分析
22.方体计算的主要挑战是()和()之间的矛盾。
23.一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:()。
A、一年级
B、二年级
C、三年级
D、四年级
24.下列关于分类和聚类哪个描述是正确的?()
A、分类和聚类都是有指导的学习
B、分类和聚类都是无指导的学习
C、分类是有指导的学习,聚类是无指导的学习
D、分类是无指导的学习,聚类是有指导的学习
25.在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位数。
A、曼哈顿距离
B、平方欧几里德距离
C、余弦距离
D、Bregman散度
26.支持度(support)是衡量兴趣度度量()的指标。
A、实用性
B、确定性
C、简洁性
D、新颖性
27.根据特征选择过程与后续数据挖掘任务的关联可分为三种方法:()。根据是否用到类信息的指导,分为(),()和()特征选择,
28.特征搜索过程中不可缺少的环节就是()。
29.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。
A、关联分析
B、分类和预测
C、聚类分析
D、演变分析
30.比较数据挖掘与OLAP的差异?
31.数据立方体度量可以根据其所使用的聚集函数分为三类,分别是:()、()和()
32.下面属于定量的属性类型是:()。
A、标称
B、序数