机器学习练习题及答案
一、单选题(共114题,每题1分,共114分)
1.下列误差和错误中,哪一项是由于训练样本的错误而导致?
A、偏差
B、泛化误差
C、噪声
D、方差
正确答案:C
2.决策树中不包含以下哪种结点
A、内部结点
B、外部结点
C、叶节点
D、根节点
正确答案:B
3.以下哪项是非线性降维方法
A、PCA(主成分分析)
B、LDA(线性判别)
C、ICA(独立成分分析)
D、KPCA(核化线性降维)
正确答案:D
4.下列关于线性回归分析中的残差(Residuals)说法正确的是?
A、残差均值总是为零
B、残差均值总是小于零
C、残差均值总是大于零
D、以上说法都不对
正确答案:A
5.下列激活函数中,能够实现将特征限制到区间[-1,1]的是哪一个
A、ReLU
B、Tanh
C、Logistic
D、Sigmoid
正确答案:B
6.极大似然估计中参数是()
A、确定且已知的量
B、已知的随机变量
C、确定且未知的量
D、未知的随机变量
正确答案:C
7.模型评估的常用方法有哪些
A、留出法
B、交叉验证法
C、自助法
D、以上都是
正确答案:D
8.对于在原空间中线性不可分问题,支持向量机()。
A、将数据映射到核空间中
B、在原空间中寻找线性函数划分数据
C、无法处理
D、在原空间中寻找非线性函数的划分数据
正确答案:A
9.()是并行式集成学习方法最著名的代表
A、随机森林
B、Boosting
C、Bagging
D、AdaBoost
正确答案:C
10.朴素贝叶斯分类器的特征不包括
A、孤立的噪声对该分类器的影响不大
B、数据的缺失值影响不大
C、条件独立的假设可能不成立
D、要求数据的属性是相互独立的
正确答案:D
11.朴素贝叶斯分类器的三种实现不包括
A、基于多项式模型实现
B、基于伯努利模型实现
C、基于高斯模型实现
D、属性条件独立性假设实现
正确答案:D
12.下列方法中,属于无监督学习的为()
A、线性回归
B、K均值
C、神经网络
D、决策树
正确答案:B
13.下列哪种方法可以用来缓解过拟合的产生:()。
A、正则化
B、增加更多的特征
C、以上都是
D、增加模型的复杂度
正确答案:A
14.构建一个最简单的线性回归模型需要几个系数(只有一个特征)?
A、3个
B、4个
C、1个
D、2个
正确答案:D
15.当训练集很多时,一种更为强大的结合策略是使用(),即通过另一个学习器来进行结合。
A、学习法
B、平均法
C、投票法
D、加权投票法
正确答案:A
16.以下哪个不是常见的决策树算法
A、ID3
B、C4.5
C、CART
D、DBSCAN
正确答案:D
17.关于SVM泛化误差描述正确的是
A、SVM的误差阈值
B、超平面与支持向量之间距离
C、超平面与支持向量之间距离
正确答案:B
18.下列关于Boosting和Bagging的描述正确的是:
A、Boosting主要关注降低方差
B、Boosting的代表算法有随机森林
C、Bagging基于自助采样法
D、Bagging主要关注降低偏差
正确答案:C
19.关于logistic回归和SVM不正确的是()
A、Logistic回归目标函数是最小化后验概率
B、Logistic回归可以用于预测事件发生概率的大小
C、SVM可以有效避免模型过拟合
D、SVM目标是结构风险最小化
正确答案:A
20.以下哪项不是降维的优点
A、节省空间
B、丢失部分信息
C、将数据可视化,从中获得洞察,了解最重要的特征
D、加速后续的训练算法
正确答案:B
21.KNN算法是基于()
A、概率空间
B、距离空间
C、颜色空间
D、线性空间
正确答案:B
22.?哪些机器学习模型经过训练,能够根据其行为获得的奖励和反馈做出一系列决策?
A、无监督学习
B、监督学习
C、强化学习
D、以上全部
正确答案:C
23.对Boosting模型的描述错误的是
A、采用串行训练模式
B、增加被错误分类样本的权值
C、通过改变训练集进行有针对性的学习
D、基础分类器采用少数服从多数原则进行集成
正确答案:D
24.点击率的预测是一个数据比例不平衡问题(比如训练集中样本呈阴性的比例为99%,阳性的比例是1%),如果我们用这种数据建立模型并使得训练集的准确率高达99%。我们可以得出结论是:
A、模型的准确率非常高,我们不需要进一步探索
B、模型不好,我们应建一个更好的模型
C、无法评价模型
D、以上都不正确
正确答案:B
25.BP算法总结错误的是()。
A、当前层的连接权值梯度,取决于当前层神经元阈值梯度和上一层神经元输出
B、算法只要知道上一层神经元的阈值梯度,就能计算当前层神经元的阈值梯度和连接权值梯度
C、隐层的阈值梯度只跟本层