人工智能核心算法模拟练习题含参考答案
一、单选题(共44题,每题1分,共44分)
1.使用交叉验证最简单的方法是在估计器和数据集上调用什么辅助函数?
A、cross_val%
B、cross_val_score
C、val_score
D、cross_score
正确答案:B
2.代码arr1=np.array([[1,2,3],[4,5,6]]);arr2=2*np.ones([2,3],dtype=np.int64);print((arr1*arr2)[1][2])的输出结果是()?注:(已导入numpy库)importnumpyasnp
A、8
B、12
C、10
D、6
正确答案:B
3.半监督支持向量机简称?
A、SVMP
B、S2VM
C、S3VM
D、SSVM
正确答案:C
4.最小二乘法就是试图找到一条直线,使所有样本到直线上的()之和最小。
A、马氏距离
B、曼哈顿距离
C、切比雪夫距离
D、欧氏距离
正确答案:D
5.关于bagging下列说法错误的是:()
A、各基分类器之间有较强依赖,不可以进行并行训练。
B、为了让基分类器之间互相独立,需要将训练集分为若干子集。
C、最著名的算法之一是基于决策树基分类器的随机森林。
D、当训练样本数量较少时,子集之间可能有重叠。
正确答案:A
6.如果我们希望预测n个类(p1,p2...pk)的概率使得所有n的p的和等于1,那么下列哪个函数可以用作输出层中的激活函数?
A、Sigmoid
B、ReLu
C、Softmax
D、Tanh
正确答案:C
7.下列哪个包不是用于处理图像的?()
A、gensim
B、opencv
C、skimage
D、Scipy
正确答案:A
8.协同训练(co-training)是针对(___)数据设计?
A、多版本
B、多角度
C、多视图
D、多环境
正确答案:C
9.强化学习在每个时刻环境和个体都会产生相应的交互。个体可以采取一定的(),这样的行动是施加在环境中的。
A、action
B、state
C、reward
D、agent
正确答案:A
10.在数据挖掘中,比较成熟的预测算法包括Logistic回归模型、()、决策树、神经网络等
A、时间序列
B、线性回归
C、灰色模型
D、贝叶斯网络
正确答案:D
11.数据科学家经常使用多个算法进行预测,并将多个机器学习算法的输出(称为“集成学习”)结合起来,以获得比所有个体模型都更好的更健壮的输出。则下列说法正确的是?()
A、基本模型之间相关性高。
B、基本模型之间相关性低。
C、集成方法均使用加权平均代替投票方法。
D、基本模型都来自于同一算法。
正确答案:B
12.每一棵决策树拟合的是之前迭代得到的模型的()
A、标准差
B、均方差
C、残差
D、方差
正确答案:C
13.下列哪些项目是在图像识别任务中使用的数据扩增技术(dataaugmentationtechnique)?1水平翻转(Horizontalflipping)2随机裁剪(Randomcropping)3随机放缩(Randomscaling)4颜色抖动(Colorjittering)5随机平移(Randomtranslation)6随机剪切(Randomshearing)
A、1,3,5,6
B、1,2,4
C、2,3,4,5,6
D、所有项目
正确答案:D
14.对于给定的关于天气信息的数据集,已知空气的温度、湿度、气压、是否降雨以及pm2.5指数,需要建立一个回归模型预测pm2.5指数,这是一个()。
A、半监督学习
B、强化学习
C、有监督的学习
D、无监督学习
正确答案:C
15.关于SVM,以下描述错误的是()
A、某个核函数使训练集在特征空间中线性可分,可能原因是欠拟合
B、正则化可理解为一种“罚函数法
C、“软间隔”允许某些样本不满足约束
D、如果原始空间是有限维,即属性数有限,那么一定存在一个高维特征空间使样本可分
正确答案:A
16.随着卷积层数的增加,下面描述正确的是:①.在一定层数范围内,效果越来越好②.能够抽取的特征更加复杂③.层数越多越容易发生梯度消失
A、①②③
B、①②
C、①③
D、②③
正确答案:A
17.前馈神经网络是一种简单的神经网络,各神经元分层排列,是目前应用最广泛,发展最迅速的人工神经网络之一。以下关于前馈神经网络说法正确的是:
A、具备计算能力的神经元与上下两层相连
B、其输入节点具备计算能力
C、同一层神经元相互连接
D、层间信息只沿个方向传递
正确答案:D
18.下列哪一项不是常见的机器学习模型正则化方法。
A、数据增强
B、模型集成
C、引入参数范数惩罚项
D、数据优化
正确答案:D
19.卷积神经网络(convol