北京航空航天大学《机器学习基础》试卷(A卷)
专业班级?????????????姓名?????????????????学号
题号
一
二
三
四
五
六
七
八
九
十
成绩
复核签字
得分
登分签字
说明:本试卷共大题,共100分;答题要求:按要求答题
考生须知:
1.姓名、学号、系、专业、年级、班级必须写在密封线内指定位置。
2.答案必须用蓝、黑色钢笔或圆珠笔写在试卷上,字迹要清晰,卷面要整洁,写在草稿纸上的一律无效。
一、单项选择题(每题2分,共20分)
以下哪种学习方式需要标注完整的训练数据?()
A.监督学习
B.无监督学习
C.强化学习
D.半监督学习
以下哪项是特征工程中的降维技术?()
A.标准化
B.主成分分析(PCA)
C.独热编码
D.数据归一化
决策树算法的关键属性选择指标不包括:()
A.信息增益
B.基尼系数
C.欧氏距离
D.信息增益比
以下哪种算法属于集成学习方法?()
A.逻辑回归
B.随机森林
C.支持向量机
D.朴素贝叶斯
深度学习模型训练中,梯度消失问题通常出现在:()
A.浅层神经网络
B.深层神经网络
C.卷积神经网络
D.循环神经网络
以下哪种评估指标最适合二分类问题?()
A.均方误差(MSE)
B.精确率-召回率曲线
C.交并比(IoU)
D.余弦相似度
民航气象数据预处理中,最可能采用的异常值处理方法是:()
A.直接删除
B.中位数填充
C.线性插值
D.数据平滑
以下哪项不是梯度下降法的常见变体?()
A.随机梯度下降(SGD)
B.批量梯度下降(BGD)
C.动量梯度下降(Momentum)
D.牛顿-拉夫逊法
在航空器冲突预测模型中,通常将冲突风险定义为:()
A.分类问题
B.回归问题
C.聚类问题
D.关联规则挖掘
下列哪种算法常用于时间序列数据预测?()
A.卷积神经网络(CNN)
B.循环神经网络(RNN)
C.决策树
D.支持向量机
二、多项选择题(每题3分,共15分)
机器学习中的正则化技术包括:()
A.L1正则化
B.L2正则化
C.Dropout
D.BatchNormalization
E.交叉验证
以下属于监督学习任务的有:()
A.航班延误预测
B.空域聚类分析
C.航空器轨迹分类
D.气象数据降维
E.跑道容量估计
深度学习模型的训练技巧包括:()
A.数据增强
B.预训练
C.早停法(EarlyStopping)
D.学习率调整
E.梯度截断
民航领域中,机器学习的典型应用场景包括:()
A.航班动态调度优化
B.航空器故障预测
C.空域冲突检测
D.航空气象预报
E.机场旅客流量预测
以下关于特征选择的描述,正确的有:()
A.递归特征消除(RFE)是基于模型的方法
B.卡方检验属于基于统计的特征选择
C.互信息用于衡量特征与标签的相关性
D.主成分分析可用于特征提取
E.特征选择能降低模型复杂度
三、判断题(每题2分,共10分)
机器学习模型的泛化能力是指在训练集上的表现。()
支持向量机(SVM)既可以解决分类问题,也能处理回归任务。()
随机森林通过Bagging策略降低方差,提升模型稳定性。()
梯度下降法的学习率越大,收敛速度一定越快。()
在文本分类任务中,TF-IDF常用于特征编码。()
过拟合问题可通过增加训练数据量或使用正则化缓解。()
卷积神经网络(CNN)能直接处理图像和文本数据。()
强化学习的核心是通过奖励机制学习最优策略。()
交叉验证中的K折划分需确保各子集数据分布一致。()
决策树的深度越深,模型的分类准确率一定越高。()
四、简答题(每题6分,共30分)
监督学习与无监督学习的本质区别是什么?
结合航空场景(如航班轨迹分类与空域聚类分析)说明两者的应用差异。
简述梯度下降法的工作原理,并解释学习率对训练过程的影响。
举例说明如何通过调整学习率解决模型震荡或收敛缓慢的问题。
在民航气象数据预处理中,常用的归一化方法有哪些?
比较Z-score标准化与Min-Max归一化的适用场景。
如何评估分类模型的性能?
列举至少4种指标,并解释在航空器冲突预测任务中为何选择特定指标。
简述深度学习在民航领域的典型应用。
以航空器进近飞行时间预测为例,说明模型构建的关键步骤。
五、计算题(每题10分,共20分)
1.特征工程与模型训练
某空管部门收集了1000条航空器飞行数据,包含以下特征:
X1:进场高度(m)
X2:进场速度(km/h)
X3:气象条件(1=恶劣,0=良好)
Y:进近时间(min