基本信息
文件名称:2025年数据科学与大数据技术专业考试题及答案.docx
文件大小:28.28 KB
总页数:16 页
更新时间:2025-10-27
总字数:约7千字
文档摘要
2025年数据科学与大数据技术专业考试题及答案
一、单项选择题(每题2分,共20分)
1.在数据清洗过程中,针对时间序列数据中的异常值检测,以下哪种方法更适用于非正态分布的时序数据?
A.Z-score检验
B.四分位距(IQR)法
C.移动平均标准差
D.自回归模型残差分析
答案:B
2.某机器学习模型在训练集上的准确率为95%,在测试集上的准确率为60%,最可能的原因是?
A.模型欠拟合
B.数据泄露
C.模型过拟合
D.类别不平衡
答案:C
3.以下哪个组件属于ApacheFlink的核心抽象?
A.RDD