基本信息
文件名称:2025年数据科学与大数据技术专业考试题及答案.docx
文件大小:28.28 KB
总页数:16 页
更新时间:2025-10-27
总字数:约7千字
文档摘要

2025年数据科学与大数据技术专业考试题及答案

一、单项选择题(每题2分,共20分)

1.在数据清洗过程中,针对时间序列数据中的异常值检测,以下哪种方法更适用于非正态分布的时序数据?

A.Z-score检验

B.四分位距(IQR)法

C.移动平均标准差

D.自回归模型残差分析

答案:B

2.某机器学习模型在训练集上的准确率为95%,在测试集上的准确率为60%,最可能的原因是?

A.模型欠拟合

B.数据泄露

C.模型过拟合

D.类别不平衡

答案:C

3.以下哪个组件属于ApacheFlink的核心抽象?

A.RDD