基本信息
文件名称:2025年最新数据挖掘考试题库及答案.docx
文件大小:32.01 KB
总页数:15 页
更新时间:2025-12-10
总字数:约7.88千字
文档摘要

2025年最新数据挖掘考试题库及答案

一、单项选择题(每题2分,共30分)

1.2025年主流分布式计算框架中,默认采用“内存+磁盘”混合存储、支持SQL与Python双接口、且内置自动特征选择模块的是

A.Spark4.0??B.Flink2.5??C.RayData3.2??D.Dask2025.1

答案:C

解析:RayData3.2在2025Q1发布,新增automl.feature_selection,支持SQL语法扩展,且采用混合存储策略,性能较Spark4.0提升37%。

2.在处理超高维稀疏矩阵时,下列压缩方法在保持模型精度不变的前提下可