基本信息
文件名称:大数据分析实战模拟题集.docx
文件大小:40.17 KB
总页数:12 页
更新时间:2025-09-15
总字数:约3.08千字
文档摘要
第PAGE页共NUMPAGES页
大数据分析实战模拟题集
单选题(每题2分,共10题)
1.下列哪种数据类型最适合使用K-Means聚类算法?
A.标签数据
B.分类数据
C.离散数据
D.连续数据
2.在大数据处理中,以下哪个工具主要用于分布式文件系统?
A.Spark
B.Hadoop
C.Kafka
D.Elasticsearch
3.以下哪种方法可以有效处理大数据中的缺失值?
A.删除含有缺失值的记录
B.使用均值填充
C.使用众数填充
D.以上都是
4.以下哪个指标可以用来评估分类模型的准确性?
A.召回率
B.精确率
C.F1分数