基本信息
文件名称:大数据分析实战模拟题集.docx
文件大小:40.17 KB
总页数:12 页
更新时间:2025-09-15
总字数:约3.08千字
文档摘要

第PAGE页共NUMPAGES页

大数据分析实战模拟题集

单选题(每题2分,共10题)

1.下列哪种数据类型最适合使用K-Means聚类算法?

A.标签数据

B.分类数据

C.离散数据

D.连续数据

2.在大数据处理中,以下哪个工具主要用于分布式文件系统?

A.Spark

B.Hadoop

C.Kafka

D.Elasticsearch

3.以下哪种方法可以有效处理大数据中的缺失值?

A.删除含有缺失值的记录

B.使用均值填充

C.使用众数填充

D.以上都是

4.以下哪个指标可以用来评估分类模型的准确性?

A.召回率

B.精确率

C.F1分数