基本信息
文件名称:大数据分析技能自测题及解析.docx
文件大小:40.36 KB
总页数:12 页
更新时间:2025-09-15
总字数:约3.24千字
文档摘要

第PAGE页共NUMPAGES页

大数据分析技能自测题及解析

单选题(共10题,每题2分)

1.以下哪种技术通常用于处理非结构化和半结构化数据?

A.决策树

B.K-Means聚类

C.朴素贝叶斯

D.主题模型

2.在大数据处理中,Hadoop生态系统中负责数据存储的核心组件是:

A.MapReduce

B.Hive

C.HDFS

D.YARN

3.以下哪种指标最适合评估分类模型的预测准确性?

A.召回率

B.F1分数

C.AUC值

D.均方误差

4.在数据预处理阶段,以下哪项操作主要用于处理缺失值?

A.标准化

B.归一化

C.插值法

D.