基本信息
文件名称:大数据分析技能自测题及解析.docx
文件大小:40.36 KB
总页数:12 页
更新时间:2025-09-15
总字数:约3.24千字
文档摘要
第PAGE页共NUMPAGES页
大数据分析技能自测题及解析
单选题(共10题,每题2分)
1.以下哪种技术通常用于处理非结构化和半结构化数据?
A.决策树
B.K-Means聚类
C.朴素贝叶斯
D.主题模型
2.在大数据处理中,Hadoop生态系统中负责数据存储的核心组件是:
A.MapReduce
B.Hive
C.HDFS
D.YARN
3.以下哪种指标最适合评估分类模型的预测准确性?
A.召回率
B.F1分数
C.AUC值
D.均方误差
4.在数据预处理阶段,以下哪项操作主要用于处理缺失值?
A.标准化
B.归一化
C.插值法
D.