基本信息
文件名称:2026年大数据技术(数据挖掘算法基础)试题及答案.docx
文件大小:29.92 KB
总页数:16 页
更新时间:2026-03-25
总字数:约7.27千字
文档摘要
2026年大数据技术(数据挖掘算法基础)试题及答案
一、单项选择题(每题2分,共20分)
1.在决策树算法中,若某属性将数据集划分为三个子集,其对应的样本数量分别为10、20、30,且各子集的类别熵分别为0.8、0.6、0.4,则该属性的信息增益计算时,子节点的平均熵为()。
A.(10×0.8+20×0.6+30×0.4)/(10+20+30)
B.(0.8+0.6+0.4)/3
C.(10/(10+20+30))×0.8+(20/60)×0.6+(30/60)×0.4
D.max(0.8,0.6,0.4)
2.Kmeans聚