基本信息
文件名称:机器学习方法与实践 习题及答案 C4.5.docx
文件大小:28.29 KB
总页数:2 页
更新时间:2026-03-05
总字数:约小于1千字
文档摘要
【主观题】简述C4.5与ID3算法的区别
答案:
(1)分支指标采用增益比例
(2)数值属性的处理
(3)处理缺少属性值的训练样本
(4)使用K次迭代交叉验证,评估模型的优劣程度;
(5)根据生成的决策树,可以产生一个if-then规则的集合。
难易程度:易
作答时间(秒):300
分类:掌握
归属人:
【主观题】简述AUC的计算方法
答案:对
难易程度:中
作答时间(秒):60
答案解析:从AUC统计意义去计算。所有的正负样本对中,正样本排在负样本前面占样本对数的比例,即这个概率值。
具体的做法就是它也是首先对probscore从大到小排序,然后令最大probscore对应的sample