基本信息
文件名称:数据挖掘原理、算法与应用 (Python语言描述)【第四章】数据集划分与交叉验证.ppt
文件大小:1.54 MB
总页数:10 页
更新时间:2025-12-12
总字数:约1.1万字
文档摘要

第四章数据集划分与交叉验证数据挖掘原理、算法与应用(Python语言描述)

学习目标(1)熟练掌握数据集的常用划分方法train_test_split。(2)掌握K折交叉划分以及应用方法。(3)掌握分层K折交叉划分以及应用方法。(4)了解乱序K次划分方法。(5)了解留一法、留P法以及自助法。(6)掌握交叉验证评分方法。

目录数据集划分train_test_split方法K折交叉划分法分层K折交叉划分法乱序K次划分留一法留P法自助法交叉验证评分案例:房价预测数据集划分

4.1数据集划分本章使用数据集如表4.1所示,该数据包含用户对不同车型满意度信息,共包含