基本信息
文件名称:Python数据分析与应用(第3版)(微课版)项目7 线上书籍网站数据综合分析——使用scikit-learn构建模型 教案.docx
文件大小:26.06 KB
总页数:6 页
更新时间:2025-05-30
总字数:约1.7千字
文档摘要

项目7线上书籍网站数据综合分析——使用scikit-learn构建模型教案

课程名称:Python数据分析与应用

课程类别:必修

适用专业:大数据技术类相关专业

总学时:64学时(其中理论28学时,实验36学时)

总学分:4.0学分

本章学时:9学时

材料清单

《Python数据分析与应用(第3版)(微课版)》教材。

配套PPT。

数据。

代码。

引导性提问。

探究性问题。

拓展性问题。

教学目标与基本要求

教学目标

重点介绍聚类、分类和回归三类sklearn数据分析技术的基本任务对应的数据分析建模方法及实现过程。同时,每一类又有对应的多种评估方法,能够评价所构建模型的性能优劣。通过这一章的学习,基本能够掌握常用的模型构建与评估方法,可在以后的数据分析过程中采用适当的算法并按所介绍的步骤实现综合应用。

基本要求

掌握sklearn转换器、评估器的使用。

掌握sklearn数据标准化与数据划分。

掌握sklearn中聚类、分类、回归模型的构建。

掌握sklearn中聚类、分类、回归模型的评价。

问题

引导性提问

引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。

常见的模型算法使用场景有哪些?

不同的场景之间有什么区别?

scikit-learn名字的由来?

探究性问题

探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。

聚类和分类的区别是什么?

回归和分类的区别又是什么?

拓展性问题

拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。

不同的算法,可解释性不同,能否挑选一种可解释性强的算法对算法结果进行解释?

除了PCA降维以外,可以使用RandomForest模型进行特征的筛选,该如何做?

主要知识点、重点与难点

主要知识点

sklearn转换器、评估器的使用。

sklearn数据标准化与数据划分。

sklearn中聚类、分类、回归模型的构建。

sklearn中聚类、分类、回归模型的评价。

重点

sklearn转换器的使用方法。

sklearn估计器的使用方法。

聚类模型的构建与评价。

分类模型的构建与评价。

回归模型的构建与评价。

难点

sklearn转换器的使用。

sklearn估计器的使用。

分类模型构建。

回归模型构建。

教学过程设计

理论教学过程

加载datasets模块中的数据集。

将数据集划分为训练集和测试集。

使用sklearn转换器进行数据预处理与降维。

使用sklearn估计器构建聚类模型。

评价聚类模型。

使用sklearn估计器构建分类模型。

评价分类模型。

使用sklearn估计器构建回归模型。

评价回归模型。

实验教学过程

加载datasets模块自带数据集。

划分数据集。

使用sklearn转换器进行数据预处理与降维。

加载线上网站书籍数据。

对聚类特征进行预处理。

构建与评价聚类模型。

构建线上网站书籍数据聚类模型。

评估线上网站书籍数据聚类模型。

构建与评价分类模型。

对分类特征进行预处理。

构建线上网站书籍分类模型。

评估线上网站书籍分类模型。

构建与评价回归模型。

对于回归特征进行预处理。

构建书籍评分回归模型。

评估书籍评分回归模型。

教材与参考资料

教材

曾文权,张良均.Python数据分析与应用(第3版)(微课版)[M].北京:人民邮电出版社.2025.

参考资料

[1] 张良均,谭立云.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出版社.2019.

[2] 张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.

[3] 曾文权,张良均.Python数据分析与应用(第2版)(微课版)[M].北京:人民邮电出版社.2022.