基本信息
文件名称:Python数据分析与应用(第3版)(微课版)项目3 工业产品产量统计分析——pandas统计分析基础 教案.docx
文件大小:26.1 KB
总页数:6 页
更新时间:2025-05-30
总字数:约1.72千字
文档摘要

项目3工业产品产量统计分析——pandas统计分析基础教案

课程名称:Python数据分析与应用

课程类别:必修

适用专业:大数据技术类相关专业

总学时:64学时(其中理论28学时,实验36学时)

总学分:4.0学分

本章学时:5学时

材料清单

《Python数据分析与应用(第3版)(微课版)》教材。

配套PPT。

数据。

代码。

引导性提问。

探究性问题。

拓展性问题。

教学目标与基本要求

教学目标

以工业产品产量数据为例,介绍csv数据、Excel数据、数据库数据3种常用的数据读取与写入方式。阐述DataFrame的常用属性,方法与描述性统计相关内容。介绍时间数据的转换,信息提取与算术运算。剖析分组聚合方法groupby的原理、用法和三种聚合方法。通过本章的学习,能够对pandas库有一个整体了解并能够利用pandas库进行基础的统计。

基本要求

掌握常见的数据读取方式。

掌握DataFrame常用属性与方法。

掌握基础时间数据处理方法。

掌握分组聚合的原理与方法。

问题

引导性提问

引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。

数据分析中常见的结构化数据读取方式有那些?

DataFrame和数组有什么相似之处?

探究性问题

探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。

读取数据库数据为什么需要别的库?

时间数据中存在哪些信息?

拓展性问题

拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。

为什么索引的时候有loc和iloc,设计者的意何在?

除了read_csv和to_csv,pandas还支持哪些文本文件的读写?例如,如何读取JSON、HTML文件?

主要知识点、重点与难点

主要知识点

常见的数据读取方式。

DataFrame常用属性与方法。

基础时间数据处理方法。

分组聚合的原理与方法。

重点

读写数据。

DataFrame数据的常用属性与方法。

基础时间数据处理方法。

分组聚合的原理与方法。

难点

读写数据。

分组聚合的原理与方法。

教学过程设计

理论教学过程

读写文本文件。

读写Excel文件。

读写数据库数据。

查看DataFrame的常用属性。

查改增删DataFrame数据。

描述分析DataFrame数据。

转换字符串时间为标准时间。

提取时间序列数据信息。

加减时间数据。

使用groupby方法拆分数据。

使用agg方法聚合数据。

使用apply方法聚合数据。

使用transform方法聚合数据。

实验教学过程

读写文本文件。

读写Excel文件。

读写数据库数据。

读取工业产品产量数据。

查看DataFrame的常用属性。

查改增删DataFrame数据。

描述分析DataFrame数据。

查看工业产品产量数据的整体情况。

对工业产品产量数据进行描述性分析。

转换字符串时间为标准时间。

提取时间序列数据信息。

加减时间数据。

转换时间字符串为标准时间。

计算各工业产品2023年的总产量。

使用groupby方法拆分数据。

使用agg,apply,transform方法聚合数据。

计算工业产品月产量统计量。

计算工业产品年产量增长率。

分析工业产品年产量变化趋势。

教材与参考资料

教材

曾文权,张良均.Python数据分析与应用(第3版)(微课版)[M].北京:人民邮电出版社.2024.

参考资料

[1] 张良均,谭立云.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出版社.2019.

[2] 张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018.

[3] 曾文权,张良均.Python数据分析与应用(第2版)(微课版)[M].北京:人民邮电出版社.2022.