《Python数据分析与应用》教学大纲
课程名称:Python数据分析与应用
课程类别:必修
适用专业:大数据技术类相关专业
先修课程:Python编程基础
总学时:64学时(其中理论28学时,实验36学时)
总学分:4.0学分
课程的性质
大数据时代已经到来,在商业、经济及其他领域中基于数据和分析去发现问题并做出科学、客观的决策越来越重要。数据分析技术将帮助企业用户在合理时间内获取、管理、处理以及整理海量数据,为企业经营决策提供积极的帮助。数据分析作为一门前沿技术,广泛应用于物联网、云计算、移动互联网等战略新兴产业。有实践经验的数据分析人才已经成为了各企业争夺的热门。为了推动我国大数据,云计算,人工智能行业的发展,满足日益增长的数据分析人才需求,特开设Python数据分析与应用课程。
课程的基本要求
理论上,要求学生掌握数据分析的概念、流程;了解数据分析的应用场景和工具;掌握数据分析常用库的作用;掌握数值计算、统计分析、数据预处理、数据可视化、模型构建的常用方法。
技能上,要求学生掌握使用Python进行数值计算、统计分析、数据预处理、数据可视化、模型构建的操作方法,能将知识点揉入餐饮企业真实示例中,实现学以致用;并能基于TipDM大数据挖掘建模平台,使用拖拽式、流程化、去编程化的新技术,解决实际案例。
思政上,将习近平新时代中国特色社会主义思想、数据安全法等思政要素融汇到教学中,引发学生对新技术、新形势的思考,促进经济、行业的进一步发展;培养学生的科学探索、独立思考、全局意识和思辨能力,以及职业素养、信息保护意识等。
教学条件
Python3.11.7+Anaconda32024.02-1
课程学时分配
序号
教学内容
理论学时
实验学时
其他
1
项目1Python数据分析概述
2
1
2
项目2粮食产量分析——NumPy数值计算基础
2
3
3
项目3工业产品产量统计分析——pandas统计分析基础
2
3
4
项目4电商产品销售数据预处理——使用pandas进行数据预处理
3
4
5
项目5电商销售可视化分析——Matplotlib、seaborn、pyecharts数据可视化基础
3
5
6
项目6线上书籍网站数据可视化分析
6
5
7
项目7线上书籍网站数据综合分析——使用scikit-learn构建模型
4
5
8
项目8餐饮企业综合分析
3
5
9
项目9基于TipDM大数据挖掘建模平台实现客户流失预测
3
5
总计
28
36
教学内容及学时安排
理论教学
序号
章节名称
主要内容
教学目标
学时
1
Python数据分析概述
掌握数据分析的概念
掌握数据分析的流程
了解数据分析的应用场景
了解数据分析的常用工具
了解Python数据分析的优势
了解Python数据分析的常用库
了解Python的Anaconda发行版
在Windows操作系统上安装Anaconda
掌握JupyterNotebook的基础功能
掌握JupyterNotebook的高级功能
掌握数据分析的概念、流程与应用场景
了解Python常用的数据分析库
掌握Windows系统下Anaconda安装
掌握JupyterNotebook的常用功能
2
2
粮食产量分析——NumPy数值计算基础
创建数组对象
生成随机数
通过索引访问数组
变换数组的形态
创建NumPy矩阵
掌握ufunc函数
读/写文件
使用数组进行简单的统计分析
掌握NumPy创建多维数组与生成随机数的方法
掌握数组的索引与变换
掌握NumPy中数组矩阵的运算及通用函数的基本使用方法
掌握NumPy读写文件的方法和常用的统计分析的函数
2
3
工业产品产量统计分析——pandas统计分析基础
认识pandas库
读/写文本文件
读/写Excel文件
读/写数据库数据
查看DataFrame的常用属性
查改增删DataFrame数据
描述分析DataFrame数据
转换字符串时间为标准时间
提取时间序列数据信息
加减时间数据
使用groupby方法拆分数据
使用agg方法聚合数据
使用apply方法聚合数据
使用transform方法聚合数据
掌握常见的数据读取方式
掌握DataFrame常用属性与方法
掌握基础时间数据处理方法
掌握分组聚合的原理与方法
2
4
电商产品销售数据预处理——使用pandas进行数据预处理
堆叠合并数据
主键合并数据
重叠合并数据
检测与处理重复值
检测与处理缺失值
检测与处理异常值
离差标准化数据
标准差标准化数据
小数定标标准化数据
哑变量处理类别型数据
离散化连续型数据
掌握数据合并的原理与方法
掌握数据清洗的基本方法
掌握基本数据标准化的方法
掌握常用的数据转换方法
3
5
电商销售可视化分析——Mat