《数据分析与挖掘》课程教学大纲
一、课程信息
课程名称
数据挖掘与机器学习
英文名称
DataAnalysisandMining
课程编码
课程类别
专业核心课程
是否为混合式课程
课程性质
必修
学分
3.5
学时
总学时:72
理论
学时
44
实践/实
验学时
28
线上拓展
学时
适用专业
数据科学与大数据技术
建议修读学期
第4学期
先修课程
数据库系统与应用,Python数据分析与可视化、优化理论与方法
考核方式
考试(√)考查()
成绩构成及比例:过程性评价(平时作业、期中考试、课内实验)50%
结果性评价(期末考试)50%
大纲执笔人
大纲审核人
注:线上拓展学时为教师安排学生利用课余时间完成线上学习的学时。
二、课程简介
数据分析与挖掘是数据科学与大数据技术专业的一门核心基础课。通过本课程的学习,使学生掌握Python数据数据分析技术(Python编程基础、Numpy、Pandas、)、数据可视化技术(Matplotlib、Seaborn、pyecharts)、预处理技术(包括数据度量、数据清理、数据集成和转换等方法)和数据挖掘与机器学习技术(包括分类、预测、关联和聚类的概念与技术),并且熟悉数据分析与挖掘的基本原理和发展方向,提升解决复杂数据工程问题能力,激发学生科技报国的家国情怀和使命担当,锻炼创造性思维和创新性实践能力,具备初步的科研能力和创造能力。
数据分析与挖掘作为理论和实践结合的课程,其先修课是概率论与数理统计、Python数据分析与可视化、优化理论与应用,这三门课程为本课程提供理论基础与实践工具。本课程也是行业大数据分析、大数据处理综合实践、数据挖掘课程设计等专业课的重要基础。
三、课程内容及要求
(一)绪论(2学时)
1.教学内容
理论教学(2学时):
(1)掌握数据分析与挖掘的概念、内容。
(2)数据挖掘的任务、数据源、存在的问题与常用工具。
(3)数据挖掘与机器学习课程的核心地位和学习目标。
2.基本要求
(1)数据分析与数据挖掘的基本内容及其联系和区别,数据挖掘与机器学习的基本内容及其联系和区别。
(2)要求学生掌握数据挖掘和机器学习中存在的主要问题,数据建模的常用工具以及Python数据挖掘与机器学习的常用库。
3.重点及难点
重点:数据分析与挖掘的基本流程。
难点:数据挖掘与机器学习的主要问题。
4.教学模式:课堂讲述与讨论
5.作业及课外学习要求
(1)要求学生完成数据分析与挖掘基本概念的知识性作业;
(2)要求学生阅读文献或查阅资料,完成数据挖掘与机器学习发展的综述性书面作业;
(二)Python编程基础(4学时)
1.教学内容
理论教学(2学时):
(1)掌握Python语言的基本语法。
(2)数据Python内置数据类型。
(3)掌握Python的函数应用。
(4)了解Python中的基本文件读写。
实验教学(2学时)
(1)Python编程实践。
2.基本要求
(1)掌握Python编程基础。
(2)掌握Python中的内置数据结构和函数操作。
3.重点及难点
重点:Python中内置的数据机构。
难点:Python中的函数定义和调用。
4.教学模式:课堂讲述与实践
5.作业及课外学习要求
Python编程实践练习;
(三)Numpy数值计算
1.教学内容(4学时)
理论教学(2学时):
(1)掌握Numpy中的数组定义和访问。
(2)数据Numpy中数组的运算、读写和统计分析。
实验教学(2学时):
(1)Numpy编程实践。
2.基本要求
(1)Numpy中数组的定义和切片访问。
(2)数组的读写和统计分析。
3.重点及难点
重点:Numpy中数组的切片访问。
难点:Numpy中的数据统计分析。
4.教学模式:课堂讲述与实践
5.作业及课外学习要求
Numpy编程实践练习;
(四)Pandas数据分析(6学时)
1.教学内容
理论教学(4学时):
(1)掌握Pandas数据分析。
(2)数据Pandas数据可视化。
实验教学(2学时):
(1)Pandas数据分析与可视化案例。
2.基本要求
(1)Pandas中的数据结构、数据索引、数据读写。
(2)Pandas数据查询与编辑。
(3)Pandas数据分组与汇总。
(4)Pandas数据可视化。
3.重点及难点
重点:Pandas数据查询、编辑与分组汇总。
难点:数据分组汇总。
4.教学模式:课堂讲述与实践
5.作业及课外学习要求
Pandas数据分析与可视化编程实践练习;
(五)Python数据可视化(6)
1.教学内容
理论教学(4学时):
(1)Matplotlib数据可视化。
(2)Seaborn数据可视化。
(3)pyecharts数据可视化。