基本信息
文件名称:1-Python数据分析与挖掘-课程教学大纲.docx
文件大小:32.91 KB
总页数:17 页
更新时间:2025-06-15
总字数:约6.57千字
文档摘要

《数据分析与挖掘》课程教学大纲

一、课程信息

课程名称

数据挖掘与机器学习

英文名称

DataAnalysisandMining

课程编码

课程类别

专业核心课程

是否为混合式课程

课程性质

必修

学分

3.5

学时

总学时:72

理论

学时

44

实践/实

验学时

28

线上拓展

学时

适用专业

数据科学与大数据技术

建议修读学期

第4学期

先修课程

数据库系统与应用,Python数据分析与可视化、优化理论与方法

考核方式

考试(√)考查()

成绩构成及比例:过程性评价(平时作业、期中考试、课内实验)50%

结果性评价(期末考试)50%

大纲执笔人

大纲审核人

注:线上拓展学时为教师安排学生利用课余时间完成线上学习的学时。

二、课程简介

数据分析与挖掘是数据科学与大数据技术专业的一门核心基础课。通过本课程的学习,使学生掌握Python数据数据分析技术(Python编程基础、Numpy、Pandas、)、数据可视化技术(Matplotlib、Seaborn、pyecharts)、预处理技术(包括数据度量、数据清理、数据集成和转换等方法)和数据挖掘与机器学习技术(包括分类、预测、关联和聚类的概念与技术),并且熟悉数据分析与挖掘的基本原理和发展方向,提升解决复杂数据工程问题能力,激发学生科技报国的家国情怀和使命担当,锻炼创造性思维和创新性实践能力,具备初步的科研能力和创造能力。

数据分析与挖掘作为理论和实践结合的课程,其先修课是概率论与数理统计、Python数据分析与可视化、优化理论与应用,这三门课程为本课程提供理论基础与实践工具。本课程也是行业大数据分析、大数据处理综合实践、数据挖掘课程设计等专业课的重要基础。

三、课程内容及要求

(一)绪论(2学时)

1.教学内容

理论教学(2学时):

(1)掌握数据分析与挖掘的概念、内容。

(2)数据挖掘的任务、数据源、存在的问题与常用工具。

(3)数据挖掘与机器学习课程的核心地位和学习目标。

2.基本要求

(1)数据分析与数据挖掘的基本内容及其联系和区别,数据挖掘与机器学习的基本内容及其联系和区别。

(2)要求学生掌握数据挖掘和机器学习中存在的主要问题,数据建模的常用工具以及Python数据挖掘与机器学习的常用库。

3.重点及难点

重点:数据分析与挖掘的基本流程。

难点:数据挖掘与机器学习的主要问题。

4.教学模式:课堂讲述与讨论

5.作业及课外学习要求

(1)要求学生完成数据分析与挖掘基本概念的知识性作业;

(2)要求学生阅读文献或查阅资料,完成数据挖掘与机器学习发展的综述性书面作业;

(二)Python编程基础(4学时)

1.教学内容

理论教学(2学时):

(1)掌握Python语言的基本语法。

(2)数据Python内置数据类型。

(3)掌握Python的函数应用。

(4)了解Python中的基本文件读写。

实验教学(2学时)

(1)Python编程实践。

2.基本要求

(1)掌握Python编程基础。

(2)掌握Python中的内置数据结构和函数操作。

3.重点及难点

重点:Python中内置的数据机构。

难点:Python中的函数定义和调用。

4.教学模式:课堂讲述与实践

5.作业及课外学习要求

Python编程实践练习;

(三)Numpy数值计算

1.教学内容(4学时)

理论教学(2学时):

(1)掌握Numpy中的数组定义和访问。

(2)数据Numpy中数组的运算、读写和统计分析。

实验教学(2学时):

(1)Numpy编程实践。

2.基本要求

(1)Numpy中数组的定义和切片访问。

(2)数组的读写和统计分析。

3.重点及难点

重点:Numpy中数组的切片访问。

难点:Numpy中的数据统计分析。

4.教学模式:课堂讲述与实践

5.作业及课外学习要求

Numpy编程实践练习;

(四)Pandas数据分析(6学时)

1.教学内容

理论教学(4学时):

(1)掌握Pandas数据分析。

(2)数据Pandas数据可视化。

实验教学(2学时):

(1)Pandas数据分析与可视化案例。

2.基本要求

(1)Pandas中的数据结构、数据索引、数据读写。

(2)Pandas数据查询与编辑。

(3)Pandas数据分组与汇总。

(4)Pandas数据可视化。

3.重点及难点

重点:Pandas数据查询、编辑与分组汇总。

难点:数据分组汇总。

4.教学模式:课堂讲述与实践

5.作业及课外学习要求

Pandas数据分析与可视化编程实践练习;

(五)Python数据可视化(6)

1.教学内容

理论教学(4学时):

(1)Matplotlib数据可视化。

(2)Seaborn数据可视化。

(3)pyecharts数据可视化。