PAGE4
PAGE4
PAGE3
PAGE3
课题
使用逻辑回归进行分类
课时
2课时(90min)
教学目标
知识技能目标:
(1)了解回归与分类的区别
(2)掌握逻辑回归的基本原理
(3)掌握逻辑回归算法的Sklearn实现方法
(4)能够编写程序,训练逻辑回归模型并实现预测
(5)能够对训练完成的逻辑回归模型进行评估
素质目标:
锻炼具体问题具体分析的思维方式,培养一丝不苟的工作态度,增强积极主动寻求解决方法的意识
研究逻辑回归的基础知识,提升知识水平,培养钻研精神
教学重难点
教学重点:回归与分类的区别,逻辑回归的基本原理,逻辑回归算法的Sklearn实现方法
教学难点:编写程序,训练逻辑回归模型并实现预测;对训练完成的逻辑回归模型进行评估
教学方法
案例分析法、问答法、讨论法、讲授法
教学用具
电脑、投影仪、多媒体课件、教材
教学过程
主要教学内容及步骤
课前任务
【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务,扫码观看“逻辑回归的基本原理”视频
【学生】完成课前任务
考勤
【教师】使用APP进行签到
【学生】班干部报请假人员及原因
问题导入
【教师】组织学生完成以下任务:
(1)画出阶跃函数与Sigmoid函数的图像。
(2)写出Sigmoid函数的数学表达式。
(3)写出逻辑回归的函数表达式。
【学生】思考、举手回答
传授新知
【教师】通过学生的回答引入要讲的知识,介绍逻辑回归的基本原理和逻辑回归算法的Sklearn实现等内容
3.1逻辑回归的基本原理
逻辑回归虽然名为回归,实际上却是一种线性分类模型。逻辑回归与线性回归的目标都是得到一条直线,不同的是,线性回归的直线是尽可能拟合自变量的分布,使得训练集中所有样本点到直线的距离尽可能短;而逻辑回归的直线是尽可能拟合决策边界,使得训练样本中不同类的样本点尽可能分离。
3.1.1回归与分类的区别
回归与分类最主要的区别就是预测值的类型,如果模型的预测值是连续的数值,就是回归问题;如果模型的预测值是不连续的离散值,就是分类问题。
?【教师】通过多媒体展示“回归数据集”和“分类数据集”表格,介绍相关知识
例如,用房屋面积和房屋离市中心的距离来预测连续的房价值,这是回归问题,如表3-2所示;用房屋面积和房屋离市中心的距离来预测房价的高低,这就是分类问题,如表3-3所示。
表3-2回归数据集
房屋面积/(m2)
房屋离市中心的距离/(km)
房价/(万元)
100
18.00
320
90
9.00
290
89
40.00
234
表3-3分类数据集
房屋面积/(m2)
房屋离市中心的距离/(km)
房价
100
18.00
高
90
9.00
低
89
40.00
低
对于回归模型的预测值,如果人为地设置一个阈值(如300),低于该阈值的归类为低房价,高于或等于该阈值的归类为高房价。那么,就可以把线性回归模型输出的连续值进行离散化,即将线性回归模型改造成相应的线性分类模型。
3.1.2逻辑回归的原理分析
1.阶跃函数
线性回归模型改造成线性分类模型的关键在于如何将模型输出的连续值进行离散化。最直接的方法是设置若干阈值,将回归模型输出的连续值分割为不同的区间,每个区间表示一个类别,从而实现连续值的离散化。然而,这种方法需要人为设置阈值,阈值怎样设置才合理呢?通常对于二分类问题,可将阈值设置为所有样本因变量的中位数或均值。但对于有些问题,这样的分类并不合理,如考试成绩及格或不及格,并不是以均值或中位数对样本进行划分的。
?【教师】通过多媒体展示“阶跃函数”图片(详见教材),帮助学生对这些内容有更直观地认识
从数学角度看,这种人为地设置阈值的方法相当于使用阶跃函数对线性回归模型的输出值进行函数映射。
2.激活函数
阶跃函数是不连续的函数,无法求导数,而求线性回归参数时,通常需要使用求导数的方法来求极小值。因此,引入阶跃函数之后将导致线性回归模型无法求方程的参数。为此,人们设计出了一些具有良好数学性质的激活函数来代替阶跃函数,以实现对连续值的离散化。
线性回归模型引入激活函数后就变成了线性分类模型。可见,线性分类模型就是在线性回归模型的基础上增加了一层激活函数。逻辑回归就是这样一种线性分类模型,它在线性回归模型的基础上增加了激活函数Sigmoid,Sigmoid函数的数学表达式为
?【教师】通过多媒体展示“Sigmoid函数的图形”图片(详见教材),帮助学生对这些内容有更直观地认识
Sigmoid函数的图形,它与阶跃函数的形状很相似,但在阶跃处是连续的。当时,Sigmoid的值为0.5,随着x值的增大,对应的Sigmoid值逐渐接近1;随着x值的减小,Sigmoid值逐渐接近0,但Sigm