基本信息
文件名称:简单线性回归分析.ppt
文件大小:390.5 KB
总页数:64 页
更新时间:2025-06-25
总字数:约2.95千字
文档摘要

例10-1为研究大气污染物一氧化氮(NO)的浓度是否受到汽车流量的影响,选择24个工业水平相近城市的一个交通点,统计单位时间过往的汽车数(千辆),同时在低空相同高度测定了该时间段空气中一氧化氮(NO)的浓度(×10-6),数据如表10-1所示。;2025/6/24;2025/6/24;解析:

目的:在于通过探讨车流量与NO浓度的关系,为控制空气污染提供依据。

一个变量的变化(如空气中NO浓度)如何受到另外一个变量(如车流量)变化的制约。

这些问题在统计学中采用回归模型(regressionmodel)来进行分析。;简单线性回归分析;目的要求;简单线性回归分析;

回归分析与简单线性回归

解释变量与反响变量;回归分析(regressionanalysis):

研究一个变量与另一个或一组变量之间依存性或依存关系的一种统计分析方法。

回归模型(regressionmodel):

描述变量之间的依存关系的函数。

简单线性回归(simplelinearregression):

模型中只包含两个有“依存关系〞的变量,一个变量随另外一个变量的变化而变化,且呈直线变化趋势,称之为简单线性回归。;例如,舒张压和血清胆固醇的依存性;解释变量与反响变量

解释变量(explanatoryvariable):

又称自变量〔independentvariable):能独立自由变化的变量,可以是随机变量,也可以是人为控制或选择的变量;一般用X表示

反响变量(responsevariable):

又称为因变量〔dependentvariable):非独立的、受其他变量影响的变量,一般用Y表示。;二、简单线性回归模型;例10-1中,假设只考虑NO浓度与车流量的关系,以NO浓度为因变量,车流量为自变量,采用回归分析通常要到达以下三个目的:

统计描述应用回归方程定量描述两个变量间的关系;

统计推断通过假设检验推断NO平均浓度是否随着车流量变化而变化;

统计应用利用模型进行统计预测或控制。;两变量关系的定量描述

散点图

简单线性回归方程

回归系数的计算——回归系数的最小二乘估计

线性回归分析的前提条件;1.散点图;2.简单线性回归方程;截距(intercept,constant)

X=0时,Y的平均值

α的单位与Y的相同

当X可能取0时,α才有实际意义。;总体回归系数(regressioncoefficient),直线的斜率〔Slope〕

X每增加(或减少)一个单位,Y平均改变β个单位。

β0,Y与X呈同向线性变化趋势;

β0,Y与X呈反向线性变化趋势;

β=0,Y与X无线性回归关系,但不说明没有其他关系。

β的单位为(Y的单位/X的单位);为;的意义:点到直线的纵向距离。;残差平方和(residualsumofsquares).

综合表示点距直线的距离。;2025/6/24;最小二乘原那么:残差平方和最小。;3.回归系数的最小二乘估计;b=0.1584,a=-0.1353;回归直线的有关性质;4.线性回归分析的前提条件(LINE);

;图10-2回归模型前提假设立体示意图;二、简单线性回归模型;1.检验回归模型是否成立(modeltest)

——方差分析;图10-3Y的总变异分解示意图;2025/6/24;2025/6/24;Y的离均差平方和,表示因变量Y的总变异;残差平方和,反映自变量X以外因素对Y的变异的影响,也就是在Y的总变异中无法用Y与X的回归关系解释的那局部变异。;2025/6/24;回归模型的假设检验;在H0成立时,;2.检验总体回归系数是否为零(parametertest)

——t检验;总体回归系数β的假设检验;H0成立时,该统计量应服从v=n-2的t分布,其中Sb为b的标准误;2025/6/24;对于简单线性回归分析

对回归方程的假设检验的方差分析与对回归系数假设检验的t检验是等价的。

相关系数的假设检验与回归系数的假设检验是等价的。;3.总体回归系数β的区间估计;b越大,X对Y的影响就越大;4.回归效果的评价指标——决定系数

定义为回归平方和与总平方和之比,记为R2,

无量纲,取值在0到1之间;

Y的总变异中回归关系所能解释的百分比;

拟合优度指标;

当两变量都为随机变量时,决定系数等于相关系数的平方。;R2=SS回归/SS总=0.0530/0.0812=0.6527

说明在空气中NO浓度总变异的65.27%与车流量有关。;二、简单线性回归模型;样本