基本信息
文件名称:医学统计学教学课件10简单回归分析.ppt
文件大小:1.08 MB
总页数:66 页
更新时间:2025-05-21
总字数:约2.59千字
文档摘要

;10简单线性回归;本章内容

概述

简单线性回归模型

线性回归的应用及注意的问题

;;儿子身高〔Y,英寸〕与父亲身高〔X,英寸〕存在线性关系:

即高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平,而矮个子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之“回归〞。;Regression释义;;;两个变量X与Y之间数量变化的关系:

1.函数关系,X与Y之间一一对应。例如园周长与半径:y=2πr,直线y=a+bx。

2.回归关系。两个变量之间有数量依存关系,但非一一对应的函数关系。如儿童年龄与身高、年龄与体重的关系等。;一、直线回归的概念

研究两个连续性变量X和Y之间线性依存变化数量关系的方法。

X为自变量〔independentvariable)

Y为依赖于X的变量称作因变量〔dependentvariable〕,或反响变量〔responsevariable〕

两个变量之间有数量依存关系,但非一一对应的函数关系,被称作回归关系。;二、直线回归分析的任务

找出最适合的直线回归方程,以确定一条最接近于各实测点的直线,来描述两个变量之间的回归关系。

X值和Y的关系,是一种线性回归关系,不同于一般数学上的X和Y的函数关系

;;由图可见,根底代谢随体重的增加而增加,且呈直线趋势,但并非所有点子恰好全都在一直线上,此与两变量间严格的直线函数关系不同,称为直线回归〔linearregression〕,其方程叫直线回归方程,以区别严格意义的直线方程。

直线回归是回归分析中最根本、最简单的一种,故又称简单回归。;三、线性回归模型的适应条件;;四、直线回归方程一般形式及其符号的意义;由样本估计的线性回归方程;;1.a为回归直线在Y轴上的截距;2.b为回归系数,即直线的斜率;直线回归方程的建立:

求解a、b。实际上就是“合理地〞找到一条能最好地代表数据点分布趋势的直线。;1.回归参数估计的最小二乘法原那么

(leastsumofsquares)

即保证各实测点至回归直线的纵向距离的平方和为最小。

回归分析图

残差(residual)或剩余值:即实测值Y与假定回归线上的估计值的纵向距离;;???骤;;2.计算根本数据。;3、计算有关指标的值

4、计算回归系数和截距公式

;5、列出样本回归方程;六、总体回归系数β的统计推断;〔一〕回归方程的假设检验;检验例11-1数据得到的直线回归方程是否成立?;1.方差分析;;数理统计可证明:;上式用符号表示为;上述三个平方和,其自由度有如下的关系:

?总=?回+?残,

?总=n-1,?回=1,?残=n-2;如果两变量间总体回归关系确实存在,回归的奉献就要大于随机误差,计算统计量F:;方差分析步骤;表11-2方差分析表;以?1=1,?2=12,查F界值表,得

F0.01〔?1,?2〕=9.07,P0.01。

按?=0.05水准,拒绝H0,接受H1。可以认为体重与根底代谢之间存在直线回归关系。;对?=0这一假设是否成立还可进行t检验;样本回归系数b的标准误:;SY.X为的标准误,它反响散点围绕回归直线的离散程度。Sy.x为各观察值Y距回归线纵向〔〕距离的标准差,反映X的影响被扣除后Y的变异,称为标准估计误差〔standarderrorofestimate〕。

在直线回归中,各实测值Y与由回归方程计算出的估计值之间是有一定误差的,称为残差或估计误差,即。该误差的离散程度,可用类似求标准差的式子进行计算,即标准估计误差。由于决定于均数及回归系数,所以自由度为n-2。;t检验;;注意:

,即直线回归中对回归系数的t检验与F检验等价,类似于两样本均数比较既可以作t检验亦可作单因素方差分析。

;;〔二〕总体回归系数?的置信区间;本例b=61.4229,自由度?=12,t0.05/2,12=2.179,Sb=4.881,代入公式,得:

总体回归系数β的95%置信区间为:

61.4229-2.179×4.881,61.4229-2.179×4.881

=〔50.787,72.059〕;注意:

此区间不包括0,按?=0.05水准同样可以得到总体回归系数?不为0的结论,即用区间估计法答复取相同?时的假设检验问题。;决定系数(coefficientofdetermination);