第十章相关与回归在医学上人的身高与体重、体温与脉搏次数、年龄与血压、药物剂量与疗效等均有一定的联系。说明客观事物或现象相互关系的密切程度并用适当的统计指标表示出来,这是相关分析的任务。把客观事物或现象间的关系用函数形式表示出来,则是回归分析所要解决的问题。第30页,共51页,星期日,2025年,2月5日第十章相关与回归CORR过程计算变量间的相关系数,包括PEARSON积矩相关系数等,同时给出单变量描述统计。REG过程是SAS中通用的基本的回归分析过程,它是用最小二乘法原理求解线性回归方程的有效过程。此外,因为逐步回归分析的方法在实际工作中应用甚广,故将其单独提出来介绍如何使用REG过程进行逐步回归分析。第31页,共51页,星期日,2025年,2月5日10.1CORR过程10.1.1相关分析相关是研究随机变量之间相互关系的统计分析方法,它研究随机变量之间相互关系的密切程度。线性相关,又称简单相关。其统计指标是PEARSON相关系数r。第32页,共51页,星期日,2025年,2月5日当研究多个随机变量之间的相互关系时,可对变量进行多元线性相关分析。多元线性相关的统计量是全相关系数R和各偏相关系数。在多元线性相关分析中,变量之间的关系是错综复杂的,两个变量间的简单线性相关系数往往不能正确说明两者的真实关系,只有在其它变量固定,即扣除了其它变量的影响后,计算两变量间的偏相关系数才能反映此两变量的真实情况。第33页,共51页,星期日,2025年,2月5日当变量不服从正态分布时,例如按等级分类或相对数资料,这时需用非参数相关分析方法,如等级相关分析法等。第34页,共51页,星期日,2025年,2月5日10.1.2语句说明1.过程格式?PROCCORR[选择项];VAR变量表;WITH变量表;PARTIAL变量表;WEIGHT变量;FREQ变量;BY变量表;第35页,共51页,星期日,2025年,2月5日2.说明(1)PROCCORR语句PROCCORR[选择项];PROCCORR语句的选择项主要有:PEARSON计算通常的PEARSON积矩相关,是缺省值。KENDALL计算肯德尔τ-b系数。SPEARMAN计算斯皮尔曼等级相关系数。第36页,共51页,星期日,2025年,2月5日第1页,共51页,星期日,2025年,2月5日主要内容方差分析方差分析的过程单因素方差分析二因素方差分析相关分析相关分析的过程回归分析一元回归多元回归第2页,共51页,星期日,2025年,2月5日9.2方差方析方差分析是检验两个或两个以上样本均数间差异是否显著的方法。在比较几个组时,H0假设通常是设各组平均值相等。检验两个均数间差别的显著性可以用t检验法,也可用方差分析法。第3页,共51页,星期日,2025年,2月5日方差分析的基本概念样本均数间所以有差别,可能有两种原因造成:首先它们必须有抽样误差(个体间变异的影响;其次,如果各组所接受的不同处理方法是有不同的作用的,那么,它也是由于处理不同所造成的。第4页,共51页,星期日,2025年,2月5日方差分析的基本概念如果处理是没有作用的,即各样本均数来自同一总体,那么用方差分析的方法可以算出个体间变异σ2的估计值组内均方(M.S组内)。这时,由方差分析法算出的组间均方(M.S组间),也是个体间变异σ2的估计值。如以组内均方除组间均方,称之为F值,即F=M.S组间/M.S组内,则由于组间和组内均方都是个体间变异σ2的估计值,因之,如无抽样误差则F应该等于1。但由于组间和组内均方都只是σ2的估计值,由于抽样误差的关系,组间均方和组内均方都不正好等于σ2,因之F也不正好等于1,而可以大于或小于1。第5页,共51页,星期日,2025年,2月5日方差分析的基本概念但由于样本来自相同总体,F值一般不会距1很远,其分布情况(F分布)与组间和组内自由度有关。与此相反,如果处理是确有作用的,即各样本均数不是取自相同总体,这时用方差分析计算出来的组内均方仍是个体间变异σ2的估计值。但组间均方则不仅是个体变异所致,同时也由于处理的作用不同所致。第6页,共51页,星期日,2025年,2月5日9.2方差方析方差分析的基本思想是把全部数据关于总均值的离均差平方和分解成几个部分,每一部分表示