医学统计学Ch09三、相关系数的统计推断(一)相关系数的假设检验(9-19)医学统计学Ch09例9-6对例9-5所得r值,检验尿肌酐含量与年龄是否有直线相关关系?医学统计学Ch09检验步骤本例n=8,r=0.8818,按公式(9-19)医学统计学Ch09(二)总体相关系数的可信区间医学统计学Ch09具体步骤如下医学统计学Ch09例9-7对例9-5所得r值,估计总体相关系数的95%可信区间。再按公式(9-22)将z作反变换,得到年龄与尿肌酐含量的总体相关系数95%可信区间为(0.4678,0.9971)。医学统计学Ch09四、决定系数(coefficientofdetermination)定义为回归平方和与总平方和之比,计算公式为:(9-23)取值在0到1之间且无单位,其数值大小反映了回归贡献的相对程度,也就是在Y的总变异中回归关系所能解释的百分比。医学统计学Ch09医学统计学Ch09五、直线回归与相关应用的注意事项
医学统计学Ch091.根据分析目的选择变量及统计方法直线相关用于说明两变量之间直线关系的方向和密切程度,X与Y没有主次之分;直线回归则进一步地用于定量刻画应变量Y对自变量X在数值上的依存关系,其中应变量的定夺主要依专业要求而定,可以考虑把易于精确测量的变量作为X,另一个随机变量作Y,例如用身高估计体表面积。两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归或相关分析。医学统计学Ch09医学统计学Ch092.进行相关、回归分析前应绘制散点图—第一步
(1)散点图可考察两变量是否有直线趋势;(2)可发现离群点(outlier)。散点图对离群点的识别与处理需要从专业知识和现有数据两方面来考虑,结果可能是现有回归模型的假设错误需要改变模型形式,也可能是抽样误差造成的一次偶然结果甚至过失误差。需要认真核对原始数据并检查其产生过程认定是过失误差,或者通过重复测定确定是抽样误差造成的偶然结果,才可以谨慎地剔除或采用其它估计方法。医学统计学Ch09医学统计学Ch09医学统计学Ch091.方差分析医学统计学Ch09医学统计学Ch09数理统计可证明:医学统计学Ch09上式用符号表示为式中医学统计学Ch09医学统计学Ch09上述三个平方和,各有其相应的自由度,并有如下的关系:医学统计学Ch09如果两变量间总体回归关系确实存在,回归的贡献就要大于随机误差,大到何种程度时可以认为具有统计意义,可计算统计量F:医学统计学Ch09式中医学统计学Ch092.t检验医学统计学Ch09例9-2检验例9-1数据得到的直线回归方程是否成立?医学统计学Ch09(1)方差分析医学统计学Ch09表9-2方差分析表列出方差分析表如表9-2。医学统计学Ch09(2)t检验医学统计学Ch09注意:
医学统计学Ch09(二)总体回归系数的可信区间利用上述对回归系数的t检验,可以得到β的1-α双侧可信区间为医学统计学Ch09例9-3根据例9-1中所得b=0.1392,估计其总体回归系数的双侧95%可信区间。医学统计学Ch09(0.1392-2.447×0.0304,0.1392+2.447×0.0304)=(0.0648,0.2136)医学统计学Ch09(三)利用回归方程进行估计和预测医学统计学Ch09(9-15)(9-14)反映其抽样误差大小的标准误为医学统计学Ch09(9-16)(9-17)医学统计学Ch09医学统计学Ch09例9-4用例9-1所得直线回归方程,计算当X0=12时,的95%可信区间和相应个体值的95%预测区间。医学统计学Ch09计算步骤例9-1、例9-2已计算出医学统计学Ch09医学统计学Ch09第二节直线相关医学统计学Ch09直线相关(linearcorrelation)又称简单相关(simplecorrelation),用于双变量正态分布(bivariatenormaldistribution)资料。其性质可由图9-6散点图直观的说明。目的:研究两个变量X,Y数量上的依存(或相关)关系。特点:统计关系一、直线相关的概念医学统计学C