基本信息
文件名称:相关与回归的分析全.ppt
文件大小:3.79 MB
总页数:67 页
更新时间:2025-06-23
总字数:约7.57千字
文档摘要

可以看出,x与y之间的关系近似为直线关系。我们可以对其配合一条回归直线。为计算回归方程的系数a、b,我们先对原始数据进行加工。第30页,共67页,星期日,2025年,2月5日yx2y2xy1001051301451701751901902202350.811.001.441.962.252.562.893.243.614.001000011025169002102528900306253610036100484005522590105156203255280323342418470166023.762943002642炉次x12345678910?0.91.01.21.41.51.61.71.81.92.015.0原始数据加工表第31页,共67页,星期日,2025年,2月5日于是:第32页,共67页,星期日,2025年,2月5日所以:故精炼时间关于含碳量的回归方程为:y=?14.9525+120.635x?第33页,共67页,星期日,2025年,2月5日计算结果表明,这个方程显示着钢水溶液的含碳量每增加0.1%,则精炼时间平均来说大约要延长12.06分。根据回归方程,可以给出自变量的任一数值估计或预测因变量的平均可能值。y=?14.9525+120.635?2.2=150.4445(分)?例如,求含碳量2.2%所需的精炼时间:第34页,共67页,星期日,2025年,2月5日(四)相关系数相关分析是用以说明变量之间相关程度的统计工具。相关分析常常与回归分析联合使用,以衡量回归方程所表示的因变量变化的精确度如何。相关分析也可单独用于衡量变量之间的联系程度。本节我们讨论两个变量之间线性相关程度问题。两个变量之间线性相关程度的描述通常采用相关系数。第35页,共67页,星期日,2025年,2月5日(1)相关系数的意义我们回过头来考察一下线性回归中指标y的值yi与回归估计值yi的离差平方和。?记于是有:Q=Lyy(1?r2)r称为相关系数。它是在线性相关条件下用来说明两个变量之间相关关系密切程度的指标。第36页,共67页,星期日,2025年,2月5日因为Q≥0,Lyy≥0,故相关系数有一个重要性质:|r|≤1r=?1(1)?1r=0(2)r=0(3)r=0(4)0r1(5)r=1(6)相关图与相关系数经验关系第37页,共67页,星期日,2025年,2月5日由于Lyy对于一组实测数据来讲是定值,故由Q=Lyy(1?r2)可知,当|r|较大接近于1时,离差平方和Q就较小而接近于0,此时,y与x高度相关。特别当|r|=1时,称它们是完全相关的,上图(1)、(6)所示。当|r|较小而接近于0时,Q就大,y与x的相关关系很弱,特别当r=0时,称它们线性无关。如上图(3)、(4)所示第38页,共67页,星期日,2025年,2月5日由于Lxy可正可负,所以相关系数r也可正可负。若r>0则称y与x正相关,如上图(5)、(6)所示。此时,随着x的增大(或减小),y将呈现增大(或减小)的趋势。特别对于上图(6)的情形,由于r=1,故称完全正相关。若r0,则称y与x负相关,如上图(1)、(2)所示。此时,随着x的增大(或减小),y将呈现减小(或增大)的趋势。特别对于图(1)的情形。由于r=?1,故称为完全负相关。一般认为相关系数的绝对值在0.7以上为高度相关,0.3-0.7之间为中度相关,0-0.3为低相关。第39页,共67页,星期日,2025年,2月5日应当注意,相关系数r只表明x与y之间的线性关系的密切程度和方向。当r很小甚至为0时,只表明x与y之间的线性关系不密切,或不存在线性关系,并不表示x与y之间就没有关系,可能二者之间有非线性关系。如上图(4)所示,x与y之间就存在着曲线关系。第40页,共67页,星期日,2025年,2月5日(2)相关系数的计算我们已经知道,相关系数的公式为:第二节中我们介绍了离差乘积的和式:第41页,共67页,星期日,2025年,2月5日于是有:第42页,共67页,星期日,2025年,2月5日如果将分子分母同乘以n,又可得:根据前例中炼钢厂钢液含碳量与精炼时间资料,可计算相关系数。那里,我们已经求得:第43页,共67页,星期日,2025年,2月5日于是其相关系数为:计算得出r=0.9892,表明精炼时间和含碳量之间为正相关关系。而且r值接近于1,表示两者关系很密切。第44页,共67页,星期日,2025年,2月5日三、定类变量间的相关关系判