电大社会统计学第九章相关系数和简单回归第1页,共23页,星期日,2025年,2月5日第九章相关系数和简单回归第2页,共23页,星期日,2025年,2月5日学习目标:
1、了解散点图的特点,能根据散点图判断变量间的关系。
2、了解相关系数的使用场合和作用,掌握相关系数的计算与解释。
3、了解回归分析的作用,熟悉回归方程的含义与计算。
4、了解最小二乘法的基本原理,掌握判定系数的含义与作用。
5、能使用SPSS绘制散点图,进行相关分析和一元线性回归分析。第3页,共23页,星期日,2025年,2月5日第一节散点图一、变量间的关系根据现象之间关系的不同,可以将变量间的关系分为函数关系和相关关系两类。(1)函数关系函数关系是指各变量之间存在一一对应的关系,而且存在一定的函数形式。当一个或几个变量取某一个值时,另一个变量有唯一的值与之相对应。用数学关系表示为:y=f(x),其中y为因变量,x为自变量。例如,在商品单价确定时,商品销售额与销售量呈函数关系,即销售量越大,销售额越大,且他们之间是一一对应关系,销售额=销售量*单价。第4页,共23页,星期日,2025年,2月5日(2)相关关系相关关系是指各变量之间存在一定的依赖或影响,但是一个变量的值不能由另一个或另几个变量唯一确定,即当一个或多个变量取某个值时,另一个变量的值并不是唯一确定的。例如,一般情况下,教育程度越高、收入越高,但是二者之间也不存在一一对应的关系,受教育水平相同收入不一定相同。相关关系可以分为完全相关、线性相关、非线性相关和不相关。完全相关是指一个变量完全依赖另一个变量,也就是函数关系,分为完全正相关、完全负相关;线性相关是指变量间关系近似地可以用一条直线表示,线性相关根据变量间的变动方向分为正线性相关和负线性相关;非线性相关是指变量间的关系近似地表现为一条曲线;不相关是指变量之间的关系没有规律可循。第5页,共23页,星期日,2025年,2月5日如果两个变量的变动方向一致,即一个变量增加,另一个变量也随之增加,或者一个变量减少,另一个变量也减少,我们称之为正线性相关。如果两个变量的变动方向相反,即一个变量增加,另一个变量减少,或者一个变量减少,另一个变量增加,我们称之为负线性相关。第6页,共23页,星期日,2025年,2月5日二、散点图散点图是在坐标系中,用X轴表示自变量x,用Y轴表示因变量y,而变量组(x,y)则用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形成的二维图就是散点图。第7页,共23页,星期日,2025年,2月5日散点图的作用散点图是描述变量关系的一种直观方法,从散点图中直观的看出两个变量之间是否存在相关关系、是正线性相关还是负线性相关,也可以大致看出变量之间关系强度如何,但是对于具体关系强度则需要相关系数来判断。第8页,共23页,星期日,2025年,2月5日三、利用SPSS绘制散点图第9页,共23页,星期日,2025年,2月5日第二节相关系数相关系数就是对变量之间相关关系程度和方向的度量。当研究两个变量之间的相关关系时我们称之为简单相关系数。总体相关系数用ρ表示,样本相关系数一般用r表示。第10页,共23页,星期日,2025年,2月5日相关系数的计算第11页,共23页,星期日,2025年,2月5日相关系数的取值在-1~1之间,正值表示正相关,负值表示负相关,绝对值越大,相关程度越大。当当0r1时,两变量之间正线性相关,当-1r0时,两变量之间负线性相关:r=0时,说明变量之间不存在线性相关,而不能说它们之间不相关;00.3时,变量之间相关程度很低,可以视为不相关;0.3≤0.5时,低度相关;0.5≤0.8时,中度相关;0.8≤1时,高度相关;r=1时,完全正相关,r=-1时,两变量之间完全负相关。第12页,共23页,星期日,2025年,2月5日例如,企业的产量与生产费用之间存在相关关系,根据表9—1中提供的数据计算产量与生产费用之间相关系数。第13页,共23页,星期日,2025年,2月5日第14页,共23页,星期日,2025年,2月5日第15页,共23页,星期日,2025年,2月5日二、相关系数的应用1、相关系数的适用场合计算相关系数时不需要区分自变量和因变量,两个变量之间处于平等地位,两个变量之间存在线性相关,那么相关系数只有1个。计算相关系数时,X,Y都必须是随机变量,否则不能计算相关系数。样本中各个变量的数据必须都是随机抽选的,利用随机抽选的数据计算相关系数可以保障计算结果的客观和准确。第16页,共23页,星期日,2025年,2月5日2、相关系数的作用相关系数的大小只