4-
3-
自主学习 规范表达
-1-
8.1.2样本相关系数
【学习目标】
1.会通过相关系数比较多组成对数据的相关性.(重点)
2.了解样本相关系数与标准化数据向量夹角的关系.(难点)
一.独学内化
1.一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在象限、象限,对应的成对数据同号的居多;如果变量x和y,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多.
2.样本相关系数:r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2))
=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))yeq\o\al(2,i)-n\o(y,\s\up6(-))2)).
3.样本数据相关系数r的绝对值大小反映成对数据之间线性相关的程度.
(1)当|r|越接近1时,成对样本数据的线性相关程度;
(2)当|r|越接近0时,成对样本数据的线性相关程度.
(3)当r=0时,成对样本数据间没有关系.
4.1.关于两个变量x,y与其样本相关系数r,有下列说法:
①若r0,则x增大时,y也相应增大;
②若|r|越接近1,则x与y的线性相关程度越强;
③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.
其中正确的有()
A.①② B.②③
C.①③ D.①②③
5.用线性回归模型求得甲、乙、丙三组不同样本数据的样本相关系数分别为0.81,-0.98,0.63,其中________(填甲、乙、丙中的一个)组样本数据的线性相关性最强.
小组合学
下列说法正确的是________(填序号).
①若变量间的关系是非确定性关系,则因变量不能由自变量唯一确定
②线性相关系数可以是正的或负的
③如果样本一的相关系数r1=-0.9,样本二的相关系数r2=0.7,因r1r2,故样本二的变量的线性相关性强
④线性相关系数r∈(-1,1)
三.检学作业
1.两个变量x,y的样本相关系数r1=0.7859,两个变量u,v的样本相关系数r2=-0.9568,则下列判断正确的是()
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
2.已知两个变量x,y线性相关,相关系数r0,平移坐标系,则在以(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.
3.某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销售模式.下表是该企业每月生产的一种核心产品的产量x(件)与相应的生产总成本y(万元)的五组对照数据:
产量x(件)
1
2
3
4
5
生产总成本y(万元)
3
7
8
10
12
试求y与x的样本相关系数r.(结果保留两位小数)
参考公式:r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)).
参考数据:eq\r(115)≈10.7.