第3课时成对数据的统计分析
[考试要求]1.了解样本相关系数的统计含义.2.理解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.3.会利用统计知识进行数据分析.
1.变量的相关关系
两个变量________,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系,即不确定性关系.
2.相关关系的分类
(1)按变量间的增减性分为____相关和____相关.
①正相关:当一个变量的值增加时,另一个变量的相应值也呈现______的趋势;
②负相关:当一个变量的值增加时,另一个变量的相应值呈现______的趋势.
(2)按变量间是否有线性特征分为______相关和________相关(曲线相关).
①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在__________附近,我们称这两个变量线性相关;
②非线性相关或曲线相关:如果两个变量具有相关性,但不是______相关,我们称这两个变量非线性相关或曲线相关.
3.相关关系的刻画
(1)散点图:成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图,叫做散点图.
(2)样本相关系数r的计算式
(3)样本相关系数r的性质
①样本相关系数r的取值范围为____________;
②若r0时,成对样本数据____相关;
③若r0时,成对样本数据____相关;
④样本相关系数与相关程度
当|r|越接近___时,成对样本数据的线性相关程度越强;
当|r|越接近___时,成对样本数据的线性相关程度越弱.
提醒:当两个变量的样本相关系数|r|=1时,两个变量呈函数关系.
4.一元线性回归模型与最小二乘法
(1)一元线性回归模型
称Y=bx+a+e,Ee=0,De=σ2为Y关于x的一元线性回归模型.其中,Y称为________或响应变量,x称为________或解释变量,___称为截距参数,___称为斜率参数;
(2)最小二乘法
将y=bx+a称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得的b,a叫做b,a的最小二乘估计,其中
b=________________,a=__________.
5.刻画回归效果的方式
(1)残差图法
在残差图中,残差比较均匀地分布在以横轴为对称轴的水平的带状区域中,说明满足一元线性回归模型的假设,这样的带状区域的宽度越____,说明模型拟合精度越高.
(2)残差平方和法
残差平方和为________,残差平方和越____,模型拟合效果越好.
(3)决定系数法
R2=R2的值越趋近于1,模型的拟合效果越好.
6.列联表与独立性检验
(1)分类变量X,Y的2×2列联表:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
则χ2=____.
(2)利用χ2的取值推断分类变量X和Y是否______的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
(3)χ2独立性检验中几个常用的小概率值和相应的临界值.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
[常用结论]
经验回归直线必过样本点的中心(x,
一、易错易混辨析(正确的打“√”,错误的打“×”)
(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系. ()
(2)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.()
(3)若事件X,Y关系越密切,则由观测数据计算得到的χ2的观测值越小.()
(4)经验回归方程y=bx+a中,若a<0,则变量x和y负相关. ()
二、教材经典衍生
1.(人教A版选择性必修第三册P103习题8.1T1改编)下列四个散点图中,变量x与y之间具有负的线性相关关系的是()
AB
CD
2.(人教A版选择性必修第三册P103练习T3改编)在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的样本相关系数为()
A.12B.-1C.0D.-
3.(人教A版选择性必修第三册P113练习T2改编)从某学校随机选取8名女大学生,关于其身高x(单位:cm)和体重y(单位:kg)的经验回归方程为y=0.849x-85.712,则身高172cm的女大学生的体重约为________kg.
4.(人教A版选择性必修第三册P133例题改编)为了调查患肺癌是否与吸烟有关,某机构调查了100名50岁以下的人,调查结果如下表:
单位:人
吸烟
肺癌
合计
肺癌患者