基本信息
文件名称:拓展资料:突破回归分析的难点问题.doc
文件大小:43 KB
总页数:3 页
更新时间:2025-05-24
总字数:约1.33千字
文档摘要

PAGE1/NUMPAGES2

突破回归分析的难点问题

回归分析是一种从事物因果关系出发进行预测的方法。在操作中,根据统计资料求得因果关系的相关系数,相关系数越大,因果关系越密切。通过相关系数就可确定回归方程,预测今后事物发展的趋势。通常,求一个变量对另一个变量的因果关系,叫一元回归分析;而求多个变量之间的因果关系,叫多元回归分析。在此,我们只研究一元回归分析。解决回归分析问题的难点主要有以下几个:一是回归直线方程的求解,由于数据较多,计算公式复杂,往往容易出现计算错误;二是对样本数据组的线性相关性检验,其衡量标准是样本数据组的相关系数,这个系数的绝对值越接近1,其线性相关性越强;三是对不同模型拟合效果的比较,衡量的标准是残差平方和与相关指数,残差平方和越小、相关指数越大,拟合效果越好。下面通过三个例题谈谈如何突破回归分析的三个难点问题。

【例1】下列四个命题正确的是

①线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越弱;

②残差平方和越小的模型,拟合的效果越好;

③用相关指数来刻画回归效果,越小,说明模型的拟合效果越好;

④随机误差e是衡量预报精确度的一个量,它满足E(e)=0.

A.①③B.②④C.①④D.②③

分析:根据回归分析的相关知识作出判断.

解析:由于线性相关系数r的取值是[-1,1],当|r|越接近1时,线性相关性越强,命题①不正确;残差平方和越小,说明真实值和预报值之间的差异越小,拟合效果就越好,命题②正确;相关指数的取值范围是[0,1],相关指数越接近1,拟合效果越好,故命题③不正确;随机误差是衡量预报精确度的一个量,这个随机变量的均值等于零,命题④正确.故选B.

点评:本题全面考查了回归分析的基础知识,化解本题难点的关键就是对回归分析的基本思想和方法有较为全面的了解.

【例2】某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算得,,,,则y与x之间的回归直线方程是.(精确到0.01)

解析:由回归系数的计算公式得,,故所求的回归直线方程为.故填.

点评:求解线性回归直线方程的关键是正确地利用公式进行计算,由于数据较多、计算繁琐,在计算时要格外小心.同时注意不要混淆了回归系数和回归常数.

【例3】假设关于某设备的使用年限x和所支出的维修费y(万元),有如下的统计资料:

若由资料可知y和x呈相关关系,由表中数据算出线性回归方程=bx+a中的b=1.23,据此估计,使用年限为10年时的维修费用是万元.

(参考公式:)

分析:只要计算出样本中心点(),代入公式计算即可求出回归直线方程,然后利用回归直线方程作出估计.

解析:,故样本中心点是(4,5),故,所以=1.23x+0.08,所以使用年限为10年时的维修费用大约是1.23×10+0.08=12.38.故填12.38.

点评:根据计算公式,回归直线一定经过样本中心点(),这个结论既是检验所求回方直线方程是否准确的依据,也是解决问题的一个依据.