*********************第2步:绘制散点图,观察因变量与自变量之间是否有线性关系。点击【图形】→【旧对话框】→【散点/点状】,弹出散点图/点图对话框。点击【简单分布】→【定义】,弹出简单散点图对话框。将左边源变量“火灾损失”送入“Y轴”,“距消防站距离”送入“X轴”。*点击【确定】,即可得到如图8-8所示的散点图,可见火灾的损失数额与距消防站的距离之间有明显的线性关系。*第3步:对火灾损失数额与距消防站距离建立简单线性回归模型,SPSS软件的操作过程如下。(1)点击【分析】→【回归】→【线性】,弹出图8-9所示的线性回归主对话框。将左边源变量“火灾损失”送入“因变量”,“距消防站距离”送入“自变量”。**(2)点击图8-9右边的【统计量】。弹出如图8-10所示的“线性回归:统计量”对话框,在回归系数一栏中勾选“估计”和“置信区间”,同时勾选“模型拟合度”和“描述性”,点击【继续】返回图8-9的对话框。**(3)点击图8-9右边的【保存】。弹出如图8-11所示的“线性回归:保存”对话框,在预测值栏和残差栏中都勾选“未标准化”,在预测区间栏中勾选“均值”和“单值”,点击【继续】返回图8-9的对话框。*(4)点击图8-9右边的【选项】。打开如图8-12所示的“线性回归:选项”对话框,勾选“在等式中包含常量”,在缺失值栏中选择“按列表排除个案”,点击【继续】返回图8-9的主对话框,再点击【确定】,提交系统执行。***第4步:对SPSS软件的输出结果进行分析。输出结果如下:**(1)从描述性统计表中可以得到样本自变量和因变量的均值和标准差,以及有效样本容量。(2)从模型汇总表可以看出,判定系数,说明回归方程能够解释因变量总波动的92.3%,从判定系数角度而言,模型拟合效果很好。估计的标准误差。*(3)从方差分析表(ANOVA表)可以得出,检验的值等于0.000,说明与之间的线性关系高度显著。(4)从系数表可以得到估计的回归方程是,回归系数的统计量的值等于12.525,检验的值等于0.000,说明回归系数显著不为0。另外,的95%的置信区间为。*(5)残差分析。以新生成的变量序列(未标准化残差)为纵轴,绘制残差与自变量的散点图,得到如图8-13所示的残差图。我们发现,残差围绕上下随机波动,无任何规律,说明回归模型满足对残差项的基本假定。结合判定系数、回归方程的检验、回归系数的检验,可以得出结论,火灾损失()与火灾发生地距消防站的距离()之间存在显著的线性关系。**(6)应用。前面几步已经检验和分析出,估计的回归方程是合适的。对估计的方程,可以做出如下解释:火灾发生地距最近的消防站的距离每增加1英里,火灾损失就会增加4919美元。这说明距最近的消防站的距离与火灾损失呈正相关关系,符合实际中我们对两者关系的看法。*我们还发现,在数据视图中多了一些变量,可以切换到变量视图中,查看变量标签,发现变量代表的含义。对于第16行的数据,并未作为样本参与到回归方程的建模中,给定自变量的新值为,可以得到,的平均值的95%的预测区间为,的个别值的95%的预测区间为。***************为了保证模型的准确性和可靠性,在利用回归方程做分析和预测之前,需要利用残差图来诊断回归效果和样本数据质量,判断是否需要对模型进行进一步的修正。对于第个样本,残差为,是实际观测值与回归方程给出的拟合值之差。误差项为,我们*通过比较两个表达式正确区分二者。残差可以看作是误差项的估计。在绘制残差图之前,先回顾一下关于误差项的假定。1.误差项的期望值为零;2.误差项的方差为常数;3.误差项之间不相关;4.误差项服从正态分布。*以残差为纵轴,自变量或者因变量拟合值为横轴,将相应的残差点画在直角坐标系中,就可以得到残差图。下面给出一些常见情况的残差图。一般来说,如果残差围绕上下随机波动,无任何规律,我们认