令=V,得a=这表明a同样是随机变量Y的线性组合。线性性对于确定最小二乘估计量服从什么分布非常重要。由于解释变量X是确定性的,与最小二乘估计量的分布性质无关,因此最小二乘估计量可以表示为被解释变量观测值Y的线性组合,就与Y有相同类型的概率分布。*第29页,共62页,星期日,2025年,2月5日?和V两个指标的性质=0,==1,=1,=0*第30页,共62页,星期日,2025年,2月5日二、最小二乘估计的均值和无偏性定义:参数估计量的均值就是真实值:b的无偏性的证明*第31页,共62页,星期日,2025年,2月5日a的无偏性同理可证。意义:参数估计量是以参数真实值为分布中心的随机变量,反复抽样估计可得真实值。这是重要的分布性质,是推断分析的基础。因为同时具有线性性和无偏性,因此最小二乘估计量是线性无偏估计量。*第32页,共62页,星期日,2025年,2月5日三、最小二乘估计的方差和最小方差性在参数估计是无偏估计、线性无偏估计的基础上,方差较小的则意味着参数估计的精确程度较高,统计推断的效果也较好。b的方差:a的方差:*第33页,共62页,星期日,2025年,2月5日在所有可能的线性无偏估计中,最小二乘估计a和b的方差最小。这个性质称为最小方差性,也称为有效性。最小二乘估计是参数真实值的最小方差线性无偏估计,也称为最优线性无偏估计或BLUE估计。*第34页,共62页,星期日,2025年,2月5日四、最小二乘估计的一致性定义:参数估计量的概率极限等于参数真实值。意义:属于大样本性质。保证增加样本容量可以逼近参数真实值。最小二乘估计在模型假设下是一致估计。*第35页,共62页,星期日,2025年,2月5日第四节回归拟合度评价和决定系数一、拟合度评价的意义二、离差分解和决定系数*第36页,共62页,星期日,2025年,2月5日一、拟合度评价的意义评价回归分析、参数估计优劣的根本标准,是回归直线对样本数据的吻合程度,也称为“拟合度”或“回归拟合度”。回归拟合度是判断和检验参数估计方法的方法之一。回归拟合度也是检验模型变量关系真实性,判断模型假设是否成立的重要方法。*第37页,共62页,星期日,2025年,2月5日二、离差分解和决定系数残差平方和不适用作为拟合度的评价指标。用Y的离差被回归值或X的离差决定的程度作为评价拟合度的标准。离差分解SST=SSR+SSE(式3-3)。*第38页,共62页,星期日,2025年,2月5日1、离差分解总离差平方和SST==其中=称为“回归平方和”,记为SSR。残差平方和记为SSE。+*第39页,共62页,星期日,2025年,2月5日(3-3)式表明被解释变量Y的离差平方和可以分解为两部分,一部分是回归平方和,另一部分则是残差平方和。前一部分SSR相对后一部分SSE越大,说明回归拟合程度越好,Y与X之间的线性决定关系越明显。*第40页,共62页,星期日,2025年,2月5日2、决定系数为了突出这几部分之间的相对关系,将(3-3)式两边同除以SST得到:1=+式中的正是反映解释变量(或回归直线)对被解释变量决定程度的指标,称为“决定系数”,通常用R表示。*第41页,共62页,星期日,2025年,2月5日R的数值在0到1之间,是一个相对比重指标,可以避免样本数量和样本数值、单位的影响,因此在不同模型和不同样本的回归分析中具有可比性,是比残差平方和更合理的回归拟合度指标。*第42页,共62页,星期日,2025年,2月5日第五节统计推断一、最小二乘估计的分布和标准化二、误差项方差的估计三、参数的置信区间和假设检验*第43页,共62页,星期日,2025年,2月5日一、最小二乘估计的分布和标准化线性回归模型的统计推断需要以参数估计量的概率分布为基础。根据对最小二乘估计量性质的分析,已知最小二乘估计量服从以参数真实值为中心,以误差项方差的一个比例为方差的正态分布。*第44页,共62页,星期日,2025年,2月5日*第1页,共62页,星期日,2025年,2月5日本章主要内容第一节两变量线性回归模型第二节参数估计