第1页,共32页,星期日,2025年,2月5日§16.1数据误差的几种定义测定值与真值之间的差异,称为测定值的观测误差,简称误差。绝对误差误差为正,测量值偏大,称“强近似”,负号代表“弱近似”数值为偏离大小若取的最大值,则称为最大绝对误差,可以认为所有观测值都在之内,或者说真值T在测定值的范围之内,从而在绝对数量上说明了测定值准确程度。第2页,共32页,星期日,2025年,2月5日相对误差在某些场合,只有用误差和测定值的相对大小才能更好地表示测量的准确程度,引进了相对误差的概念。绝对误差和真实值的比值,叫做相对误差,用表示第3页,共32页,星期日,2025年,2月5日残差:观测值与算术平均值之差平均误差为了了解多次观测中误差的平均水平,从而评价观测的精度,就把所有误差先取绝对值,然后总和平均,不管误差的正负,只要数值一样,对平均误差这个统计量的贡献相同,由此得到算术平均误差a,也叫均偏:或然误差(又称中值误差或概差)定义为:比这个数值小的误差出现的概率,与比这个数值大的观测误差出现的概率恰好相等,各占一半,用表示。第4页,共32页,星期日,2025年,2月5日均方误差(又称标准误差)目的:对大误差出现的可能性做足够的估计。平均误差中,使为数极少的大误差在平均过程中被为数众多的小误差所淹没,不能够清楚的反映大误差特征。定义:对各个误差的平方和取平均,再对其结果开平方。若为各个观测值的误差,则:第5页,共32页,星期日,2025年,2月5日考虑到观测误差的所谓“自由度”:只有一个观测值是无法计算误差的,二个观测值可以计算误差,但这二个误差是相互约束的,而只有一个是自由的,故严格来讲,应该是:观测较多时,n与n-1在计算时差别不大,可用n代替,观测较少时,要用n-1。可以证明,它就是误差正态分布函数中的第6页,共32页,星期日,2025年,2月5日X=5:0.1:6样本数11:均方差为0.3162样本数10:均方差为0.3317X=3次X样本数33:均方差为0.3162样本数32:均方差为0.3211X=9次X样本数99:均方差为0.3162样本数98:均方差为0.3178第7页,共32页,星期日,2025年,2月5日根据误差正态分布函数,可以计算出绝对值大于均方误差的误差,其出现的概率约为32%,即有68%的观测值在均方误差的数值范围之内比均方误差大二倍以上的误差出现的概率为3.5%,大于三倍的均方误差的误差概率只有0.3%或然误差第8页,共32页,星期日,2025年,2月5日离差系数两个均值相同的系列,可以用均方差大小来测定它们的离散程度,但在均值不等时,则不行。均方差受平均值的约束,一般而言,均值大的系列,均方差要大一些,因此均方差相等,不能说明两系列的离散程度一样。为消除均值的影响,用均方差与均值的比值来表征,称为离差系数:第9页,共32页,星期日,2025年,2月5日偏差系数系列的离散程度可以通过均方差和离差系数来了解,可是对于系列的偏度,即是对称分布还是非对称分布仍不知道,需要用另外的度量来测定它。一个数列按大小次序排列后,如果相对平均值的两边对称位置上的各变数都相等,此时称这个系列为对称分布,否则为偏态分布。偏度:第10页,共32页,星期日,2025年,2月5日对称分布时,均差立方有正负号,正负号立方正好抵消,即偏度=0偏态分布时,偏度0,正值占优势,称为正偏,偏度0,负值占优势,称为负偏。同均方差要化成离散系数一样,偏度也要消除均方差所引起的影响,定义为偏差系数:第11页,共32页,星期日,2025年,2月5日§16.2函数误差的传播1、函数误差合成间接测量的量y的系统误差△y等于直接测量的各分量的已定系统误差与相应的偏导数的乘积之代数和假定因变量y与多个自变量x1,x2,…,xn存在函数关系:例如:密度或声速=f(温度、盐度、压力)等第12页,共32页,星期日,2025年,2月5日对函数进行偏微分注意:这是指一次观测的偏差值,而不是经过处理后的误差统计量第13页,共32页,星期日,2025年,2月5日2、函数均方误差x1,x2,…,xn是能够独立观测的量,对应有各自的均方误差s1,s2,…,sn,y要由n个自变量的测定值来计算,那么,所计算的函数值y的均方误差有多大?第14页,共32页,星期日,2025年,2月5日对所有