第1页,共35页,星期日,2025年,2月5日引言前面,我们讨论了参数点估计.它是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大.区间估计正好弥补了点估计的这个缺陷.第2页,共35页,星期日,2025年,2月5日譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数N的极大似然估计为1000条.若我们能给出一个区间,在此区间内我们合理地相信N的真值位于其中.这样对鱼数的估计就有把握多了.实际上,N的真值可能大于1000条,也可能小于1000条.第3页,共35页,星期日,2025年,2月5日也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值.湖中鱼数的真值[]这里所说的“可靠程度”是用概率来度量的,称为置信概率,置信度或置信水平.习惯上把置信水平记作,这里是一个很小的正数.第4页,共35页,星期日,2025年,2月5日置信水平的大小是根据实际需要选定的.例如,通常可取置信水平=0.95或0.9等.根据一个实际样本,由给定的置信水平,我小的区间,使们求出一个尽可能置信水平为的置信区间,其中为两个统计量.称区间为的第5页,共35页,星期日,2025年,2月5日寻找置信区间的方法,一般是从确定误差限入手.使得称为与之间的误差限.我们选取未知参数的某个估计量,根据置信水平,可以找到一个正数,只要知道的概率分布,确定误差限并不难.第6页,共35页,星期日,2025年,2月5日下面我们就来正式给出置信区间的定义,并通过例子说明求置信区间的方法.由不等式可以解出:这个不等式就是我们所求的置信区间.第7页,共35页,星期日,2025年,2月5日前面已经给出了概率分布的上侧分位数(分位点)的定义,为便于应用,这里我们再简要复习一下.在求置信区间时,要查表求分位数.设01,对随机变量X,称满足的点为X的概率分布的上分位数.第8页,共35页,星期日,2025年,2月5日例如:标准正态分布的上分位数第9页,共35页,星期日,2025年,2月5日例如:分布的上分位数自由度为n的第10页,共35页,星期日,2025年,2月5日F分布的上分位数自由度为n1,n2的第11页,共35页,星期日,2025年,2月5日书末附有分布、t分布、F分布的上侧分位数表,供使用.需要注意的事项在教材上有说明.至于如何由标准正态分布函数表查表求得分位数,若你对分布函数定义熟悉的话,这个问题不难解决.现在回到置信区间题目上来.第12页,共35页,星期日,2025年,2月5日一、置信区间定义:满足设是一个待估参数,给定若由样本X1,X2,…Xn确定的两个统计量则称区间是的置信水平(置信度、置信概率)为的置信区间.分别称为置信下限和置信上限.第13页,共35页,星期日,2025年,2月5日一旦有了样本,就把估计在区间内.这里有两个要求:可见,对参数作区间估计,就是要设法找出两个只依赖于样本的界限(构造统计量)(X1,…Xn)(X1,…Xn)第14页,共35页,星期日,2025年,2月5日2.估计的精度要尽可能的高.如要求区间长度尽可能短,或能体现该要求的其它准则.1.要求以很大的可能被包含在区间内,就是说,概率要尽可能大.即要求估计尽量可靠.可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.第15页,共35页,星期日,2025年,2月5日~N(0,1)选的点估计为求参数的置信度为的置信区间.(1)设X1,…Xn是取自的样本,二、置信区间的求法寻找未知参数的一个良好估计.解:寻找一个待估参数和估计量的函数,要求其分布为已知.有了分布,就可以求出U