概率统计第1页,共32页,星期日,2025年,2月5日具体:若估计参数为,要考虑估计量落在的可能性有多大。即求,若给定了可能的值,则就可以求出它的可能范围。在估计湖中鱼数的问题中,若已知得到鱼数N的极大似然估计为1000条。而实际上N的真值可能大于1000条,也可能小于1000条。则在区间估计中就可以给出一个区间,在此区间内合理地相信N的真值位于其中。这样就可对鱼数的估计更有把握.例如:第2页,共32页,星期日,2025年,2月5日希望确定一个区间,使得在该区间内能以比较高的可靠程度相信它包含未知参数的真值。[]而这“可靠程度”是用概率来度量的,称为置信概率、置信度或置信水平.习惯上把置信水平记作,这里是一个很小的正数。称该区间为置信区间。湖中鱼数的真值故所讨论的问题是:第3页,共32页,星期日,2025年,2月5日一.置信区间定义:设总体X的分布函数含有一个未知参数,和满足:,对于给定的值,若由样本确定的两个统计量:是的置信度为的置信区间,和为置信度为的双侧置信区间的置信下限和置信上限.称为置信度或置信概率。则称随机区间第4页,共32页,星期日,2025年,2月5日注:定义的含义是指:在反复抽样多次(各种得到的样本容量相等,均为n),每个样本值确定一个区间,每个这样的区间要么包含的真值,要么不包含的真值,按贝努力大数定理可知在这么多的区间中包含真值的约占不包含真值的仅占▲▲对置信区间有两个要求:大的可能被包含在该区间内,即要求:一是要求以很尽可能大.二是要求估计的精度要尽可能的高,即要求区间尽可能短。可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.第5页,共32页,星期日,2025年,2月5日正态随机变量情形的区间估计.给定置信度,求置信区间.讨论的问题:讨论的对象:二.正态总体均值的区间估计1.单各正态总体情形问题:设X1,…Xn是取自的样本,求:参数的置信度为的置信区间.解:(1).当方差已知的情形选的点估计(无偏估计)为寻找未知参数的一个良好估计~N(0,1),且统计量而且是样本的均值与方差,给定置信度第6页,共32页,星期日,2025年,2月5日U不依赖于任何未知参数。现对于给定的置信水平(大概率),根据U的分布,确定一个区间,使得U取值于该区间的概率为故对于给定的置信水平,按照标准正态分布的分位点的定义有:从中解得:第7页,共32页,星期日,2025年,2月5日于是所求的置信度为置信区间为:也可简记为:第8页,共32页,星期日,2025年,2月5日例1.某实验室测量铝的比重16次,得平均值,设总体(高斯已证明测量误差是服从正态分布)求:的95%的置信区间.解:由已知:查正态分布表得:得:取统计量:第9页,共32页,星期日,2025年,2月5日即用来估计值的可靠程度达到95%的区间范围是(2.691,2.719)(2).方差未知的情形用去代替得统计量:它是不依赖于任何未知参数的.从而的的置信区间为:未知,但考虑到样本方差是的无偏估计,第10页,共32页,星期日,2025年,2月5日即:从中解得:于是所求的置信度为置信区间为:第11页,共32页,星期日,2025年,2月5日例2.确定某种溶液的化学浓度,现任取4个样品,测得样本均值为样本标准方差为:现溶液的化