总体均数可信区间的计算当σ已知在总体中抽样,样本均数的Z变换值有95%可能性落在(-1.96,1.96)之间在总体中抽样,样本均数所计算的区间有95%可能包括总体均数第28页,共62页,星期日,2025年,2月5日?2.5%2.5%95%第29页,共62页,星期日,2025年,2月5日?未知但n足够大(n50)第30页,共62页,星期日,2025年,2月5日例6-3中,因n=120,,,试求该地正常成年男性血清胆固醇平均水平的95%可信区间。即(3.55,4.17)mmol/L第31页,共62页,星期日,2025年,2月5日例6-1从某地随机抽取120名30岁-40岁正常男性,得其血清总胆固醇水平的均数为4.95mmol/L,标准差为0.64mmol/L,试估计该地30岁-40岁正常男性血清总胆固醇平均水平的95%可信区间。第32页,共62页,星期日,2025年,2月5日因n=120,属于?未知但n足够大,又均数为4.95mmol/L,标准差为0.64mmol/L,故该地30岁-40岁正常男性血清总胆固醇平均水平的95%可信区间为即(4.84,5.06)mmol/L第33页,共62页,星期日,2025年,2月5日当σ未知n较小-t?/2,v0t?/2,v第34页,共62页,星期日,2025年,2月5日可信区间的涵义从总体中作随机抽样,每个样本可以算得一个可信区间。如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确。在实际研究中,一般只进行一次抽样,算得一个可信区间,对于这个可信区间来说,我们就认为该区间包含了总体均数,把握度为95%。第35页,共62页,星期日,2025年,2月5日图6-5从N(0,1)中随机抽样算得的100个95%可信区间(n=10)第36页,共62页,星期日,2025年,2月5日可信区间的两个要素可信度:可靠性,即1-α。一般取90%、95%,可人为控制区间的宽度:区间的大小(区间的长度),越小越好必须二者兼顾第37页,共62页,星期日,2025年,2月5日均数的可信区间与参考值范围的区别第38页,共62页,星期日,2025年,2月5日第三节总体率的点估计与区间估计第39页,共62页,星期日,2025年,2月5日一、二项分布如某实验中小白鼠染毒后死亡概率P为0.8,则生存概率为=1-P=0.2,1、对一只小白鼠进行实验的结果为:死(概率为P)或生(概率为1-P)2、对二只小白鼠(甲乙)进行实验的结果为:甲乙均死(概率为P2)、甲死乙生[概率为P(1-P)]、乙死甲生[概率为(1-P)P]或甲乙均生[概率为(1-P)2],概率相加得P2+P(1-P)+(1-P)P+(1-P)2=[P+(1-P)]23、依此类推,对n只小白鼠进行实验,所有可能结果的概率相加得Pn+cn1P(1-P)n-1+...+cnxPx(1-P)n-x+...+(1-P)x=[P+(1-P)]n其中n为样本含量,即事件发生总数,x为某事件出现次数,cnxPx(1-P)n-x为二项式通式,cnx=n!/x!(n-x)!,P为总体率。因此,二项分布是说明结果只有两种情况的n次实验中发生某种结果为x次的概率分布。其概率密度为:P(x)=cnxPx(1-P)n-x,x=0,1,...n。:第40页,共62页,星期日,2025年,2月5日二项分布的图形第41页,共62页,星期日,2025年,2月5日当?=0.5时,分布对称;当??0.5,分布呈偏态;当?0.5时分布呈正偏态;当?0.5时分布呈负偏态;特别是当n值不是很大时,?偏离0.5愈远,分布愈偏第42页,共62页,星期日,2025年,2月5日随着n的增大,二项分布逐渐逼近正态分布。如?=0.30,n=5和n=10时,图形呈偏态,当n=30时,图形已接近正态分布。一般地说,如果n?或n(1-?)大于5时,常可用正态近似原理处理二项分布问题第43页,共62页,星期日,2025年,2月5日二项分布的性质:累积概率(1)二项分布的概率之和等于1第44页,共62页,星期日,2025年,2月5日关于总体均数和总体率第1页,共62页,星期日,2025年,2月5日第一节均数抽样误差与t分布欲了解总体的特征,最直接的方法是对总体中的每个观察单位进行测量,通过整理分析得到总体参数,但这在医学研究实