基本信息
文件名称:第五章参数估计基础.ppt
文件大小:634 KB
总页数:44 页
更新时间:2025-06-05
总字数:约1.87千字
文档摘要

置信区间的计算

(一)总体均数的置信区间

均数的置信区间1、t分布法σ未知且n较小(n≤50)时总体均数的(1-?)双侧置信区间定义为:参数估计基础抽样误差t分布可信区间第一节抽样分布与抽样误差在医学科学和卫生学研究中有很多现象需采用抽样研究方法,抽样研究的目的就是用样本信息推论总体特征,这叫统计推断。一、样本均数的抽样分布与抽样误差1、抽样分布以一个抽样模拟实验,看样本均数的抽样分布的特点:P84-85表5-11)各样本均数未必等于总体均数;2)样本均数间存在差异;3)样本均数围绕均数(155.4cm)也呈正态分布;4)样本均数变异较原变量的变异大大减小。2、抽样误差的概念由抽样引起的样本统计量与总体参数间的差异两种表现形式1)样本统计量与总体参数间的差异2)样本统计量间的差异抽样误差产生的条件:抽样研究个体变异3、均数的标准误中心极限定理(centrallimittheorem)从均数为?、标准差为?的总体中独立随机抽样,当样本含量n增加时,样本均数的分布将趋于正态分布,此分布的均数为?,标准差为如图5-1P88标准误(standarderror,SE),样本统计量的标准差称为标准误,用来衡量抽样误差的大小。标准误与个体变异?成正比,与样本含量n的平方根成反比。实际工作中,?往往是未知的,一般可用样本标准差s代替?:因为标准差s随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。事实上,任何一个样本统计量均有其分布。统计量的抽样分布规律是进行统计推断的理论基础。标准差与标准误的联系和区别联系1、都是变异指标。S反映个体观察值的变异;反映统计量的变异。2、当n不变时,标准差↑,标准误↑二、样本频率的抽样分布与抽样误差以电脑实验为例P89,将其频数列表5-3。从表中可见,黑球的比例是围绕着20%(总体率)分布的,在此组段内的频数最多,但不等于总体率,样本频率间也有差异。表示频率的抽样误差的指标叫率的标准误。例5-1某研究组随机调查了某市50岁以上中老年妇女776人,其中患有骨质疏松症者322人,患病率为41.5%,试估计该样本频率的抽样误差。本例标准误较小,说明用样本患病率41.5%来估计总体患病率的可靠性较好。第二节t分布f(t)?=∞(标准正态曲线)?=5?=10.10.2-4-3-2-1012340.3图3.2自由度分别为1、5、∞时的t分布

t分布的特征

t分布为一簇单峰分布曲线t分布以0为中心,左右对称t分布与自由度?有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。第三节总体均数及总体率的估计一、参数估计的概念参数估计:用样本统计量推断总体参数的数值。有点估计(pointestimation)和区间估计(intervalestimation)。2.区间估计(intervalestimation):按预先给定的概率(1??)所确定的包含未知总体参数的一个范围。如给定?=0.05,该范围称为参数的95%可信区间或置信区间;如给定?=0.01,该范围称为参数的99%可信区间或置信区间抽样研究:从总体到样本实际工作:由样本推断总体统计推断(statisticalinference)就是根据样本所提供的信息,以一定的概率推断总体的性质。置信区间的确切涵义置信度为95%的置信区间的确切涵义是:每100个样本所算得的100个置信区间,平均有95个包含了总体参数,有5%没有包含了总体参数。置信区间的两个要素可靠性反映为置信度1-?的大小,1-?越大可靠性越高,如99%的置信度就比95%的置信度可靠。精确性用区间长度CU-CL衡量,区间越窄精确性越好,95%的置信区间就比99%置信的精确性好。在置信度1-?确定后,要想同时作到既可靠又精确只有增大样本含量。**