笃学精业修德厚生第1页,共34页,星期日,2025年,2月5日第三章抽样误差与假设检验掌握内容:1.t分布的概念和特征2.总体均数的区间估计3.假设检验的基本步骤4.假设检验的基本原理5.常用的数值型变量假设检验的方法第2页,共34页,星期日,2025年,2月5日熟悉:1、抽样误差的概念2、引起抽样误差的原因3、均数的标准误的计算4、标准差和标准误的区别第三章抽样误差与假设检验第3页,共34页,星期日,2025年,2月5日第一节抽样分布与抽样误差一.抽样研究(一)抽样研究的意义样本总体第4页,共34页,星期日,2025年,2月5日(1)由于研究对象很多是无限总体,要直接研究总体的情况是不可能的。(2)即使对有限总体来说,若包含的观察单位数过多,需要耗费大量的人力、物力和时间,而且也不易组织,难以保证工作的质量。(3)有的时候,观察的实质就是一种破坏性实验,根本就不允许对总体中的每一个体逐一观察。为什么要做抽样研究?第5页,共34页,星期日,2025年,2月5日目前抽样研究的理论与技术已发展成熟,只要严格按照有关抽样研究的要求去做,这是完全可行的。目的:就是要用样本信息来推断总体特征,这就叫统计推断(statisticalinference)第6页,共34页,星期日,2025年,2月5日(二)抽样研究和抽样误差抽样研究是指从总体中按照随机化的原则,抽取一定数量的个体组成样本进行研究,从而推断总体的研究方法。在抽样研究中产生的样本统计量与相应的总体参数间的差异,称为抽样误差(samplingerror),第7页,共34页,星期日,2025年,2月5日(三)、抽样误差的分布理论上可以证明:若从正态总体中,反复多次随机抽取样本含量固定为n的样本,那么这些样本均数也服从正态分布,即的总体均数仍为,样本均数的标准差为。抽样分布抽样分布示意图第8页,共34页,星期日,2025年,2月5日(三)、抽样误差的分布中心极限定理当样本含量很大的情况下,无论原始测量变量服从什么分布,的抽样分布均近似正态。抽样分布图抽样分布示意图第9页,共34页,星期日,2025年,2月5日二.均数的抽样误差如上所述,数理统计研究表明,抽样误差具有一定的规律性,可以用特定的指标来描述。这个指标称为标准误(standarderrorSE)。标准误除了反映样本统计量之间的离散程度外,也反映样本统计量与相应总体参数之间的差异,即抽样误差大小。第10页,共34页,星期日,2025年,2月5日意义:反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。与样本量的关系:S一定,n↑,标准误↓标准误的计算公式:第11页,共34页,星期日,2025年,2月5日例4.1在某地随机抽查成年男子140人,计算得红细胞均数4.77×1012/L,标准差0.38×1012/L,试计算均数的标准误。第12页,共34页,星期日,2025年,2月5日均数标准误的用途1.衡量样本均数的可靠性由于均数标准误越小,均数的抽样误差越小,样本均数就越可靠,代表性越好。2.估计总体均数的可信区间。3.用于均数的假设检验。第13页,共34页,星期日,2025年,2月5日第二节t分布一.t分布(t-distribution)(一)Z分布正态分布(normaldistribution)常将一般的正态变量X通过变换[]转化成标准正态变量Z,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standardnormaldistribution),亦称Z分布。第14页,共34页,星期日,2025年,2月5日在正态分布总体中以固定n(如n=10)抽取若干个样本时,样本均数的分布仍服从正态分布,即。所以,对样本均数的分布进行Z变换[],也可变换为标准正态分布N(0,1)。第15页,共34页,星期日,2025年,2月5日由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与Z变换区别,称为t变换t=,统计量t值的分布称为t分布。(二)t分布第16页,共34页,星期日,2025年,2月5日t分布有如下特征1.以0为中心,左右对称的单峰分布;2.t分布是一簇曲线,其形态变化与n(确切地说与