表5-5两正态总体的均值差与方差比的检验名称条件类别H0H1检验统计量分布拒绝域Z检验两样本独立,?12=?22=?2未知双边检验μ1-μ2=0μ1-μ2≠0t(n1+n2–2)左边检验μ1-μ2?0μ1-μ20右边检验μ1-μ2?0μ1-μ20t检验成对匹配样本,?12,?22未知双边检验μd=0μd≠0左边检验μd?0μd0右边检验μd?0μd0F检验两样本独立,μ1,μ2未知双边检验F(n1–1,n2–1)左边检验右边检验第29页,共43页,星期日,2025年,2月5日4.总体比例与比例差的检验当样本容量n很大时,可根据表5-6对总体比例与比例差进行假设检验。表5-6总体比例与比例差的检验检验名称检验类别H0H1检验统计量分布拒绝域比例检验双边检验?=?0???0N(0,1)|z|?zα/2左边检验???0??0|z|≤–zα右边检验???0??0|z|?zα两总体比例差检验双边检验?1=?2?1??2N(0,1)|z|?zα/2左边检验?1??2?1?2|z|≤–zα右边检验?1??2?1?2|z|?zα第30页,共43页,星期日,2025年,2月5日统计工具箱中的基本统计命令1.数据的录入、保存和调用2.基本统计量3.常见概率分布的函数4.频数直方图的描绘5.参数估计6.假设检验7.综合实例返回**第31页,共43页,星期日,2025年,2月5日STATSTAT数据的统计分析与描述**第1页,共43页,星期日,2025年,2月5日目的2、掌握用数学软件包求解统计问题。1、直观了解统计基本内容。第2页,共43页,星期日,2025年,2月5日统计的基本概念参数估计假设检验数据的统计描述和分析**第3页,共43页,星期日,2025年,2月5日1.总体与样本总体(population):总体是指所研究对象的全体组成的集合。样本(sample):样本是指从总体中抽取的部分对象(个体)组成的集合。样本中包含个体的个数称为样本容量。容量为n的样本常用n个随机变量X1,X2,…,Xn表示,其观测值(样本数据)则表示为x1,...,xn,为简单起见,有时不加区别。第4页,共43页,星期日,2025年,2月5日2.参数与统计量参数(parameter):参数是用来描述总体特征的概括性值。如总体平均值(μ)、总体方差(?2)、总体比例(π)等。统计量(statistics):统计量是用来描述样本特征的概括性值。如样本均值()、样本方差(s2)、样本比例(P)等。第5页,共43页,星期日,2025年,2月5日表示数据集中趋势的统计量如果要用简单的数字来概括一组观测数据x1,...,xn,可以使用“位置统计量”来作为数据的总体代表,常见的位置统计量有:均值、中位数、分位数、众数等。1.均值(Mean)均值是所有观测值的平均值,是描述数据取值中心位置的一个度量:第6页,共43页,星期日,2025年,2月5日2.中位数(Median或Med)中位数是描述观测值数据中心位置的统计量,大体上比中位数大(小)的数据为观测值的一半。中位数的一个优点是它不受个别极端数据的影响,具有稳健性。中位数的计算方法是:首先将数据从小到大排序为:x(1),...,x(n),然后计算第7页,共43页,星期日,2025年,2月5日3.众数(Mode)观测值中出现最多的数称为众数。众数用得不如均值和中位数普遍。在属性变量分析中,常需考虑频数,因此众数用得多些。4.百分位数(Percentile)分位数也是描述数据分布和位置的统计量。0.5分位数就是中位数,0.75分位数和0.25分位数又分别称为上、下四分位数,并分别记为Q3和Q1。第8页,共43页,星期日,2025年,2月5日表示数据离散程度的统计量1.极差(Range)与半极差(Interquartilerange)极差就是数据中的最大值和最小值之间的差:极差=max{xi}–min{xi}上、下四分位数之差Q3–Q1称为四分位极差或半极差,它描述了中间半数观测值的散布情况。2.方差(Variance或Var)方差是由各观测值到均值距离的平方和除以观测量减1:第9页,共43页,星期日