基本信息
文件名称:统计学抽样误差与统计推断.ppt
文件大小:3.63 MB
总页数:30 页
更新时间:2025-03-19
总字数:约2.35千字
文档摘要

第1页,共30页,星期日,2025年,2月5日统计推断的过程样本总体样本统计量如:样本均值、比例、方差总体均值、比例、方差等第2页,共30页,星期日,2025年,2月5日教学要求掌握:总体均数的估计;假设检验基本思想、步骤和注意事项,各种t、u检验的方法与应用。熟悉:抽样误差及规律,t分布的特征和规律。了解:方差齐性检验第3页,共30页,星期日,2025年,2月5日抽样误差(samplingerror)19岁男大学生身高总体第4页,共30页,星期日,2025年,2月5日抽样分布抽样分布示意图第5页,共30页,星期日,2025年,2月5日中心极限定理当样本含量很大的情况下,无论原始测量变量服从什么分布,的抽样分布均近似正态。抽样分布抽样分布示意图第6页,共30页,星期日,2025年,2月5日抽样分布与总体分布的关系总体正态分布非正态分布大样本小样本正态分布正态分布非正态分布第7页,共30页,星期日,2025年,2月5日第8页,共30页,星期日,2025年,2月5日第9页,共30页,星期日,2025年,2月5日标准误(standarderror)衡量样本均数的可靠性估计总体均数的可信区间用于均数的假设检验第10页,共30页,星期日,2025年,2月5日例4.1在某地随机抽查成年男子140人,计算得红细胞均数4.77×1012/L,标准差0.38×1012/L,试计算均数的标准误。第11页,共30页,星期日,2025年,2月5日分布(t–distribution)1908年,英国统计学家W.S.Gosset以笔名“Student”首次提出t分布概念。第12页,共30页,星期日,2025年,2月5日t分布的概念第13页,共30页,星期日,2025年,2月5日t分布的概率密度函数(扩展)式中为伽玛函数第14页,共30页,星期日,2025年,2月5日t分布的特征1、t分布同标准正态分布一样,是以0为中心的对称分布。2、同标准正态分布曲线不同,t分布曲线不是一条而是一簇曲线。3、t分布曲线的形态,随自由度ν的不同而不同。第15页,共30页,星期日,2025年,2月5日-tt0第16页,共30页,星期日,2025年,2月5日参数估计—总体均数的估计EstimationofParameter第17页,共30页,星期日,2025年,2月5日参数估计的意义参数估计的形式有两种:1、点(值)估计(pointestimation)2、区间估计(intervalestimation)第18页,共30页,星期日,2025年,2月5日参数估计点估计:不考虑抽样误差,如区间估计:考虑抽样误差第19页,共30页,星期日,2025年,2月5日区间估计(intervalestimation)(1-α)95%区间估计是按概率(1??),确定一个包含总体参数的范围。称为参数的可信区间(confidenceinterval,CI)第20页,共30页,星期日,2025年,2月5日区间估计的方法:总体标准差σ已知总体标准差σ未知总体标准差σ未知,但n足够大第21页,共30页,星期日,2025年,2月5日例4.2某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32g/L,标准差为0.57g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。下限:上限:第22页,共30页,星期日,2025年,2月5日例4.3试计算例4.1中该地成年男子红细胞总体均数的95%可信区间。下限:上限:第23页,共30页,星期日,2025年,2月5日总体方差的区间估计(扩展)总体方差可信区间为:?2?21-????2???自由度为n-1的?2第24页,共30页,星期日,2025年,2月5日来自N(0,1)的100个样本所计算的95%可信区间示意第25页,共30页,星期日,2025年,2月5日可信区间估计的优劣95%第一个要素是准确性,又称可靠性,为可信度1-α的大小,显然1-α然愈接近1愈好。在实际工作中要根据研究目的和需要来定,常用的可信度为90%、95%和99%,但不