基本信息
文件名称:抽样与抽样调查.ppt
文件大小:1.37 MB
总页数:82 页
更新时间:2025-05-17
总字数:约9.29千字
文档摘要

整群抽样

clustersampling概念:首先将总体划分为群R;然后按随机的原则不重复抽出群r,在每群中进行全面调查。该调查方法适用于单位较多的总体。与分层抽样相反,整群抽样在群内是全面调查,在群间是抽样调查。第30页,共82页,星期日,2025年,2月5日整群抽样适用于:不同子群相互之间差别不大,而每个子群内部的异质性程度比较大。--层内异质,层间同质(与分层抽样相反)当我们不可能或不方便编制一个完整的名单形成目标总体的时候,可以使用整群抽样。如对城市的人口进行抽样的时候,没有整个城市的人的名册,可以先选出几个街道样本,对街道中的所有户进行抽样。第31页,共82页,星期日,2025年,2月5日整群抽样优点:简便易行、节省费用缺点:样本分布面不广,样本对总体的代表性相对较差第32页,共82页,星期日,2025年,2月5日多段抽样

multistagesampling又称分段抽样。它是按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。适合于总体规模特别大,或总体分布范围特别广。方法:从总体中随机抽取若干大群,然后从大群中抽取若干小群,层层抽下去,直到抽到最基本的抽样元素为止。重复两个基本步骤:列表名册和抽样在上述每个阶段的抽样中,都要采用简单随机抽样或等距抽样或分层抽样的方法进行。第33页,共82页,星期日,2025年,2月5日多段抽样时,需要考虑类别和个体之间如何保持平衡?考虑两个因素REF书P137表6-3各个抽样阶段中的子总体同质性程度。同质性越高的子总体,所抽规模就小一点。反之亦然。考虑人力和经费--“大的类别抽取的多,每一子类抽取的相应较少”所花的人力经费就多,但又可适当减少抽样误差每级抽样都会产生误差,故多段抽样的误差较大。第34页,共82页,星期日,2025年,2月5日Q:如何控制多段整群抽样的抽样误差?从抽样误差的公式入手增加样本容量提高样本要素的同质性(然而,如果总样本数量一定的话,抽取的群数量增加每个群中被抽取的要素的数量势必减少。)整群抽样的原则就是尽可能多的选取群(群的同质性强),而减少每个群中要素的数量。但又可能违背整群抽样效率的功能第35页,共82页,星期日,2025年,2月5日户内抽样

within-householdsampling适用于以家庭作为分析单位,以入户访谈的方法收集资料入户前的抽样可以采用多段抽样的方式如市/县—区/乡—街/村—居委会/组—家庭户确定户后,如何对户内的成年人进行选择?--生日接近法--KISH选择表第36页,共82页,星期日,2025年,2月5日KISH选择法将调查表编号为A,B1,B2,C,,D,E1,E2,F八种,每种表的数目分别占调查表总数的1/6,1/12,1/12,1/6,1/6,1/12,1/12,1/6每个调查员配备一套KISH选择表(一套8种)对每户中成年人进行排序和编号:男在前,女在后;年纪大在前,小在后.按照调查表上的编号找出选择表,根据家庭人口数目从选择表中查出该选个体的序号.对这一序号的成员进行调查.第37页,共82页,星期日,2025年,2月5日第38页,共82页,星期日,2025年,2月5日概率比率抽样(PPS抽样)

probabilityproportionatetosize一种多段整群抽样(适用于大规模调查)其中的群被选取的概率并不相等,其被选中的概率和其规模大小成比例—根据群中其子样本的数量来衡量。特点是总体中含量大的部分被抽中的概率也大,可以提高样本的代表性。

第39页,共82页,星期日,2025年,2月5日对比:EPSEM/PPSEPSEM:equalprobabilityofselectionmethod等概率抽样选择城市中的住户(假设100000户分散在1000条街道,如何抽取1000户居民)1000条街道—挑选100个街道:10%的选中机会假设每条街道只有100户(即规模相同),则抽10户即可,100户抽10户:10%的选中机会则城市中每一户被选中的概率=0.1*0.1=1%这样,每户人家被选中的概率相同,挑选出来的样本对城市中的所有住户来说具有代表性思考:一个陷阱:如果每条街道户数不同,例如甲居委会有200户,乙居委会只有50户。思考:EPSEM抽样结果会怎样?甲居委会居民被抽中的概率:100/1000*10/200=0.005乙居委会居民被抽中的概率:100/1000*10/50=0.02乙居委会居民被抽中的概率是甲居委会居民被抽中的概率的4倍第40页,共82页,星期日,2025年,2月5日PPS抽样每一个元