基本信息
文件名称:回归复习专题56统计.docx
文件大小:301.76 KB
总页数:9 页
更新时间:2025-06-25
总字数:约6.34千字
文档摘要

专题56统计

知识必备

1随机抽样

(1)全面调查与抽样调查

全面调查:对每一个调查对象都进行调查的方法称为全面调查,又称普査.

总体:在一个调查中,我们把调查对象的全体积为总体.

个体:组成总体的每一个调查对象称为个体.

抽样调查:从总体中抽取一部分个体进行调查,并依据对总体的情况作出估计和推断的调查方法称为抽样调查.

样本:我们把从总体中抽取的那部分个体积为样本.

样本容量:样本中包含的个体数称为样本容量,简称样本量.

样本数据:调查样本获得的变量值称为样本观测数据,简称样本数据.

(2)简单随机抽样

定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n1≤nN

放回简单随机抽样和不放回简单随机抽样统称简单随机抽样,不特殊说明,简单随机抽样指的是不放回简单随机抽样通过简单随机抽样获得的样本,叫做简单随机样本.

简单随机抽样的特征

①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.

②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.

③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.

④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.

两种常用的简单随机抽样方法

①抽签法:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.

②随机数法:用随机数工具(如随机数表、随机数骰子或计算机等)产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,连续抽取n次,就得到一个容量为n的样本.

如果随机数有重复,可以提出重复的编号重新产生随机数.

(3)分层抽样

定义:一般地,按一个或多个变量把总体化粪池若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样(简称分层抽样),每个子总体积为层.

分层抽样中,每层样本量都与层的大小成比例,这种样本量的分配方式称为比例分配.

当总体由差异明显的几个部分组成时,往往选用分层抽样的方法.

常见问题类型

①求某层应抽个体数量:按该层所占总体的比例计算.

②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.

③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=样本容量

注:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取ni=n?NiNi=1,2,?,k个个体(其中i是层数,ni是第i

2用样本估计总体

(1)样本的数字特征

众数:一组数据中,某个数据出现的次数称为这个数据的频数,重复出现的次数最多的数据称为这组数据的众数众数反应一组数据的多数水平.

中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数中位数反应一组数据的中间水平.

注:如果一组数据个数是奇数,且按照从小到大排列后,则称最中间那个数据为这组数的中位数;如果一组数据个数是偶数,且按照从小到大排列后,则称最中间两个数据的平均数为这组数的中位数.

平均数:如果给定的一组数是x1,

这一公式在数学中常简记为:x=1

总体的平均数叫做总体平均数,又叫总体均值;样本的平均数叫做样本平均数,又叫样本均值.

注:常用公式变形:i=1n

极差:一组数的极差指的是这组数的最大值减最小值,不难看出,极差反映了一组数的变化范围,描述了这组数的离散程度.

描述一组数的离散程度的量还有方差和标准差.

方差:如果x1,x

s

注:如果a,b为常数,则:ax1b,ax2

分层抽样方差公式:s

标准差:方差的算术平方根称为标准差;

注:标准差、方差描述了一组数据围绕平均数波动程度的大小标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小反之亦可由离散程度的大小推算标准差、方差的大小如果一组数中,各数据值都相等,则标准差为0,表面数据没有波动,数据没有离散.

(2)频率分布直方图

频率、频数、样本容量的计算方法

①频率距×组距=频率;

②频数样本容量

③频率分布直方图中各个小方形的面积总和等于1.

(3)频率分布直方图中数字特征的计算

①最高的小长方形底边中点的横坐标即是众数.

②中位数左边和右边的小长方形的面积和是相等的设中位数为x,利用x左(右)侧矩形面积之和等于05,即可求出x.

③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有x=x1p1

(4)百分位数

定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值