基本信息
文件名称:统计学重点归纳.docx
文件大小:86.87 KB
总页数:17 页
更新时间:2025-05-22
总字数:约5.67千字
文档摘要

《统计学》期末重点

统计学类型和不一样类型特点?

统计数据;按所采取计量尺度不一样分;?

(1)(定性数据)分类数据:只能归于某一类别非数字型数据,它是对事物进行分类结果,数据表现为类别,用文字来表述;?

(2)(定性数据)次序数据:只能归于某一有序类别非数字型数据。它也是有类别,但这些类别是有序。?

(3)(定量数据)数值型数据:按数字尺度测量观察值,其结果表现为详细数值。??统计数据;按统计数据都搜集方法分;?

(4)观察数据:是经过调查或观察而搜集到数据,这类数据是在没有对事物人为控制条件下得到。?

(5)试验数据:在试验中控制试验对象而搜集到数据。?统计数据;按被描述现象与实践关系分;?

(6)截面数据:在相同或相同时间点搜集到数据,也叫静态数据。?

(7)时间序列数据:按时间次序搜集到,用于描述现象随时间改变情况,也叫动态数据。?

变量题型

第10页,习题1.1

年纪:数值型变量

性别:分类变量

汽车产量:离散型变量

员工对企业某项改革方法态度(赞成、中立、反对):次序变量

购置商品时支付方式(现金、信用卡、支票):分类变量

随机抽样(概率抽样)抽样方式。

简单随机抽样

分层抽样:就是抽样单位按某种特征或者某种规则划分为不一样层,然后从不一样层中独立、随机地抽取样本。将各层样本结合起来,对总体目标量进行估量。

整群抽样:

系统抽样

多阶段抽样

分层抽样与整群抽样区分:

分层抽样层数就是样本容量;整群抽样群中单位个数就是样本容量

非概率抽样几个类型

方便抽样

判断抽样

自愿样本

滚雪球抽样

滚雪球抽样往往用于对稀少群体调查。在滚雪球抽样中,首先选择一组调查单位,对其实施调查后,再请他们提供另外一些属于研究总特调查对象,调查人员依照调查线索,进行今后调查。这个过程连续下去,就会形成滚雪球效应。

优点:轻易找到那些属于特定群体被调查者,调查成本也比较低。

配额抽样

比较概率抽样和非概率抽样特点,指出各自适用情况?

概率抽样:抽样时按一定概率以随机标准抽取样本。每个单位别抽中概率已知或能够计算,当用样本对总体目标量进行估量时,要考虑到每个单位样本被抽到概率。技术含量和成本都比较高。假如调查目标在于掌握和研究对象总体数量特征,得到总体参数置信区间,就使用概率抽样。?

非概率抽样:操作简单,时效快,成本低,而且对于抽样中统计学专业技术要求不是很高。它适合探索性研究,调查结果用于发觉问题,为更深入数量分析提供准备。它一样使用市场调查中概念测试(不需要调查结果投影到总体情况)。?

5.数据预处理内容?

数据审核(完整性和准确性;适用性和实效性),数据筛选和数据排序。

6.?数据型数据分组方法和步骤?

分组方法:单变量值分组和组距分组,组距分组又分为等距分组和异距分组。

?分组步骤:(1)确定组数

确定各组组距

依照分组整理成频数分布表

7.散点图与饼图主要用途

饼图是用圆形及圆内扇形角度来表示数值大小图形,它主要用于表示一个样本(或总体)中各组成部分数据占全部数据百分比,对于研究结构性问题十分有用。

散点图是描述变量之间关系一个直观方法,从中能够大致上看出变量之间关系形态及关系强度。

8.举例说明开口组组中值计算方法

缺下限开口组组中值=上限-1/2邻组组距????

缺上限开口组组中值=下限+1/2邻组组距?

9.怎样了解平均数在统计学中地位??

平均数在统计学中具备主要地位,是集中趋势最主要测度,主要适适用于数值型数据,而不适适用于分类数据和次序数据。

10.中位数与众数区分

众数:是一组数据中出现次数最多变量值,用表示。众数主要用于测度分类数据集中趋势,当然也适适用于作为次序数据以及数值型数据集中趋势测度值。

中位数:是一组数列排序后处于中间位置上变量值,用。中位数主要用于测度次序数据集中趋势,当然也适用测度数值型数据集中趋势,但不适适用于分类数据。

简述众数、中位数和平均数特点和应用场所。?

?众数是一组数据分布峰值,不受极端值影响,缺点是具备不唯一性。众数只有在数据量较多时才有意义,数据量较少时不宜使用。主要适合作为分类数据集中趋势测度值。?

中位数是一组数据中间位置上代表值,不受极端值影响。当数据分布偏斜较大时,使用中位数可能不错。主要适合作为次序数据集中趋势测度值。?

平均数对数值型数据计算,而且利用了全部数据信息,在实际应用中最广泛。当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但平均数易受极端值影响,对于偏态分布数据,平均数代表性较差,此时应考虑中位数或众数。

11.标准差系数(离散系数或变异系数)计算及其应用(第89页,第96页习题4.8(1))

为何要计算离散系数??

????方差和标准差是反应数据分散程度绝对