第四章差异量数第1页,共30页,星期日,2025年,2月5日
描述数据离散程度的统计量称为差异量数。差异量越大,表明数据越分散、不集中;差异量越小,表明数据越集中,变动范围越小。一组数据的离散程度,常常通过数据的离中趋势特点进行分析。第2页,共30页,星期日,2025年,2月5日
一、全距、百分位距(差)
和四分位距(差)全距R(range)全距是一组数据中的最大值(maximum)与该组数据中最小值(minimum)之差,又称极差。R=Xmax-Xmin第3页,共30页,星期日,2025年,2月5日
百分位差(百分位距)百分位差是指两个百分位数(percentile)之差。百分位数是指量尺上的一个点,在此点以下,包括数据分布中全部数据个数的一定百分比。常用Pp或Pm表示。第P百分位数指在其值为P的数据以下,包括分布中全部数据的的百分之p或m。第4页,共30页,星期日,2025年,2月5日
因以全距表示数据离散程度时受极端数影响,取消分布两端10%的数据,即P90-P10指量尺上的一个点,在此点以下,包括数据分布中全部数据个数的一定百分比四分位差也视为百分位差的一种,指在一个次数分配中,中间50%的次数的距离的一半。百分位数百分位差四分位差第5页,共30页,星期日,2025年,2月5日
Pp为所求的第P个百分数Lb百分位数所在组的精确下限f为百分位数所在组的次数Fb为小于Lb的各组次数的和N为总次数i为组距PR为所求的第P个百分等级X为给定的原始分数Lb为该分数所在组的精确下限f为该分数所在组的次数Fb为小于Lb的各组次数的和N为总次数i为组距百分位数的计算公式百分等级的计算公式第6页,共30页,星期日,2025年,2月5日
常用的百分位距有两种:P90-P10和P93-P7。用几个百分位距能较好地反映一组数据的差异程度。第7页,共30页,星期日,2025年,2月5日
计算公式公式中:fbp为某一百分位数所在组下限以下的累积频数fp为某一百分位数所在组的频数Lbp为某一百分位数所在组的精确下限第8页,共30页,星期日,2025年,2月5日
四分位距四分位距是第一个四分位数与第三个四分位数之差的一半,计算公式为第9页,共30页,星期日,2025年,2月5日
其中:用中位数作集中量时,常用四分位距作差异量。第10页,共30页,星期日,2025年,2月5日
二、平均差平均差(averagedeviation或者meandeviation)是指一组数据中,每一个数据与该组数据的平均数离差的绝对值的算术平均数,通常用AD或MD表示。本书中均以AD表示。第11页,共30页,星期日,2025年,2月5日
原始数据计算公式次数分布表计算公式平均差意义明确,计算容易,反应灵敏。但计算时要用绝对值,不适合代数运算,因此在进一步统计分析中应用较少。第12页,共30页,星期日,2025年,2月5日
三、方差和标准差方差(又称为变异数、均方)。是表示一组数据离散程度的统计指标。一般样本的方差用表示,总体的方差用表示。标准差(standarddeviation)是方差的算术平方根。一般样本的标准差用S表示,总体的标准差用表示。标准差和方差是描述数据离散程度的最常用的差异量。第13页,共30页,星期日,2025年,2月5日
1.方差和标准差的定义第14页,共30页,星期日,2025年,2月5日
2.方差和标准差的计算公式未分组数据未分组数据:方差的计算公式标准差的计算公式第15页,共30页,星期日,2025年,2月5日
分组数据:分组数据:方差的计算公式标准差的计算公式第16页,共30页,星期日,2025年,2月5日
样本方差和标准差
未分组数据分组数据:未分组数据:分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除第17页,共30页,星期日,2025年,2月5日
表5-152名学生数学成绩方差和标准差计算表成绩组中值Xc频数fF*XcF*XC2计算95-97.5219519012.590-92.5218517112.585-87.53262.522968.7580-82.55412.534031.2575-77.586204805070-72.511797.557818.7565-67.59607.541006.2560-62.55312.519531.2555-57.542301322550-52.521055512.545-47.5147.52256.25合计523775280525第18页,共30页,星期日,2025年,2月5日
3.总标