商务统计学基础知识点
一、数据类型
商务统计中数据类型主要分为两类:定性数据和定量数据。定性数据是用来描述事物的特征或属性,例如性别(男、女)、职业(教师、医生等),它又可分为定类数据和定序数据。定类数据是类别之间没有顺序关系的数据,如不同的品牌。定序数据则是类别之间存在顺序关系,像满意度调查中的非常满意、满意、不满意等。
定量数据是用数值来表示的数据,可以进行数学运算。它包括离散型数据和连续型数据。离散型数据只能取特定的值,如企业的员工数量,只能是整数。连续型数据可以取任意值,例如商品的价格,可以是小数。
二、数据收集方法
1.普查
-这是一种对总体中的每个个体都进行调查的方法。例如,政府进行的全国人口普查。在商务领域,企业可能对所有的客户进行一次全面调查以了解客户需求。但普查耗费大量的人力、物力和时间。
2.抽样调查
-从总体中抽取一部分样本进行调查,通过样本的特征来推断总体的特征。抽样方法包括简单随机抽样(每个个体被抽到的概率相等)、分层抽样(将总体按照某些特征分成不同的层,然后从各层中独立抽样)、系统抽样(按照一定的规则抽取样本,如每隔一定数量抽取一个)等。
三、数据的描述性统计量
1.集中趋势的度量
-平均数:包括算术平均数、加权平均数等。算术平均数是所有数据之和除以数据的个数。加权平均数则考虑了不同数据的权重,在商务中,如计算不同销售额占比下的平均利润率。
-中位数:将数据按大小顺序排列后,位于中间位置的数值。如果数据个数为奇数,中位数就是中间的那个数;如果是偶数,则是中间两个数的平均值。中位数不受极端值的影响,在数据存在偏态时能更好地反映数据的中心位置。
-众数:数据中出现次数最多的数值。对于一些离散型的商务数据,如最畅销的产品型号,众数有很好的代表性。
2.离散程度的度量
-极差:最大值与最小值之差,它简单地反映了数据的分散程度,但受极端值影响大。
-方差和标准差:方差是每个数据与平均数之差的平方和除以数据个数。标准差是方差的平方根。它们是衡量数据离散程度的重要指标,标准差越大,数据越分散。
-变异系数:标准差与平均数的比值,用于比较不同数据集的离散程度,尤其是当两组数据的平均数相差较大时。
四、概率基础
1.概率的定义
-概率是对某一事件发生可能性大小的度量,取值范围在0到1之间。0表示事件不可能发生,1表示事件必然发生。例如,在商务中,某种新产品成功推向市场的概率可能需要通过市场调研、分析竞争对手等因素来估计。
2.概率的基本运算法则
-加法法则:对于互斥事件(两个事件不能同时发生),它们的和事件的概率等于各事件概率之和。例如,企业推出两种互斥的营销方案A和B,方案A成功的概率为0.3,方案B成功的概率为0.2,那么A或者B成功的概率就是0.3+0.2=0.5。
-乘法法则:对于独立事件(一个事件的发生不影响另一个事件的发生),它们的积事件的概率等于各事件概率之积。例如,产品通过两道独立的质检工序,第一道工序合格的概率为0.9,第二道工序合格的概率为0.8,那么产品最终合格的概率为0.9×0.8=0.72。
五、概率分布
1.离散型概率分布
-二项分布:适用于具有两种可能结果(如成功或失败)的独立重复试验。例如,在销售电话营销中,每次电话销售成功的概率为p,拨打n次电话,成功k次的概率就可以用二项分布来计算。
-泊松分布:用于描述在一定时间或空间内随机事件发生的次数。例如,在一定时间段内顾客到达商店的人数,当满足一定条件(如事件的发生是随机的、独立的等)时,可使用泊松分布来分析。
2.连续型概率分布
-正态分布:是一种非常重要的连续型概率分布,其图形呈钟形。许多商务中的变量,如产品的重量、员工的绩效评分等在大量数据情况下近似服从正态分布。正态分布具有对称性,其均值、中位数和众数相等。掌握正态分布的性质有助于进行质量控制、风险评估等商务活动。
六、抽样分布
1.样本均值的抽样分布
-当从总体中抽取样本容量为n的样本时,样本均值会形成一个分布。根据中心极限定理,在样本容量足够大(n≥30)时,无论总体服从什么分布,样本均值的抽样分布近似服从正态分布,其均值等于总体均值,标准差等于总体标准差除以根号n。这一定理在进行参数估计和假设检验等方面有重要应用。
2.样本比例的抽样分布
-对于具有某种特征的个体在总体中所占比例的抽样分布,在一定条件下也近似服从正态分布。这有助于对市场份额等比例问题进行统计推断。
七、参数估计
1.点估计
-用样本统计量的值直接作为总体参数的估计值。例如,用样本均值作为总体均值的点估计,用样本比例作为总体比例的点估计。但