方差分析的基本假定和数据转换;(1)效应的可加性
方差分析模型均为线性可加模型。这个模型明确提出了处理效应与误差效应是“可加的”,正是由于这一“可加性”,才有了样本平方和的“可加性”,亦即有了试验观测值总平方和的“可剖分”性。如果试验资料不具备这一性质,那么变量的总变异依据变异原因的剖分将失去根据,方差分析不能正确进行。;(2)分布的正态性
是指所有试验误差是相互独立的,且都服从正态分布N(0,σ2)。只有在这样的条件下才能进行F检验。
(3)方差的同质性
即各个处理观测值总体误差方差σ2应是相等的。只有这样,才有理由以各个处理均方的合并均方作为检验各处理差异显著性的共同的误差均方。;如果在方差分析前发现有某些异常的观测值、处理或单位组,只要不属于研究对象本身的原因,在不影响分析正确性的条件下应加以删除。
有些资料就其性质来说就不符合方差分析的基本假定。其中最常见的一种情况是处理平均数和均方有一定关系(如二项分布资料,平均数,均方;泊松分布资料的平均数与方差相等)。;对不能直接进行方差分析的资料应考虑采用非参数方法分析或进行适当数据转换后再作方差分析。
常用的数据转换方法:
①平方根转换(squareroottransformation)
此法适用于各组均方与其平均数之间有某种比例关系的资料,尤其适用于总体呈泊松分布的资料。转换的方法是求出原数据的平方根。若原观测值中有为0的数或多数观测值小于10,则把原数据变换成,对于稳定均方,使方差符合同质性的作用更加明显。变换也有利于满足效应可加性和正态性的要求。;②对数转换(logarithmictransformation)
如果各组数据的标准差、全距与其平均数大体成比例或变异系数CV接近常数时,或者效应为相乘性或非相加性,则将原数据变换为对数(lgx或lnx)后,可以使方差变成比较一致而且使效应由相乘性变成相加性。如果原数据包括有0,可以采用lg(x+1)变换的方法。一般而言,对数转换对于削弱大变数的作用要比平方根转换更强。例如变数1、10、100作平方根转换是1、3.16、10,作对数转换则是0、1、2。
对数变换能使服从对数正态分布的变量正态化。如环境中某些污染物的分布、人体中某些微量元素的分布,可用对数转换改善其正态性。;③反正弦转换(arcsinetransformation)
平方根反正弦转换适用于发病率、感染率、病死率、受胎率等服从二项分布的资料。转换的方法是求出每个原数据(用百分数或小数表示)的平方根反正弦。一般,若资料中的百分数介于30%—70%之间时,因资料的分布接近于正态分布,数据变换与否对分析的影响不大。部分统计学书后附有百分数反正弦转换表,可以直接查得x的平方根反正弦值。;;应当注意的是,在对转换后的数据进行方差分析时,若经检验差异显著,则进行平均数的多重比较应用转换后的数据进行计算。但在解释分析最终结果时,应还原为原来的数值。;④倒数转换(reciprocaltransformation)
当各处理标准差与其平均数的平方成比例时,可进行倒数转换。这种转换常用于以反应时间为指标的数据资料,也可用于数据两端波动较大的资料,可使极端值的影响减小。对于一些分布明显偏态的二项分布资料,有人通过以下转换,可使x呈良好的正态分布。;对于一般非连续性的数据,最好在方差分析前先检查各处理平均数与相应处理内均方是否存在相关性和各处理均方间的变异是否较大。如果存在相关性,或者变异较大,则应考虑对数据作出变换。有时要确定适当的转换方法并不容易,可事先在试验中选取几个其平均数为大、中、小的处理试验作转换。哪种方法能使处理平均数与其均方的相关性最小,哪种方法就是最合适的转换方法。;作业;处理;处理