做法2:
反应的均数关于剂量作回归分析?!
为什麽不对?均数做因变量造成“好”的假象!*回归方程是否有统计学意义与反应的变异状况有关*以诸个体反应值的均数作回归计算,掩盖变异性回归方程:Y=61.786-6.886log(剂量)决定系数:R2=0.914。第23页,共50页,星期日,2025年,2月5日正确作法:用个体资料作回归分析回归方程:Y=61.782-6.884log(剂量)决定系数:R2=0.095回归方程无统计学意义,无剂量-反应关系!第24页,共50页,星期日,2025年,2月5日6.重复测量资料不能时点间两两比较例各取7只兔子,分别以正常食物和待研究食物喂养,在实验前、喂养5周、10周后,各取血测量其中胆固醇浓度,自然对数转换后,数据见表22.1,问血清胆固醇浓度随时间变化的趋势是否受该食物影响。第25页,共50页,星期日,2025年,2月5日例某药物有新、旧两种剂型。为比较两种剂型的代谢情况,对16例某病患者服药后0、4、8、12小时的血药浓度作了测量,问该药新旧两种剂型的血药浓度-时间曲线的差别是否具有统计学意义。
第26页,共50页,星期日,2025年,2月5日第27页,共50页,星期日,2025年,2月5日
常见的不妥
i)对每个时间点,分别计算均数、标准差;将各时间点测量值的均值用线连接,标出“误差”线ii)在各时间点做两组比较(t检验或非参数检验)第28页,共50页,星期日,2025年,2月5日为什麽不对?(1)连接各时间点测量值均数的方法将掩盖个体曲线位置和形状的特点:各均数所对应的点连起来形成的曲线形状可能与诸个体的曲线形状毫不相干;各时间点标上相应的标准差也会误导;(2)上述方法无法体现不同时间点的数据来自同一个体,而每一个体的多次重复测量值间具有相关性。(关键所在)第29页,共50页,星期日,2025年,2月5日应当如何?1)综合指标法(summarymeasuresapproach)或派生变量法(derivedvariableapproach)采用少数独立的综合指标来概括每个个体多个时间点的测量值;用单变量方法比较各组的差异第30页,共50页,星期日,2025年,2月5日综合指标第31页,共50页,星期日,2025年,2月5日2)重复测量资料的方差分析先做“球形检验:不同时间点上数据之间没有相关性?任何两个时间点之间的相关性都一样?得阴性结果才进一步作方差分析。例兔子喂养重复测量资料分析处理因素(group):F=31.69,P=0.0001—食物对家兔血清胆固醇有影响;2)测量时间(time):F=11.93,P=0.0003—家兔血清胆固醇浓度随时间变化;3)交互效应(time×group):F=10.57,P=0.0005—不同食物,血清胆固醇浓度变化趋势有所不同。第32页,共50页,星期日,2025年,2月5日7.多维列联表资料不可反复做检验例某地区呼吸系统疾病的患病率较高,有人怀疑与当地室内点香的习惯有关,经抽样调查,得数据如下第33页,共50页,星期日,2025年,2月5日合并后作检验?!第34页,共50页,星期日,2025年,2月5日为什麽不对?i)点香与不点香者患病率不可比!年龄组合并掩盖了:点香(B1)与不点香(B2)者年龄结构不同ii)不同年龄组患病率不可比!点香与不点香者合并掩盖了:不同年龄组中点香与不点香者比例的不同第35页,共50页,星期日,2025年,2月5日第1页,共50页,星期日,2025年,2月5日1.终点指标过多,大海捞针临床试验时,不知道哪个指标在组与组间有差异;“确定某个指标后,万一组间没有差异,岂不被动!”生理、生化、组织学、基因,都做;“内容丰富,显得水平高!”许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪个指标标”第2页,共50页,星期日,2025年,2月5日错在哪里?哪些指标可能有组间差异,必须心中有数。科研的结果应当预见——假说是科研的灵魂心中无数,不要“先上马再说”指标多,实验工作量大。大海捞针——碰运气,不是科研指标多,翻来覆去分析,制造假阳性Nature杂志统计学指南:常见错误之