第1页,共40页,星期日,2025年,2月5日一、前言在疗效评价,发病因素研究中,应变量为分类指标有效治愈发生阳性Y无效死亡未发生阴性线性回归分析:正态随机变量第2页,共40页,星期日,2025年,2月5日多重线性回归难以解决的问题医学数据的复杂、多样性连续型和离散型数据医学研究中疾病的复杂性一种疾病可能有多种致病因素或与多种危险因素有关疾病转归的影响因素也可能多种多样临床治疗结局的综合性第3页,共40页,星期日,2025年,2月5日解决方法简单的:固定其他因素,研究有影响的一两个因素;按1~2个因素组成的层进行分层分析(层内和综合分析)。多因素:寻找合适的统计模型第4页,共40页,星期日,2025年,2月5日二、Logistic回归模型Logistic回归二分类多分类条件Logistic回归非条件Logistic回归第5页,共40页,星期日,2025年,2月5日概述1967年TrueltJ,ConnifieldJ和KannelW在《JournalofChronicDisease》上发表了冠心病危险因素的研究,较早地将Logistic回归用于医学研究。第6页,共40页,星期日,2025年,2月5日Logistic回归分析解决的问题医学研究中,有关生存与死亡,发病与未发病,阴性与阳性等结果的产生可能与病人的年龄、性别、生活习惯、体质、遗传等许多因素中哪些有关?如何找出其中哪些因素对结果有影响?第7页,共40页,星期日,2025年,2月5日设:暴露组发生率p1/未发生率(1-p1)对照组发生率p0/未发生率(1-p0)p表示暴露因素X时个体发病的概率,则发病的概率与未发病的概率1-p之比称为优势(odds).暴露组oddsp1/(1-p1)对照组oddsp0/(1-p0)Logistic回归分析第8页,共40页,星期日,2025年,2月5日Logit变换也称对数单位转换logitP=病例组与对照组的优势比(oddsretio,OR)第9页,共40页,星期日,2025年,2月5日Logistic回归分析模型进行logit变换第10页,共40页,星期日,2025年,2月5日Logistic回归模型是一种概率模型,它是以疾病,死亡等结果发生的概率为因变量,影响疾病发生的因素为自变量建立回归模型。它特别适用于因变量为二项,多项分类的资料。在临床医学中多用于鉴别诊断,评价治疗措施的好坏及分析与疾病预后有关的因素等。第11页,共40页,星期日,2025年,2月5日Logistic回归分析模型称为非条件logistic回归模型,常应用于成组数据的分析经数学变换可得:Exp/e表示指数函数。第12页,共40页,星期日,2025年,2月5日三、参数估计最大似然估计法(Maximumlikehoodestimate)似然函数:L=∏Pi对数似然函数:lnL=∑(lnP)=lnP1+lnP2+…+lnPn非线性迭代方法-Newton-Raphson法第13页,共40页,星期日,2025年,2月5日logistic回归系数的意义β表示自变量每增加一个单位,其优势比对数值的改变量,OR=eβlnOR=β亦即自变量每增加一个单位,其相对危险度为eβ。第14页,共40页,星期日,2025年,2月5日
回归系数的意义设只有一个自变量的Logistic方程=0表示非暴露,=1表示暴露。第15页,共40页,星期日,2025年,2月5日
ln(OR)=logit[P(1)]-logit[P(0)]=(β0+β1×1)-(β0+β1×0)=β1第16页,共40页,星期日,2025年,2月5日
例如,吸烟与肺癌的关系的研究令1吸烟1肺癌X=y=