医学统计学;ChineseTeachingPlan
forMedicalStudents;孙振球主编
人民卫生出版社
2005年8月第2版;第十七章生存分析;1。生存分析(survivalanalysis):将事件发生的结果和随访时间结合起来的一种统计分析方法。
2。完全数据:确切知道观察对象的准确生存时间。
3。不完全数据:无法知道观察对象的准确生存时间。
常见的原因有:①中途失访②死于其它原因③观察期终止时仍存活。;一、基本概念
1。生存时间(survivaltime):
①狭义:病人发病到死亡经历的时间;
②广义:某事件起始到终点经历的时间。如发病、死亡、治疗失效、失败、疾病复发、缓解等。
计算生存时间:可用小时、天、周、月、年等表示。;2。失效事件与起始事件
1)失效事件(failureevent):指明死亡、疾病复发等;
2)起始事件(initialevent):开始计算生存时间的事件,如确认时期、手术时期等。
3。截尾值(censoredvalue):也称终检值,删失数据,不完全数据。因各自原因未观察到病人确切生存时间。原因见前述的三条。;4。生存率与风险函数:
1)生存函数(survivalfunction):也称累积生存率或生存率。表示具有协变量X的观察对象其生存时间T大于t时刻的概率。用S(t,X)=P(Tt,X)表示。
实际应用中:是用生存时间大于t的病人数比总病人数来估计生存率。
特点:①t=0,生存率为1;②t=∞,生存率为0。
2)风险函数(hazardfunction):生存时间已达到t的一群观察对象在t时刻的瞬时死亡率。;5。死亡概率(mortalityprobability):表示一个观察对象从开始观察到时间t为止的死亡概率。为一个分布函数:h(t,X)=P(T≤t,X)。
当t→∞,F(t,X)=1。即对象一定死亡。
与生存函数的关系:S(t,X)=1-F(t,X)
6。死亡密度函数:表示具有协变量X的所有观察对象在t时刻的瞬时死亡率。
各个函数的公式及其相互关系见下页。;几个函数的公式及其相互关系:;二、收集资料
(一)随访内容
1。明确开始时间:即指起始时间。如入院时间,确诊时间,手术时间等。
2。随访结局和终止时间:
结局有三个:①“死亡”:即指示处理失效、失败、复发等②失访;③死于其它原因;④随访截止:??察对象仍存活。
3。记录影响生存时间的相关因素。如病人年龄、病程、病情、经济、文化、职业、性别等。
;(二)随访方式
1。全体对象同时进入观察:如动物试验。
2。全体对象不同时进入观察:临床病人多为此类。;(三)生存分析研究的主要内容
1.描述生存过程:估计生存率,平均生存时间,绘制生存曲线等
2.比较生存过程:比较2个或多个生存率等。
3.影响生存分析的因素分析:病人年龄,性别,病理,治疗方法等。;三、生存分析的基本方法
1.非参数法:不考虑数据的分布类型;有Kaplan-Meier法和寿命表法。
2.参数法:要知道数据的分布类型。有指数分布法,Weibull分布法,对数正态回归分布法等。
3.半参数法:具有参数和非参数的特点。如Cox模型法。
;一、小样本资料生存率及其标准误的计算
特点:数据不分组,用Kaplan-Meier法计算(1958年)。
1.生存率的计算
【例17-1】用甲种手术方法治疗肾上腺肿瘤病人23人。数据见表17-1。有+号者为截尾值,表示病人可能仍然存活或失访。括号中为重复病人。
;计算公式:
注意:截尾值的条件死亡率为0,条件生存率为1。;2.生存率标准误计算
;计算总体率可信区间:公式及例题;;计算生存率可信区间例题及结果:;3.生存曲线:生存时间为横轴,生存率为纵轴,绘制一条曲线为阶梯开,可以为一条或多条。
【例17-2】用乙种手术治疗肾上腺肿瘤20例。计算出生存率及其标准误。数据见表17-2。;生存曲线:
以生存时间为横轴,生存率为纵轴绘制一条生存曲线,用以描述其生存过程。并根据两条生存曲线的高低,直观的比较不同治疗方式之间的生存过程。
4。中位生存时间(mediansurvivaltime):又称为生存时间的中位数。表示则好有50%的个体其存活期大于该时间。它是生存分析中最常用的概括性统计量。
方法有两种:1)图解法:将生存率为0.5的点做横坐标,水平画线相交于生存率曲线,再画垂线相交于横轴的点,即为中位生存时间。2)内插法:用公式计算。;二、大样本资料的生存分析
1。概念:由于人数较多,可用寿命表法计算生存率。
2。基本原理:首先求出生存概率,再根据概率乘法原理,将各期生存率相乘,即