3.2 生存资料统计描述
3.2.1 问题与数据
【例3-1】某医师收集11例脑瘤患者甲疗法治疗的生存时间(周),试估计治疗后不同时间的生存率、生存曲线及中位生存期。
甲疗法组:5 7+13 13 23 30 30+38 42 42 45+
【例3-2】收集374名某恶性肿瘤病人随访资料,取时间区间均为1年,整理结果如表3-1所示,试估计确诊后不同年数的生存率、生存曲线、中位生存期等。
表3-1 某恶性肿瘤病人随访资料与生存率计算过程
注:生存时间长于10年者有47例。
3.2.2 对数据结构的分析
对于例3-1资料,研究者选取11名同质的脑瘤患者,观察他们采用甲疗法治疗后的生存时间。从设计类型来说,本例应为单组设计。因生存时间是定量的观测指标,故资料类型为单组设计一元定量资料。当然,由于部分受试对象的观测数据是不准确的,常称为截尾数据或删失数据,此资料是单组设计一元生存资料。
例3-2资料与例3-1相似,设计类型为单组设计,资料本质为单组设计一元生存资料。
3.2.3 分析目的与统计分析方法的选择
非参数法估计生存率有乘积极限法(Product-Limit Method,PL)和寿命表法(Life Table Method),其中乘积极限法又称为Kaplan-Meier法(简称KM法)。前者适用于小样本或大样本未分组资料,后者适用于观察例数较多的分组资料。
对例3-1资料,甲疗法组的生存数据为含有截尾数据的小样本未分组资料,宜采用Kaplan-Meier法估计生存率和生存曲线。
对例3-2资料,该恶性肿瘤随访资料观察例数较多,并且根据随访时间和随访结果编制成频数分布表的形式,处理此类资料宜采用寿命表法估计生存率。
3.2.4 SAS程序
分析例3-1资料,采用Kaplan-Meier法,程序名为SASTJFX3_1.SAS。
数据步中,变量t、status分别表示生存时间和生存结局,其中status=1表示某终点事件发生,如死亡;status=0表示截尾。
LIFETEST过程可对生存资料进行KM法或寿命表法估计,并对两组或多组生存率做组间比较,包括Log-Rank检验、Wilcoxon检验和似然比检验,其中似然比检验基于指数分布。
PROC LIFETEST语句中的选项如下。
(1)METHOD=PL|KM|LT|LIFE|ACT,指定生存率估计方法。PL和KM表示乘积极限法或KM法(默认值);LT、LIFE和ACT表示寿命表法。当使用寿命表法时,SAS可自动生成生存时间的分组区间,也可用“WIDTH=”人为指定区间宽度,或用“INTERVALS=(a to b by c)”,a、b、c分别表示区间的初值、终值和组区间的宽度。(2)PLOTS=( ),要求绘图。括号内可填写的内容有S、LS、LLS、H。若同时填多项,各项之间用逗号隔开,H选项仅在使用寿命表法时有效。各选项的具体含义如下:SURVIVAL(或S)表示生存率S )ˆ(t对生存时间t的图形,即生存曲线;LOGSURV(或LS)表示−logS(t)ˆ 对t的图形,用于判断生存时间是否服从指数分布。若呈指数分布,则图形应呈过原点的直线;LOGLOGS(或LLS)表示log[−logS(t)]ˆ 对logt的图形,用于判断生存时间是否服从Weibull分布。若呈Weibull分布,则图形应呈直线;HAZARD(或H)表示累积风险Ht)ˆ(对t的图形。只有当使用寿命表法时,才出现HAZARD图形。
TIME语句为LIFETEST过程的必须语句,设置生存时间变量和生存结局变量,括号内为截尾变量的标示值。
分析例3-2资料,采用寿命表法,程序名为SASTJFX3_2.SAS。
数据步中变量t、status和number分别表示每个时间区间的中点、生存结局(死亡=1,截尾=0)及其频数。过程步中指定生存率的估计方法为寿命表法,时间区间宽度为1。同时,用FREQ语句指定频数变量。
3.2.5 主要分析结果及解释
以下是SAS软件输出的关于例3-1的分析结果。
Summary Statistics for Time Variable t
输出的第一部分是甲疗法组生存率的KM法估计结果。统计量包括各生存时间点对应的生存率(Survival)、死亡率(Failure)、生存率标准误差(Survival Standard Error)、累积死亡数(Number Failed)和期末例数(Number Left)。
结果表明,采用甲疗法治疗,5周生存率为90.91%,13周生存率为70.71%,其他依次类推。注意:
(1)生存时间一栏标有“*”者为截尾生存时间,其生存率和生存率标准误差用“.”表示,实际上该截尾生存时间的生存率和生存率标准误差与前一个完全生存时间对应数值相同。如7周生存率为90.91%。
(2)两个完全生存时间之间任意时间的生存率均等于前一个完全生存时间的生存率,如6个月(即24周)生存率为60.61%。
第二部分输出生存时间的分位数,包括75%、50%和25%分位数的点估计及95%置信区间。50%分位数即中位生存期,为38周,95%置信区间为13~42(周)。
最后一部分概括截尾和非截尾例数。本资料总例数为11,其中死亡为8例,截尾为3例,截尾百分比为27%。
Kaplan-Meier生存曲线为阶梯形曲线,如图3-1所示。
图3-1 甲疗法治疗脑瘤患者Kaplan-Meier生存曲线
以下是SAS软件输出的关于例3-2的分析结果。
SAS输出统计量包括各生存时间区间内(Interval)的死亡数(Number Failed)、截尾数(Number Censored)、期初有效例数(Effective Sample Size)、条件死亡概率(Conditional Probability of Failure)、条件死亡概率标准误差(Conditional Probability Standard Error)、区间左端点处生存率(Survival)、死亡率(Failure)、生存率标准误差(Survival Standard Error)、中位剩余寿命(Median Residual Lifetime)、中位剩余寿命标准误差(Median Standard Error)及各时间区间中点处的概率密度函数(PDF)、概率密度函数标准误差(PDF Standard Error)、风险函数(Hazard)和风险函数标准误差(Hazard Standard Error)。
结果表明,该类恶性肿瘤患者1年生存率为75.94%,2年生存率为55.61%,其他依次类推。