单向有序的列联表分析的SPSS操作教程及结果解读---孙医生工作室带你学统计学(挑战SCI)第24天

在上一期,我们已经讲完了双向无序的列联表分析,这期开始讲单向有序的列联表分析,我们主要从单向有序的列联表分析介绍及案例的SPSS操作演示这几方面进行讲解。



单向有序的列联表分析介绍


在RC列联表中,若行或列变量具有有序性质,则称之为单向有序列联表,特别是列变量有序的RxC表,这在临床治疗的疗效分析中很常见。此类资料常错误地应用普通卡方检验,但实际上应使用多组独立样本的秩和检验,这是非参数检验中的一种恰当方法。

当研究目的是比较分组变量(行变量)不同水平下结果变量(列变量)的平均水平是否有差异,列变量为有序分类变量(ordinal categorical variable),也叫等级变量。如果用Pearson  检验,只能推断构成比之间的差别,将损失关于等级的信息。可采用秩和检验或CMH  检验(行均分,Row Mean Scores)推断等级强度的差别。



案例的SPSS操作演示


分析示例

某医院用3种方法治疗慢性喉炎,结果见下表,问这3种方法的疗效是否有差别?

图片 

研究假设

H0种方法疗效的总体分布位置相同。

H1种方法疗效的总体分布位置不全相同。 

α=0.05

数据录入

1. 变量视图

名称 result  标签 疗效 等级 1=无效2=好转3=显效4=治愈

名称 treat   标签 治疗方法 1=甲法2=乙法3=丙法

名称 weight 标签 权重

图片 

2.数据视图

 

操作流程

图片 

1.下图为对数据的预定义,在数据(D) 下拉菜单框中完成,即设置权重变量,该操作是对 R×C  表运算的基本操作。

图片 

2.下图指出了非参数检验对于数据的要求:非参数检验不假定您的数据呈正态分布。至于目的,默认为自动比较不同组间的分布,我们先不用管它,因为还需要在其他地方进行设置。

图片 

3. 下图为字段选项卡,检验字段(测量指标)框选入疗效等级 result, 而组(分组变量)框则 选入治疗方法treat 。值得注意的是,有时检验字段的类型必须为数值,组变量的类型必须为字符,变量类型可以在变量视图窗口进行修改。

图片 

4.在挑选检验方法时,我们倾向于采用Kruskal-Wallis单因素方差分析,即多样本间秩和检验的常用手段。该方法适用于多组连续变量且不符合传统方差分析条件的场合。这类数据常用于比较多种药物的疗效,但人们往往倾向于使用R×C列联表卡方分析,而非多组独立样本的秩和检验,这可能导致结论的偏差。中位数检验虽能直接验证各组总体中位数是否一致,但效能低下,难以捕捉组间细微差异,因此不宜作为首选。


 

结果解释

1.下表对检验结果作了简单介绍,原假设为各组疗效等级的分布相同,检验方法为 Kruskal-Wallis 检验,即多组独立样本的秩和检验,检验结果为P<0.01 (注意:显著性水平显 示为0.000时,并非代表0,而是由于受到小数点位数限制,没有将后面数据显示出来),因此 可以认为3种方法治疗慢性咽炎的效果有差别。

图片 

2.在结果窗口双击假设检验摘要表格,弹出详细结果窗口,其结果如下:

图片 

这是常见的箱式图(box plot),常用于描述不符合正态分布的连续变量的分布特征,此处 用于表示多组等级资料。但该图大家需要特别注意,纵轴所代表的疗效等级并非原始数据,而 是排序后形成的疗效等级秩次的总体,图形能帮助大家直观地感受各组之间的数据分布。

2. 下表给出了具体的统计值,经过调整的检验统计量为51.388,相当于教科书中的值, P<0.01,   可以认为3种方法治疗慢性咽炎的效果有差别。

图片 

注意事项

在多个总体的比较中,我们仅能确定是否存在差异性。若发现差异,则需进一步通过两两比较来明确哪些组别间存在显著差异。然而,此步骤存在争议,且权威统计软件如SAS、SPSS等均未涉足。对此,我们可以采取以下应对策略:

采用两组对比法实施非参数检验时,需留意第一类错误的控制。然而,非参数检验的效能稍逊,关于是否需调整α值存在分歧,通常认为:

(1)如果样本量较小,则不一定需要调整α水准,直接比较即可,这样可以补偿非参数检 验效能不足所带来的损失。

(2)如果样本量较大,比如每组均在几十例以上,则必须调整α水准。


参考:《临床医学研究中的统计分析和图形表达实例详解》

欢迎关注我,让你身边多一位熟悉统计分析方法的帮手,有以下付费视频或服务可供选购:

1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效

2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高

3.购买视频课程赠送课程相关主题内容1对1答疑1年。