双向无序的列联表分析的SPSS操作教程及结果解读---孙医生工作室带你学统计学(挑战SCI)第23天

在上一期,我们已经讲完了列联表分析的基础知识---孙医生工作室带你学统计学(挑战SCI)第22天,这期开始讲双向无序的列联表分析,我们主要从双向无序的列联表分析介绍及案例的SPSS操作演示这几方面进行讲解。



双向无序的列联表分析介绍


双向无序列联表是指行变量和列变量均为无序分类变量,统计方法和一般四格表卡方检验一致。是针对行变量和列变量是大于2个分组的无序分类变量进行相关性分析的方法。

RC列联表主要涉及到两类变量:行变量,列变量。其次还要明白这些行变量与列变量的属性,当计量资料的行变量与列变量均为无序变量时,我们称之为双向无序的RC列联表,可采用卡方检验进行分析。

这里提到了分类变量的属性,如何判断变量的属性呢?我们生活中接触到的分类变量主要有两类,有序变量和无序变量。举个例子,有序分类变量,药物治疗的效果:无效,有效,显效,痊愈;年龄的分类:<18岁,18-40岁,>40岁;成绩的分类:优秀,良好,合格,不合格。无序分类变量,比如性别:男,女;国籍:中国,俄罗斯,美国



案例的SPSS操作演示


分析示例

某省随机抽查了1043 位居民的ABO血型和MN 血型,问两种血型的 构成比有无差别(或两种血型有无关联性)?

图片 

研究假设

H0两种血型系统分布无差别。 

H1两种血型系统分布有差别。 

α=0.05

数据录入

1. 变量视图

名称 x1 标签 ABO血型 

名称 x2 标签 MN血型  

名称 weight 标签 权重

图片 

2.数据视图

图片 

注意该数据视图和R×C 表的差别

操作流程

图片 

1. 下图是对数据的预定义,在数据(D) 下拉菜单框中完成,即设置权重变量,该操作是对 R×C表运算的基本操作。

图片 

2. 以下展示的是R×C表的基础对话框,关键在于设定行与列的变量。在此,行变量多为分组标识,列变量则是结果展现。此例中,两者可自由设定,仅左右结果排列,对统计实质无影响,故行、列变量可随心所欲地指定。

图片 

3. 下图是对话框选用统计量,本次选用卡方检验(Chi-square), 该检验用于判断行、列变量是否独立,如果数据不满足卡方检验的要求(不能有单元格的期望值<1,不能有20%以上 单元格的期望值<5),系统会在分析结果中给出提示。

图片 

4 .下图中各项是列联表单元格中的描述性指标,观察值(observed) 指原始数据期望值 (expected) 指统计过程中的理论数, 一般用处不大。各种百分比,如行百分比(Row)、列百分比(Column)及合计百分比(Total)这是R×C 表中重要的统计描述内容。

图片 

结果解释

1.下表是处理记录缺失值情况报告,可见1043例均为有效值。

图片 

2.以下表格呈现了各类百分比结果,关键在于理解百分数的构成——分子与分母。分子即各单元格的观测数值,易于确定;分母则需依据特定的100%基准,包括横向总计、纵向合计及总数总计。根据实际需求选择基准,本例中百分比仅供参考,无需作为统计描述的重点。

图片 

图片 

3.R×C  表卡方检验一般看首行 Pearson卡方值,但是若1/5以上的格子理论频数<5,或有一个理论频数<1,则可采用似然比卡方的结果。本例当中0单元格的期望计数(理论频 数)<5,最小期望计数(最小理论频数)13.56,因此采用Pearson卡方值29.925,P<0.01,说明两种血型系统分布不同。

图片 

注意事项

1. 卡方检验的两两比较:若总体数据呈现差异,我们可通过调整消耗函数(即对a系数进行优化),进而实施多组间的细致对比,即两两比较。

2. 卡方的精确分割:面对R×C表格中频数繁多的细小单元格,我们应借助专业知识,对表格内容进行合理整合。具体而言,就是将原本过于细分的列联表的列或行进行合并,以更清晰地展现两个变量间的关联。合并时,需遵循相邻且无显著差异的列或行合并原则,并确保合并具有专业意义。同时,各子表的自由度总和应与总表一致,且各子表的卡方值之和也应等于总表的卡方值。



参考:《临床医学研究中的统计分析和图形表达实例详解》

欢迎关注我,让你身边多一位熟悉统计分析方法的帮手,有以下付费视频或服务可供选购:

1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效

2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高

3.购买视频课程赠送课程相关主题内容1对1答疑1年。