作者/风仕
在上一期,我们主要讲了析因设计资料的方差分析的SPSS操作及结果解读,这期开始讲重复测量资料的方差分析的SPSS操作及结果解读,现主要从重复测量资料的方差分析介绍、析因设计资料的方差分析使用条件及案例的SPSS操作演示这几方面进行讲解。
重复测量资料的方差分析介绍
重复测量资料(repeated measurement data)是同一受试对象的同一观察指标在不同时间点上进行多次测量所得的资料,常用来分析观察指标在不同时间点上的变化。
重复测量资料数据的两因素多水平设计,两因素指处理因素和测量时间,多水平指处理有K(≥2)个水平,测量时间有i(≥2)个水平(时间点),即每个观察对象有i个重复测量数据。
重复测量资料数据的两因素方差分析既可分析两因素(处理和时间)各水平均数间是否不同,又可分析处理因素和时间因素的交互效应。
重复测量方差分析与单变量方差分析思路的不同之处在于:单变量方差分析是对某一变量的方差进行分解,而重复测量数据存在多个时间点的测量结果,并不仅有1个变量,而有多个变量,从而形成多个变量的方差-协方差矩阵。这里关键要弄清楚,1个变量,只有方差,而2个及以上变量,不仅有每个变量的方差,还有表示几个变量之间关系的协方差,所以多个变量就会形成一个方差-协方差矩阵。因此,重复测量方差分析不是对1个变量的方差进行分解,而是对多个变量的方差-协方差矩阵进行分解。
重复测量资料与随机区组设计资料的区别:
(1)重复测量资料中同一受试对象的数据具有相关性,即不具有独立性,而随机区组设计资料同一区组内的数据不具有相关性,即具有独立性。
(2)从试验设计来看,重复测量资料中的处理因素在受试对象(看成区组)间为随机分配,但受试对象(看成区组)内的各时间点往往是固定的,不能随机分配。随机区组设计资料中每个区组内的受试对象彼此独立,处理只在区组内随机分配,同一区组内的受试对象接受的处理各不相同。
重复测量资料的方差分析使用条件
1.独立性:各处理组间数据独立(个体内不独立)。
2.正态性:各组样本来自正态总体。如果违背正态性假定,可对数据进行转化,使其满足正态性,或者考虑使用Friedman非参数检验、广义估计方程等方法。
3.方差齐性:各组方差相等。
4.球形假定(重复测量方差分析的特殊条件):要求在自变量的各水平下的协方差矩阵具有球形性特征,即满足球形假设。因此在进行重复测量方差分析时,需要进行球形假设检验。如果不满足该条件,方差分析的F值会出现偏差,增大第1类错误的概率,这时候就需要对检验方法进行校正。
案例的SPSS操作演示
分析示例
某研究者欲研究青光眼结膜成纤维细胞增殖表达情况,在某医院随机抽取了20例青光眼患者和24例对照,取两组研究对象眼角膜细胞进行培养,分别在3、7、14、21 天四个时间点观察平均细胞数。
研究假设
研究问题1:两组眼角膜培养细胞数的总体均数是否相等。
研究问题2:不同时间观察细胞数的总体均数是否相等。
研究问题3:处理和时间有无交互作用。
数据录入
1.变量视图
名称 group 标签 分组
名称 subject 标签 受试对象
名称 timel 标签 3天
名称 time2 标签 7 天
名称 time3 标签 14天
名称 time4 标签 21天
2.数据视图(部分)
操作流程
1. 重复测量需要预先设定组内因素,也称内因子,默认的名称为因子1,如下图此处设定为 cell, 级别数代表重复测量的次数,此处为4,添加之后完成了初步的设定,还需要进一步定 义。
组内因素(within-subject factor):在重复测量的方差分析模型中,对同一个体相同变量的不同次测量结果被视为一组,称为受试者内因素,如本例当中设定的cell, 就包括了time1、time2、time3、time4 这样一组变量。可见,组内因素并非在原始数据输入时就产生的,而是在运算过程中对一组重复测量的变量进行定义而产生的。
组间因素(between-subject factor):对于受试个体,在重复测量时保持恒定的因素被称为受 试者间因素,如本例当中的分组变量group。
2.下图为重复测量的方差分析主对话框,我们需要对内因子进行进一步定义,同时可见, 由于重复测量的变量为因变量,这里的因变量有4个变量,我们需要在群体内部变量(W) 中 设定,而因子列表(B) 相当于自变量,即该研究中的分组变量 group, 我们将其选入。可见,重复测量方差分析与其他方差分析的区别在于,由于多次测量而出现多个因变量,因此我们需要对这些因变量进行设定。
3.我们需要考虑处理因素、时间变量和两者的交互作用,因此为全模型,此处默认即可。
4. 各组的统计描述值是必不可少的,因此选定描述统计(D)。
结果解释
1. 下表给出了组内因素(within-subject factor),又称主体内因子的基本情况,通俗来讲,即 重复测量的变量,本例指timl~time4的4次观察到的平均细胞数。内因子的定义是重复测量分析中的一个关键步骤。
2.下表给出了组间因子(between subject factor),又称主体间因子的基本情况,即试验中感兴趣的因素,本例当中指分组变量(青光眼患者和对照),整个检验中没考虑变量 subject, 因为它实际为一个记录ID,没有任何统计学上的意义。
3. 表中给出了各变量组合下的描述性统计量均数、标准差和例数,大家可按照需要进行挑选。
4.下表给出了多变量检验结果,相当于将4次重复测量视为4个因变量而进行多元方差分析,此处意义并不大。
5.下表为球形检验(Sphericity Assumption)的结果,以判断各组重复测量的数据之间是否 存在相关性。
H0:重复测量数据之间不存在相关性,数据符合Huynh-Feldt 条件。
H1:重复测量数据之间存在相关性,数据不符合Huynh-Feldt条件。
a=0.10
所谓Huynh-Feldt条件,就是指同一个体的多次重复测量结果间实际不存在相关性,资料的协方差矩阵为H 型协方差结构。
对于球形检验,通常规定的检验水准a=0.10, 以降低犯Ⅱ类错误的概率。
若P>0.10, 则认为数据为球形数据,多次测量结果之间不存在相关性,一般采用单变量方差分析即可;若P<0.10, 则认为数据不符合球形数据,多次测量结果之间存在相关性,则采用重复测量的方差分析,校正系数Epsilon分别为Green-house-Geisser、Huynh-Feldt和下限。本例当中P=0.003<0.10,说明数据不符合球形数据,即不符合Huynh-Fledt 条件,重复测量数据之间存在相关性,则统计结果需要进行校正。
6.下表为一元方差分析的结果,表中输出的是采用一元方差分析对内因子(本例为4个时期)以及内因子与组间因素(group) 之间的交互作用有无统计学意义进行检验,并且给出了非校正(采用的球形度)和校正(Greenhouse-Geisser、Huynh-Feldt、下限)的统计结果,三种校正方法推荐采用Greenhouse-Geisser的校正结果。本例的球形检验中P<0.10, 说明需要进行校正,内因子cell校正后的F=11.704,P<0.01,说明不同时间观察细胞数的总体均数不全相同;而交互作用cell *group 经校正后F=0.676,P>0.05,说明处理和时间无交互作用。
7.在重复测量的数据中,除了影响因素外,研究者有时只关心所测量的指标随着时间变化而呈现的变化趋势,而不提供各次测量间两两比较的结果。这里的假设检验为线性、二次或 三次曲线拟合成立,故要求检验无统计学意义,以cell为例,其线性拟合的P<0.01, 二次曲线拟合P=0.843, 三次曲线拟合P=0.054, 说明二次方曲线拟合最好。
8.下表给出了组间因素的比较,即青光眼组和对照组的比较,F=17.843,P<0.01, 说明两组眼角膜培养细胞数的总体均数不同。
参考:《临床医学研究中的统计分析和图形表达实例详解》
欢迎关注我,让你身边多一位熟悉统计分析方法的帮手,有以下付费视频或服务可供选购:
1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。
2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。
3.购买视频课程赠送课程相关主题内容1对1答疑1年。