干货分享:中介效应模型在医学研究中的应用及R实现

近年来,随着医学研究的发展,中介效应模型分析逐渐受到越来越多的医学科研工作者的关注。巧妙的应用中介效应模型也可以使自己研究不再简单是X与Y之间的关联,为文章增彩。因此,梅斯学术本期将为大家介绍中介效应模型在医学研究中的应用及R实现。

中介效应的定义

如果自变量X通过某一变量M对因变量Y产生一定影响,则称M为X和Y的中介变量。研究中介作用的目的是在已知X和Y关系的基础上,探索产生这个关系的内部作用机制。作用关系图如下:

X对Y的总效应分为直接效应(directeffect)和间接效应(indirect effect),直接效应是指当中介变量(M)固定在某一水平时,自变量X对结局变量Y的效应。间接效应是指自变量X通过中介变量M对结局变量Y施加的影响。按上图所示则c为直接效应,间接效应则为a与b的结合。

中介变量应满足的条件

根据Baron和Kenny等人的研究,符合以下标准的变量可以判定为中介变量:

1.暴露水平的变化显著影响中介变量水平的变化(即X与M的关联具有统计学意义)。

2.中介变量水平的变化显著影响结局变量(即M与Y的关联具有统计学意义)。

3. 暴露因素水平的变化显著影响结局变量(即X与Y的关联具有统计学意义)。

中介效应的R实现

中介效应的R实现需要用的mediation包中的mediate函数。本文将以R语言中自带的数据“jobs”数据集,探讨自变量treat是否通过中介变量Job_seek对结局变量depression产生影响。

示例数据集解释

Jobs数据是基于求职干预研究(Job Search Intervention Study, JOBS II)获取的数据。该研究是一个随机的现场实验,调查工作培训干预对失业工人的有效性。该计划的目的不仅是增加失业人员的再就业,而且提高求职者的心理健康。在JOBS II field的实验中,1801名失业工人收到了一份预筛选问卷,然后被随机分配到治疗组和对照组。治疗组的人参加了工作技能研讨会。在研讨会中,受访者学习了求职技巧和应对求职过程中挫折的策略。对照组则收到一本介绍求职技巧的小册子。在随访访谈中,测量了两个关键结果变量(基于霍普金斯症状检查表的抑郁症状的连续性变量和一个代表被调查者是否已经受雇的二分类变量)。

模型假设

变量解释

job_seek:求职自我效能水平评分,分值为1-5的连续性变量。为本研究中的中介变量

depress2:经过治疗后的抑郁症状测量得分,为本研究中的结果变量。

Treat:是否随机选择参与者参加JOBS II培训项目的指标变量,1为分配参与了JOBS II培训,为研究的暴露因素变量。

协变量:econ_hard为经济困难程度预处理值从1到5。Sex、age为参与者的性别和年龄。

模型拟合的R语言代码

1. install.packages("mediation") ###安装中介效应分析的package

2. library(mediation) ###载入“mediation”函数

3. data(jobs) #载入分析所用的数据集“jobs”

4. b <- lm(job_seek ~ treat +econ_hard + sex + age, data=jobs) ###中介变量job_seek与自变量treat之间模型拟合,模型假设中a通路(中介变量应满足的条件1)

5. c <- lm(depress2 ~treat + job_seek +econ_hard + sex + age, data=jobs) ###自变量treat与结局变量depress2模型拟合,模型假设中c通路(中介变量应满足的条件3)。此时中介变量job_seek需作为协变量纳入模型。

6. contcont <-mediate(b, c, sims=50, treat="treat",mediator="job_seek")

###中介变量Job_seek在自变量treat与结局变量depression之间的中介效应分析

7. summary(contcont) ### summary模型回归结果

8. plot(contcont) ###绘制模型回归结果图

结果解释

模型拟合结果如下图所示。ACME表示average causal mediation effects(indirect effect),即间接效应,ADE为averagedirect effects,即直接效应。total effect为总的效应。Prop.mediated为中介变量解释X与Y间关联所占的百分比,该例为21.69%。

下图三条线都与0线交叉,显示结果无统计学意义。

中介效应分析结果

总的中介效应图可以展示如上图,但是中介变量的间接效应,即IE值无统计学意义,可以解释为变量无中介效应。当中介变量的间接效应即IE有统计学意义时,可认为该中介效应模型成立,因素M介导了因素X与Y间的关联。

需要指出的是,中介分析属于流行病学理论框架中因果推断的范畴,正确的实施和理解中介分析,需要研究者充分了解所研究的暴露因素到结局逻辑链条上其他相关因素的性质,准确判断混杂、交互等概念。

优秀案例推荐:一项基于大型人群队列研究(美国国家健康营养调查(US NHANES)和英国生物样本库(UK Biobank),分别入组4万余名和近40万名来自美国和英国的一般人群)探究了健康生活方式在社会经济地位与全因死亡之间起到的中介作用,研究成果于2021年发表在医学权威期刊BMJ(DOI:10.1136/bmj.n604)。

参考文献:

Psychol Methods. 2013June; 18(2): 137–150.

撰文:珞珈山下小学生

编辑:珞珈山下小学生

授权转载等事宜请联系梅斯学术管理员