打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
关于影像数据的统计分析中协变量是否应该去均值(demean)的一点思考

在影像数据的统计分析中,我们常常需要加入协变量。不管这些变量是我们感兴趣的(比如:想做年龄和灰质体积的协共变分析)、亦或是不感兴趣的(想去掉年龄、性别对组比较的影响),都不能回避一个问题----究竟是否该对这些协变量去均值化?如果需要,如何该正确的进行去均值化?这里,我们举三个例子来说明这一问题(以功能连接为影像学指标,年龄为协变量)。


1:设计矩阵和参数分别为


通过数形结合思想,上述对应的实际图形为


插入语:为了便于大家的理解,在第一个例子中,不得不再多说几句话。大家可以把上面的设计矩阵和参数估计beta看成矩阵的相乘,所以beta(1)对应的是设计矩阵的第一列,beta(r)对应的是设计矩阵的第二列。简单来讲,在线性模型Y =ax+b*1中,a为斜率,b为截距,这个在初中数学中我们已经学到过。举一反三,上述例子的参数beta(1)实际为直线的截距(intercept),beta(r)为直线的斜率(slope),后面的例子与此相同。

 

问题1:当我们的contrastc =[1 0],去均值是否必需?

答:必需。这样的contrast设置表示我们关心的是直线的截距。如果我们不对协变量去均值,如上图所示,这时contrast对应的效应为当年龄为0时,功能连接的值,而这通常不是我们所关心的事情。如果去掉均值,实际上相当于对Y轴做平移,移动到年龄的平均数。我们知道,线性方程当自变量X取均值的时候,其对应的Y值也为因变量的均值,这通常是我们所关心的(如单样本t检验)。

 

问题2:当我们的contrastc =[0 1],去均值是否必需?

答:不必需。因为不管是否进行demean,直线的斜率均不发生改变(只是对Y轴进行了相应的平移)。


2:设计矩阵和参数为


通过数形结合思想,上述对应的实际图形为


问题1:当我们的contrastc =[1 -1 0],去均值是否必需?

答:不必需。此时的contrast表示我们关心的是两条直线的截距之间的差异,由于两条直线的斜率一致(均为beta(r),所以不管是否去均值(Y轴是否平移),差异不变。

 

问题2:当我们的contrastc =[0 0 1],去均值是否必需?

答:不必需。同第一个例子,我们关心的是斜率,不管是否去掉均值不影响斜率的大小。

 

问题3:当我们的contrastc =[1 0 0][0 1 0],去均值是否必需?

答:必需。同第一个例子,这时我们关心的是第一组的截距。不进行demean,我们得到的结果是年龄为0时,第一组的截距。


3:设计矩阵和参数为


通过数形结合思想,上述对应的实际图形为


问题1:当我们的contrastc =[1 -1 0 0],去均值是否必需?

答:必需。这样的contrast设置表示我们关心的是两条直线截距的差异。同前两个例子,如果不去掉年龄均值,我们得到的是年龄为0时,两组人功能连接的差异(通常不关心)。如果去掉年龄均值,得到的是两组人功能连接的平均差异结果。在这里,一定要注意demean不能在组内进行(后面注意事项中也有解释)。如果使用数形结合思想去解释,前面也说过,对年龄进行demean相当于把Y轴移动到年龄的均值。两组人年龄不同,则均值也不同。如果组内进行demean,则Y轴在每组的位置不同,结果不可比。

 

问题2:当我们的contrastc =[1 0 0 0][0 1 0 0],去均值是否必需?

答:必需。解释同前两个例子。

 

问题3:当我们的contrastc =[0 0 1 -1][0 01 0][0 0 0 1],去均值是否必需?

答:不必需。解释同前两个例子。


注意事项:

  1. 如果手动对数据进行demean工作(比如利用matlab或者excel),然后保留两位有效数字并将他们输入到design matrix中。这些协变量其实并没有真正的被demean,建议至少保留4位有效数字。

  2. 如果有多个组,我们不应该在每组内部进行协变量的demean。举例:如果你有两组人,一组人的年龄显著小于另一组人。两组年龄之间的差异可能可以解释脑影像学指标的差异。如果你在每组内部进行demean,那么每组年龄的均值为同一个数值(0),因此得到的组间差异实际上可能归因于年龄。

  3. VBM分析中,用于检测均值效应的contrasts (比如第一个例子中的[1 0];第二个例子中的[1 0 0] or [0 1 0];和第三个例子中的[1 0 0 0] or [0 1 0 0]) 是没有意义的(因为灰质体积等都是大于0的)。

 

总的来说,如果为了保险起见,每个协变量都可以demean(但是所有组的协变量应该一起进行demean)。


以上内容来源于网页http://mumford.fmripower.org/mean_centering/以及一些自己的思考,如有问题,欢迎留言讨论。




本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
重复测量数据分析系列:广义线性混合模型(GLMM)
R数据分析:潜增长模型LGM的做法和解释,及其与混合模型对比
R语言从入门到精通:Day11
主成分分析、线性回归-简要说明
入门|贝叶斯线性回归方法的解释和优点
为什么要进行因子正交化处理?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服