打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
实操:通过SEER数据库发一篇SCI系列(七)

本周发现比特币突破9万啦,这就是一个很小的圈子,不过“区块链”、“比特币”字眼逐渐开始进入人们的视野,人们也许会好奇这是什么东西,也许从来都是不屑一顾,真的很少有人去真正了解并实践。

通过过去9个月的每周定投,我也是拥有一枚比特币的人了,如果我能一直持有20年,将会是怎样一个画面?

有时感觉人生好艰苦,尤其是在自己年轻的时候,总是向往着财富自由、心灵自由。但如果站在20年后回看现在的自己,会不会感激现在的自己虽然日子过得很苦逼,但至少还是个有信仰、有追求的人。

年轻时至少为一件事付出过深情,这才是最有意义的。

不说了不说了,还是老老实实写我的SEER文章吧,虽然很苦,但是也要假装很幸福嘛。

本周学习收获是进一步熟悉了R语言,以及一些简单的操作。还有就是利用R来进行PSM(propensity score matching)倾向评分匹配。

在回顾性研究中,常常出现实验组与对照组基线不齐,容易产生选择偏移,导致数据分析结果可靠性不佳。而倾向评分匹配,它能剔除掉两个组基线差异较大的病例,剩下的进行1:1匹配,从而将两组基线数据匹配整齐。

本人硕士毕业论文也就是套用这个方法,当时用的是SPSS来操作的,但是SPSS本身并不自带PSM功能,必须自己安装相应的软件(R软件、SPSS R插件、PS matching插件),网评难度系数5颗星!渣渣我光是这个安装过程就花了三个多月时间。

R语言的出现,就没有那么麻烦了,只需两个安装包及几个程序命令就可以搞定,不得不说,想要更快更高效,还是得花更多时间去学习高大上的东西。

关于R及R studio的下载在系列二中已介绍过,这里不再实操。接下来重点操作的是关于PSM的R studio实操。

实操:利用R studio来做PSM

1.打开R studio软件,导入处理后的EXCEL数据表。

2.安装PSM程序包:install-输入“matchit”-install-再在matchit框框☑️,表示程序包已安装好。

3.附上我的数据库

命令:attach(肺癌数据处理xlsx)

4.赋值分组变量,例如研究肿瘤远处转移与非远处转移中,两组病例的基线比较,此时需要赋值Mstage变量(注:这个变量只能用0或1表示,否则程序会报错),并执行matchit的语句,进行PSM计算。

命令:Mstage=as.factor(Mstage)

m.out=matchit(Mstage~Tstage+Nstage+gender,data =肺癌数据处理xlsx,method='nearest',ratio=1)

5.将结果输出到新的data,我们可以看到数据处理前是20791例,匹配之后还剩下13154例。

命令:m.data1<-match.data(m.out)

6.输出结果到EXCEL表格,将EXCEL后缀改为“csv”数据才能完整看到,最后可以进一步行数据统计学分析。

命令:write.table(m.data1,'lungcancer1.csv',sep=',')

搞定这六步,利用R语言就可以完成PSM就成功啦,听起来就很牛逼。但我还是有点疑惑,就是关于卡钳的取值,R语言似乎没有,这似乎不太合理,我有时间问问牛人。

自己写了这么多,基本的套路我大概都掌握了,是不是应该尝试考虑下我的第一篇SCI题目方向了?

清晨毒鸡汤来一碗:你唯一的对手,就是昨天的自己。

早安,各位!

END



本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
肿瘤数据挖掘与统计分析训练营
详细教程:如何利用SPSS和R语言实现倾向得分匹配?
全球N0肺癌例数最多研究: 淋巴结清扫最低个数(2021)
文献精读|SEER数据库回顾性分析三阴乳腺癌生存
一篇SCI论文背后的故事
如何结合SEER数据库 统计学套路进行预后研究——临床研究屌丝“第一桶金”挖掘之路
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服