打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【原创】SNP的meta分析从0基础到文章接受(已完成,欢迎讨论(附Stata12.0带meta模块软件)
Association of two polymorphisms rs2910164 in miRNA-146a and rs3746444 in miRNA-499 with rheumatoid arthritis: A meta-analysis.
http://www.ncbi.nlm.nih.gov/pubmed/24824381
大家好,我在去年五月分时,一时兴起,找了个SNP的meta分析来做,当时都不知道什么是SNP,到今天收到文章接受的消息时,我还是很激动.我今天开此帖将我的学习经历,资料(所发文章所有数据)进行分享.并且把统计学过程重复一边.(用STATA软件进行),希望可以帮助到在进行SNP meta分析的同学. (我把我在snp meta学习中的资料也上传了。)
第一部分: SNP与meta分析
单核苷酸多态性性( single nucleotide polymorphism, SN P)是指在染色体基因组水平上单个核苷酸的变异引起的DNA 序列多态性, 而其中最少一种等位基因在群体中的频率不小于1%。它包括单碱基的转换, 颠换、插入及缺失等形式。例如, 一个SNP 可以将一个DNA 序列: AA GGCTAA 变为ATGGCTAA , 其中发生了A→T的颠换。
SNP 在基因组内可以划分为两种形式: 一是遍布于基因组的大量单碱基变异; 二是基因编码区的功能性突变.
SNP可能会引起编码蛋白的结构或功能异常,从而导致疾病的易感性,程度等增加或降低.而由于作用效能是其使某些临床结局加重还是减轻需要通过病例对照分析来发现.但是往往由于这些病例分析研究的样本量,人种,人群基线资料等的差异会造成结果的不统一.因此就需要用meta分析来(1).增加样本量增加检验效能探索其真实效应.(2).亚组分析来识别混杂因素对与效应之间的关系.(3).探索异质性来源来发现影响效应的因素.从而在一定程度上使问题得到清晰的解决.
在此阶段,我当时遇到的问题:
1. 什么是SNP? 我是学临床的,根本不知道这个东西.我从生化书,百度,中文相关文献等很快对SNP进行了一个大体的认识.之后就是在读别人文章的过程中会发现,同一个SNP表述方式竟然不一样.接着下一个问题就来了.
2. 如何表示SNP? 当时我去问过搞基础的老师,也在DXY中发帖提问,得到了正确的解答.我在2013年6月分时发帖子提问的:关于SNP的命名 - 丁香园论坛
一个microRNA-499的SNP.命名如下:
1. miR-499 3746444 (A>G)
2. miR-499 3746444 (T>C)
3. rs3746444
这三个意义都一样嘛?
其中第一个与第二的区别是什么? 是不是可以这样理解: A=T,C+G.所以前两个其实一样.
对于第一个和第二个中 (A>G), (T>C)表达什么意义?
答案:1,2的意思是一样的,区别是正义链和反义链。3的意思是基因组上的这个位点是个snp。指的是基因组上的序列。
第二部分:选题
在我个人看来,SNP的meta分析是很容易上手的。选题也不难,但是,正是因为选题也不难且容易实施,所以大家都争着去做,这就会造成无题可做。
首先,定向:骨科。
由于基因多态性是个老问题了,但是microRNA比较新。我本人也在大三时写过microRNA与炎症的一个中文的综述。因此,将题目定在microRNA多态性与RA的关系。在众多的microRNA,与炎症有关的有microRNA-146a。因此定向到microRNA-146a与RA的关系。
同样,我和大多数人一样,首先想到的是microRNA多态性与肿瘤,但是大家都能想到的,我们就不要去挤。我查后,发现microRNA多态性与肿瘤的文章就有近十个。其中只有一个是国外人做的。国外那个做了所有的肿瘤,而国内的那几个,针对性的做了某些肿瘤。国外的那个文章涵盖了所有国内的那几个文章了。可以看到,SNPmeta的灌水程度有多深了。我好像听说过疾病大致分为两类,一类是肿瘤性的,一类是免疫性的。当肿瘤性的被瓜分完了的时候,我转向了免疫性的。恰恰在Embase中发现有人做了microRNA多态性与免疫性疾病的meta分析。其中包括了RA,但是他纳入的文献比较少,只有三个,而且目前又有了3个新的研究,所以我就把题目定在了:
Association of Two Polymorphisms rs2910164 in miRNA-146a and rs3746444 in miRNA-499 with Rheumatoid Arthritis: A Meta-analysis.
(其中miRNA-499是在文章筛选时发现的,其往往miRNA-146a同时被研究,而且得益于我们检索((((arthritis OR Polyarthritis))) AND (polymorphism OR polymorphisms)) AND (microRNA OR microRNAs.),并没有说明是哪一个miRNA,所以加入miRNA-499是合情合理的。同时,也增加了我们文章的内容)
到此为止,是我们题目的来源(里面有些表述不是很规范,希望大家理解)
第三部分:检索
当时我不是很懂检索,所以主要是模仿。检索不一样要看起来高端大气、上档次,只要在保证检索全的基础上准,是最好的了。
检索按照“PICOS”原则进行。
P无限制,I可以当成是microRNA多态性,C microRNA野生型(不限制),O:RA S:Case-control(不限制)
检索词:microRNA(从以发表关于microRNA的高质量的meta分析中找,看别人是如何制定的检索式)
多态性(从以发表关于基因多态性的高质量的meta分析中找,看别人是如何制定的检索式)
RA(从以发表关于RA的高质量的meta分析中找,看别人是如何制定的检索式)
检索词语为:
一:microRNA,microRNAs.
二:polymorphism, polymorphisms
三:arthritis, Polyarthritis
检索式为:
(microRNA OR microRNAs) AND (polymorphism OR polymorphisms) AND (arthritis OR Polyarthritis) (这是我们输入的语言)
Pubmed对应的高大上的机器语言为
(("micrornas"[MeSH Terms] OR "micrornas"[All Fields] OR "microrna"[All Fields]) OR ("micrornas"[MeSH Terms] OR "micrornas"[All Fields])) AND (("polymorphism, genetic"[MeSH Terms] OR ("polymorphism"[All Fields] AND "genetic"[All Fields]) OR "genetic polymorphism"[All Fields] OR "polymorphism"[All Fields]) OR ("polymorphism, genetic"[MeSH Terms] OR ("polymorphism"[All Fields] AND "genetic"[All Fields]) OR "genetic polymorphism"[All Fields] OR "polymorphisms"[All Fields])) AND (("arthritis"[MeSH Terms] OR "arthritis"[All Fields]) OR ("arthritis"[MeSH Terms] OR "arthritis"[All Fields] OR "polyarthritis"[All Fields]))
检索数据库:
Pubmed Embase (因为SNP是非RCT,且有些偏向于基础的研究,所以我没有检索cochrane, clinicaltrial.gov)
检索结果
Pubmed:26
第四部分:文章筛选及全文获取
这部分没有什么要点可以说。但以理几点要做到:
1. 会用endnote
2. 两个人独立重复进行
3. 对于引用文献的筛选要认真,这里往往有意想不到的发现
下载文章:
1. 首先去pubmed中下载,如果下载不到,就到下一步
2. 去google搜索,有可能会找到PDF版。如果下载不到,就到下一步
3. 有一个好的方法。在文献所以的网页一级网站后加 .sci-hub.org,就可以下载到全文了。这个是很好的方法,不受IP限制。如果下载不到,就到下一步
4. 找文献下载群求助,如果下载不到,就到下一步
5. 如果下载不到,就到 DXY求助 (要叮当嘛,不推荐首选)
6. 文献传递 (时间48小时,两个工作日,而且不一定传递得到,不建议首选)
初筛过程
二筛选后文章,6个 (见附件,由于附件只能上传五个,所以我就上传五个吧,)
第五部分:数据提取(在这里我们只展示数据部分,对于一些基线资料的提取也很重要,我们就不进行展示了)
casecontrol
study IDSNP HWEGG(TT)GC(CT)CCGG(TT)GC(CT)CC
Chatzikyriakidou, et al 2010miR-146acase:0.99
control: 0.50735310805314
Yang, et al 2011miR-146acase:0.98
control:0.5292895853011694
Yang, et al 2011mir-499case: 0.157
control:0.88159427182535
Jim ?enez-Morales, et al 2012mir-146acase:0.17
control:0.67102802823622966
Qian, et al 2012mir-146acase:0.53
control: 0.931665423510976
El-Shal, et al 2013mir-146acase: 0.98
control:0.07301038415119111
El-Shal, et al 2013mir-499case:0.34
control: 0.981139311167708
HASHEMI, et al 2013mir-146acase:0.93
cibtrol:0.555739864379
HASHEMI, et al 2013mir-499case:0.001
cibtrol:0.003463226742511
第六部分:数据分析(所有数据,见楼下)
因为是做SNP,所以要有一点点遗传相关的知识,下面是我们数据处理的一些设计好的遗传模型
miRNA-146a rs2910164 G>C:
1. Allele model : C/G
2. Heterozygote model: GC/GG
3. Homozygote model: CC/GG
4. Dominant model: CC+GC/GG
5. Recessive model: CC/CG+GG
miRNA-499 rs3746444 A>G: T>C
1. Allele model : G/A
2. Heterozygote model: AG/AA
3. Homozygote model: GG/AA
4. Dominant model: AG+GG/AA
5. Recessive model: GG/AG+AA
按照上面的方法进行,我们就可以将数据分成四格表资料了,这样就很容易看懂了,大家她好理解。
如下图,上面的为原始数据,下面的为我们进行运算时所用的数据。红色部分是我们进行miRNA-146a rs2910164 G>C:  1. Allele model : C/G
写成a b c d 为:casealleleC casealleleG controlalleleC casecontrolG
这个在stata或RevMan中都可以进行meta合并了。
studyIDYearcaseGGcaseGCcaseCCcontrolGGcontrolGCcontrolCC
Chatzikyriakidou2010735310805314
Yang20112895853011694
Jim enez-Morales2012102802823622966
Qian20121665423510976
El-Shal2013301038415119111
HASHEMI20135739864379
studyIDcasealleGcasealleleCcaseCCGCcaseGCGGcontrolalleleGcontrolalleleCcontrolGCGGcontrolCCGC
Chatzikyriakidou19973631262138113367
Yang151265180123176304146210
Jim enez-Morales284136108182701361465295
Qian9714910781179261144185
El-Shal163271187133149341134230
HASHEMI1535547961655510146
作出的图为:(其他模型可以类推进行,这里不一一写出来)
到此为此,我们就大概说了一哈SNP的meta其中还一些亚组分析,敏感性分析,的统计部分,我没有进行演示,这部分相对比较容易,重点是一些大的框架,我给大家列出来了。
此外,还有一些要用:哈温平衡的检验,是SNPmeta分析中不可少的一部分,如果大家有问题也可以跟帖提问。
重点是走出第一步,只要敢去做就行,过程中遇到困难,都可以在园子里提问。对于文章数据的解读、文章写作方面,如果大家有问题,也可以问我。我就是这样一步步在园子时学出来的。希望有心人能功有所收获,欢迎大家讨论。
鉴于园子里好多人都在求助STATA12.0 软件,需要私信发我邮箱,我看到后,会第一时间发送的,希望大家能投票支持,谢谢。当年我也为了这个软件恼火了很久。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
兵分5路,寻找胰腺癌的液体活检标志物
ANGEW CHEM INT EDIT:新实验技术捕获microRNA靶标
MicroRNA与高血压病
乳腺癌风险预测:十八单核苷酸多态性+钼靶密度+经典因素
lncRNASNP2:lncRNA与SNP研究关联数据库
MirSNP:miRNA相关SNP位点数据库
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服