打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
转录组差异分析方法越多越好吗
userphoto

2023.03.30 广东

关注

交流群有小伙伴问为什么推荐 DESeq2 做转录组测序的表达量矩阵差异分析,那么多其它软件可以选择啊,以及是不是可以多用几个软件然后取交集保证结果的一致性。

其实一般来说呢,多种转录组差异分析方法可以提供更全面和准确的结果,但是过多的方法也可能导致方法间的冲突和结果的混乱。让我想起来了好久以前看到的一个综述:Costa-Silva J, Domingues D, Lopes FM (2017) RNA-Seq differential expression analysis: An extended review and a software tool. PLoS ONE 12(12): e0190152. https://doi.org/10.1371/journal. pone.0190152

系统性测评了转录组测序数据分析的上下游软件的组合,包括4中比对软件( BWA, TopHat, Bowtie and STAR mappers)以及两个非比对定量软件( Salmon and kallisto ),以及9个差异分析算法软件,如下所示:

上下游软件的组合

文章提到的9个差异分析算法软件如下所示:

9个差异分析算法软

每个差异分析算法背后都是统计学假设和模型,大概率超出了绝大部分小伙伴的理解能力。那我们直接看9个算法比较后的汇总结论:

9个算法比较后的汇总

因为使用了qRT-PCR来验证算法找到的差异表达基因,所以默认实验结果是金标准。可以看到,9个算法一起错误的有19个差异基因,绝大部分差异基因都至少会被1~5个算法找到,全部的9个算法都一致的基因是没有的,哪怕是被8个工具支持的差异基因也很少。

也就是说, 希望全部的算法都很一致是不切实际的,一半以上的工具支持基因有差异表达就很可信了其实,退一万步说,仅仅是单一工具算法找到的基因其实也问题不大。

当然了,这个结论很口语化, 感兴趣的可以看统计学数据, 文章的 Fig 5. Projection curves of TPR and SPC. 和  Fig 4. ROC curve from integration of DEG identification methods.

上面的汇总是从实验验证的真正的差异表达量基因来考虑,其实实验总共涉及到接近1000个基因,qRT-PCR (gold standard) with 413 DEGs and 584 not differentially expressed transcripts, totaling 997 genes analyzed.

也可以从假阳性的角度考虑这些算法,感兴趣的可以去读综述:Costa-Silva J, Domingues D, Lopes FM (2017) RNA-Seq differential expression analysis: An extended review and a software tool. PLoS ONE 12(12): e0190152. https://doi.org/10.1371/journal. pone.0190152

最后,让我们一起来看看chatGPT的回答吧!

what's the best methods for DEG analysis

所以,大家完全不需要纠结选择什么软件什么算法,主流的ngs技术都有成百上千个软件组合可以选择了,但是这些ngs数据都是高通量的批量分析,所以压根就不需要保证百分比精准,只需要趋势是对的,提供一些信息给科研工作者即可。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
差异表达基因分析:差异倍数(fold change), 差异的显著性(P
TCGA基因芯片数据分析神器,问你接不接?
单细胞测序
科研 | 福建农林大学:转录组和代谢组联合分析不同蓝光强度对茶树嫩芽的影响
乳腺癌免疫微环境预后
6+非肿瘤+Friends分析+实验生信思路,性价比高到飞起!!
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服