打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
GWAS大家都知道,Gene-Based GWAS你了解吗?

GWAS称之为全基因组关联分析,传统意义上的GWAS针对单个SNP位点进行分析,来寻找与疾病或者性状相关联的SNP位点。在过去的几十年,依托高通量基因分型技术的快速发展,GWAS广泛应用于很多复杂疾病和性状的研究中,取得了不错的进展。

然而SNP水平的GWAS分析还存在着一些问题,通常情况下我们根据经验阈值,比如1X10-6,5X10-8来筛选统计学显著的SNP位点,这样的做法会过滤到很多p值不够小,即关联效应较弱的基因。对于复杂疾病而言,其易感基因往往是很多关联效用较弱的微效基因构成,这样的筛选方式会漏掉很多重要的信息。

为此,科学家们尝试在更高水平整合SNP GWAS分析的结果,以提高GWAS检验的效能,常见的有以下两种水平

  1. gene

  2. gene-set

第一个为基因水平,综合考虑某个基因上多个SNP位点的关联分析结果,来计算该基因与疾病的关联性;第二种为基因集水平,也可以称之为pathway水平,是基因水平的进阶,考虑了基因生物学功能的关联性,站在生物学功能的角度来研究突变与疾病的关联性。通过这两种level的关联分析,可以更加有效的检测与疾病存在关联的基因或功能,而且这两种分析是建立在SNP GWAS水平的基础上的,这样方便我们对已有的GWAS分析结果进行二次分析,深入挖掘新的信息。

实现这两种分析有很多的算法,比如线性回归,逻辑回归等等,最好的办法就是使用别人已经开发好的成熟软件。MAGMA这款软件就可以实现上述两种水平的关联分析,官网如下

https://ctg.cncr.nl/software/magma

对于基因水平的关联分析,采用了多元线性回归模型, 首先对某个基因内所有SNP位点的基因型矩阵进行PCA分析,挑选其中的几个主成分作为回归分析的自变量,通过线性回归来分析与疾病的关联性;对于pathway水平的关联分析,则采用了self-contained的方法,示意如下

首先通过一个宽松的阈值,比如0.05来筛选某个基因上的候选SNP位点,在候选SNP位点的基础上,进一步通过严格的阈值来划分类别,比如5X10-8, 划分为显著和非显著两类。然后根据Alleles或者genotypes, 选择对应的模型来计算关联性。

该软件由于采用了线性回归模型,还可以在已有自变量的基础上,添加协变量和自变量的交互作用,进一步提高了检验效能,在后面文章中会详细介绍其用法。

·end·

—如果喜欢,快分享给你的朋友们吧—

往期精彩

  基因型填充
  CNV分析
  TCGA
  生存分析
  肿瘤数据库
  肿瘤免疫和新抗原
  Hi-C数据分析
  chip_seq数据分析
  motif
  chip_seq数据库
  18年文章目录
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
孟德尔随机化最新高分文献详解(7.29)I微量营养素循环水平与感染风险
NC:自体免疫水泡皮肤病中鉴定基因与微生物组互作(微生物组关联分析MWAS)
SNP从无到有?
GWAS专题之连锁不平衡
GWAS十年综述:从生物学功能到转化医学的发展
【数说·大数据圈】机器学习在生物大数据应用的一个例子 文/飞扬
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服