1 介绍
2 名词解释
3 流程
3.1 数据输入、清洗、预处理
3.1.1 输入表达数据
3.1.2 检查基因和样品是否有过多缺失值,以及异常样品
3.1.3 输入临床特征数据
3.2 一步构建共表达网络和划分模块
3.2.1 筛选软阀值 β
3.2.2 构建网络和划分模块
3.3 模块与性状关联分析
3.3.1 量化模块特征关联
3.3.2 基因与性状和重要模块的关系:基因重要性和模块成员
3.3.3 模内分析:鉴定具有高GS和MM的基因
4 总结
WGCNA相比于差异表达基因可以获得很多信息,通过考虑测得的转录本之间的关系可以更完整地表示微列阵数据,这可以通过基因表达谱之间的成对相关性进行评估。WGCNA从数千个基因的层次开始,确定临床上感兴趣的基因模块,最后使用模块内连接性,基因重要性来识别疾病途径中的关键基因,以进行进一步验证。
与其将成千上万的基因与微阵列样品特征相关联,不如着重于几个(通常少于10个)模块与样品特征之间的关系。为此,它计算每个模块的特征基因显着性(样本特征与特征基因之间的相关性)和相应的p值。模块定义不使用先验定义的基因集。取而代之的是,通过使用层次聚类从表达式数据构造模块。
尽管建议将生成的模块与基因本体信息相关联以评估其生物学合理性,但这不是必需的。由于模块可能对应于生物学途径,因此将分析重点放在模块内Hub基因(
或模块特征基因)上就等于一种出于生物学目的数据降维。由于模块内hub基因的表达谱高度相关,通常会产生数十种候选生物标记。尽管这些候选者在统计学上是等效的,但它们可能在生物学上的合理性或临床效用之间存在差异。基因本体信息可用于进一步确定模块内Hub基因
的优先级。
下图显示了WGCNA分析流程。
构建共表达网络
划分模块
模块与性状关联分析
模块之间关联分析
模块中核心基因鉴定
表达数据和性状数据下载(请联系小助理获取哦)
(代码部分展示)
加权共表达网络最主要的两个步骤:
共表达网络构建和模块划分
模块和性状关联分析
通过上面两个步骤找到与目标性状显着相关的模块,对模块里面的基因进行后续分析,如结合差异表达分析。
科研路漫其修远兮,吾将上下而求索,有烦恼苦闷或者有趣好玩的事情记得告诉小助理,希望陪伴您一起成长。
踌躇满志无限期
扬帆起航正当时
科研小助理为您在线解答
点分享
点点赞
点在看
联系客服