打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
从成功案例看不一样的WGCNA分析

相信各位科研君对WGCNA一定不陌生,因为它频频出现在一些运用转录组研究的高水平的文章之中,我们也发表过很多介绍文章(放链接),Weighted Gene Co-Expression Network Analysis(以下简称WGCNA)就是一个适合复杂样本的分析方法,它是一种从测序数据中挖掘模块(module)信息的算法。在该方法中module被定义为一组具有类似表达谱的基因,如果某些基因在一个生理过程或不同组织中总是具有相类似的表达变化,那么我们有理由认为这些基因在功能上是相关的,可以把他们定义为一个模块(module)。当基因module被定义出来后,我们可以利用这些结果做很多进一步的工作。这似乎与聚类分析所得到结果有那么一点相似,但不同的是,WGCNA的聚类准则具有生物学意义。

百迈客研发团队去年已完成了WGCNA分析流程的最新升级开发,升级后增加了许多亮点分析内容,公司目前已合作发表多篇有关WGCNA的文章,今天为大家介绍其中一篇较典型文章,大家一起来感受WGCNA的魅力所在吧~~~

研究背景

芥蓝(Brassica oleracea var. alboglabra Bailey)是中国本土蔬菜,广泛存在于中国南部和东南亚地区。除了味道好, 茎和叶子富含抗癌的化合物和抗氧化剂,包括维生素 C、总酚醛树脂、类胡萝卜素、芥子油苷。芥子油苷是主要在十字花科植物中发现的一种次生代谢物,临床证明,进入人体的芥子油苷是通过肠道内的微生物系统被分解为异硫代氰酸盐在抗癌方面的具有作用。到目前为止,已经有很多关于芥子油苷在于芸苔属植物不同的器官、品种、生长阶段和不同生长条件下的研究报告。例如,芥子油苷生物网合成的关键基因在拟南芥属是已知的,在此基础上,涉及到芥子甘油代谢的基因在很多植物中被鉴定出来,如白菜、西兰花、萝卜等。但是尽管芥蓝已有关于AOP2基因基因功能分析和一些芥子油苷生物合成基因表达分析研究,但是目前没有一个全面的报导关于芥蓝芥子油苷代谢及其调控机制,以及这些基因在不同组织的表达模式研究。

本研究通过芥蓝11个不同组织的转录组测序分析,首次鉴定到了涉及到芥子油苷代谢及其调控机制相关基因,并且分析了他们的在不同组织中的表达模式。

材料方法

1、实验材料:

取完全生长的芥蓝,将其分为11个部分(组织),其中FB,花蕾;YL,幼叶;ML,成熟叶;SL,衰老叶;LV,叶脉;Pe,叶柄;YB,幼茎;MB,成熟抽薹茎肉;BSS,抽薹干皮;CS,结合部位;RO,根系。每个组织取材时候取超过5个植株混合成一个样品进行测序,无生物学重复。

2、测序方法及数据量:

RNA Seq:百迈客Illunima Hiseq 4000 platform

技术路线

研究结果

1.测序质量及组装结果

11个样本的Q30碱基百分比为95.59∼96.09%,平均值为95.77%,11个样本总测序数据量为65G,其中clean reads为17,794,601∼21,522,897,平均值为19,655,227,合并组装出来98,180 条unigenes,N50为1240 bp。

2.功能注释结果

82.18%的unigenes可以被注释到Nr 、GO 、COGs、Swiss-Prot 、KEGG等数据库中。所有unigenes总共注释到138个KEGG代谢通路,其中这些途径中,ko00966为芥子油苷生物合成途径。注释到该通路的叶柄(Pe)、根(Ro)和抽薹干皮组织(BSS)中 unigenes占最多,分别为169(0.62%)、147(0.54%)和143年(0.53%)。幼茎(YB)组织中 unigenes注释到该通路最少,这些结果表明芥子油苷生物合成基因可能主要在Pe、Ro和BSS组织中表达。通路ko00942(花青素生物合成通路),相比根(Ro)与茎组织(YB和MB),叶组织中(YL、ML和SL)包含更多的该类基因。通路ko00941可能参与类黄酮生物合成途径,相比YL、ML、YB和MB组织,CS、Ro和SL组织有更多基因注释到该通路,表明类黄酮可能主要在一些成熟或较老组织中合成。

3.不同组织的Unigene表达分布

从98180 条unigenes在不同组织的表达情况看,共有19906个条unigenes被证明是在某个组中的特异表达,占所有unigenes百分比为20.28%(图1)。31657条 unigenes(占比32.24%)在所有1 l组织中都表达。46617条 unigenes在2 - 10个组织中表达,所占百分比为47.48%(图1)。并且发现这些特异性表达的基因数量在花蕾(FB)和根(Ro)组织中要远大于在其他组织中。在组织PE和BS表达基因数量最多(2264个基因);组织Ro和CS有873个基因表达,而ML和Yb只有17个特异表达的基因。

图1.不同组织中 Unigene 数量及百分比

样本的相关性分析中,11个样本聚类成两类:组一(YL、SL、LV、ML、Pe、和BSS组织) ,组二(FB、YB、MB、CS和Ro组织)。组一进一步分为两组:YL、SL、LV和ML聚集在一个进化枝,Pe和BSS聚集在另一个进化枝。正如预期, ML和SL非常相似。然而,相比ML和SL组织,YL与LV的关系更近,表明YL的生物过程不同于ML和SL。正如预期,YB 和MB高度相似,FB自己在一个分支上。

图2.相关性热图

4.聚类分析

k-均值方法和层次聚类,将所有Unigene分成48个cluster(图3a)。总体看,不同组织中的基因表达峰不同。例如,花蕾组织具有最高的数量的表达高峰。推测该组织可能有最复杂的特殊生物学过程;叶脉和成熟叶在所有cluster中只有一个表达峰(图3a)。正如预期的那样,YL、ML,和SL聚类在一起并且具有相似的基因表达模式变化,而YB和MB,CS和RO分别聚在一起。这些结果与基因表达数据的结果(图2)及植物生长发育规律相符合。例如,所有的叶组织(YL、ML,和SL)聚集在一起,茎组织(Yb和MB)聚在一起,这表明获得的表达数据准确性。

图3.聚类热图

5.WGCNA分析

所有基因聚成34个不同的模块:其中1383个基因在MEturquoise模块的花芽组织中高度特异性积累,表明这一组基因可能参与花蕾或花药发育过程;1331个基因参MEdarkseagrean3模块,在幼茎和中间抽薹茎积累,这表明这些基因可能是参与的茎杆发育过程。2968个基因参与在MElightpink模块,且高度特异性地在幼嫩,成熟和衰老的叶组织中高表达,这表明这组基因可能参与了叶片衰老过程。WGCNA的结果和层次聚类的结果相一致,即所有的叶组织(YL、ML,和SL)聚集在一起,茎组织(Yb和MB)聚在一起。

图4.WGCNA分析

6.关于芥子油苷代谢及其调控机制相关基因分析

图5.芥子油苷合成和调控相关基因通路图

已知的在拟南芥中有42个基因参与芥子油苷生物合成过程,在芥蓝数据中找到106 个同源基因。在拟南芥中已知的有6个基因参与芥子油苷合成辅因子生物合成过程,本文有27条 unigenes与这6个基因同源(图5)。在拟南芥中与芥子油苷代谢相关的每一个基因在芥蓝数据中可以找到0-7条同源基因,平均是3个同源基因。此外,46 条unigenes被鉴定为与13个编码芥子酶基因同源(图5)。拟南芥的芥子酶基因在芥蓝中有1-7个同源基因,平均可以找到3个同源基因。此外,拟南芥中12个转录因子调节芥子油苷生物合成基因,在芥蓝中总共有32 个同源基因,平均为2.6 个因子。值得注意的是,除了MYB76,拟南芥中每个转录因子在芥蓝中1∼4 相关基因(图5)。已知芥子油苷的基因在 b . Rapa存在多重拷贝是因为其染色体的三倍体化造成的,该结果也证实了之前的研究。

图6.芥子油苷合成、调节相关基因在不同组织中聚类热图(图A.芥子油苷合成基因;图B.芥子油苷合成基因分解基因;图C.芥子油苷转录因子;图D.芥子油苷分解基因)

选取芥子油苷136个合成基因和42个分解基因绘制聚类热图。有趣的是,大量芥子油苷生物合成基因,包括CYP83A1 MAM1/2/3,GSL-OH,CYP81F3/4等等,在根组织中有很高的表达水平。还有许多基因,包括CYP79B2/3 IGMT1/2、CYP81F1/2/3 FMOGS-OX5,AAO4-2,GSTF9/10,Sta等等,在SL组织中高度表达。另外一组基因,包括APK1/2 CYP83A1,UGT74B / C1、BCAT3/4,AOP2/3,GSTF9/11,FMOGS-OX1,GSH1,LeuC / D1,IPMDH1,CYP79F1,SUR1等等,在Pe组织中高度表达。然而,只有少数芥子油苷生物合成基因在其他组织中高度表达,包括茎叶(图6)。这表明,芥子油苷生物合成发生在Ro、Pe、SL组织比其他组织中更强烈。

26个芥子油苷分解基因在根表达水平很高,如NIT1 PEN3,PYK10,NP1、NSP2,TGG1,TGG2,TGG4,TGG5等等(图6 d)。6个基因( MVP1、NSP2 ESM1)聚集在另一个分支上,即在BS组织中高水平表达(图6 d)。4个基因(GG1 PYK10、TGG2 PEN2T) 在FB组织中高度表达,推测类似的芥子油苷生物合成,芥子油苷分解作用也可能更多的发生在根组织中。与基因在芥子油苷生物合成和分解作用不同的是,基因在芥子油苷转录因子的表达模式是复杂且无序的,大多数与同一个转录因子相关的基因有相似的表达模式,如MYC2, IQD1, MYB29, MYB51等等。但是有些即使是与与同一个转录因子相关的基因却有不同的表达模式,例如 MYB34, MYB28,Dof1.1等。

有趣的是有3个unigene注释成MYC2,3,和4,并且具有相似的表达模式。这3个unigene与拟南芥中MYC2,3,和4具有很高的同源性,说明可能具有相同的基因功能。

7.qRT-PCR验证

图7.Q-PCR结果图

作者选取了10条与芥子油苷合成相关基因进行qRT-PCR验证,这10个基因的表达趋势与RNA-seq结果很一致。这10个基因在不同组织中具有相似的表达模式,尤其是在Ro, Pe和 LV组织中高表达。这是因为所有这些基因可能参与了同样的芥子油苷生物合成的过程。

文章小结

1、芥蓝富含芥子油苷,而芥子油苷临床证明具有抗癌的作用。本文首次全面进行了芥蓝转录组分析;

2、通过分析芥子油苷合成基因的WGCNA分析,发现根、叶柄和衰老的叶子可能是芥子油苷合成发生的主要组织;

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
不做实验,2 个月发表一篇 3 分 SCI,是什么套路?
科研| 厦门大学:在常绿阔叶林中,林下施氮和冠层施氮在不同程度上影响了九节木的碳氮代谢(国人佳作)
科研 | Chemosphere:不同镉胁迫下甜菜夜娥卵巢的转录组分析(国人作品)
龙脷叶转录组分析及黄酮类生物合成相关基因的挖掘
【BMC Plant Biol】MYB转录因子基因HtMYB2调控菊芋花青素生物合成
一文学会WGCNA分析
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服