打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
科研 | Plant Cell:玉米中的元基因调控网络突出了功能相关的调控相互作用


编译:Nicole,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读

基因表达的调控是生物学过程的核心部分。基因调控网络(GRNs)将转录因子(TFs)与其靶基因连接起来,代表了潜在的转录调控图谱。本研究对包括6000RNA-Seq样本在内的大量公开的玉米转录组数据进行分析,生成了45个基于共表达的GRN,这些GRN代表了不同样本群体(跨组织、基因型等)中TFs与其他基因之间潜在的调控关系。基于对共表达GRNs在自然变异数据集中准确预测TF与靶基因关系能力的研究,本研究发现TF的存在/缺失(而不是数量变化)与靶基因变化更相关。整合TF靶点预测和先前eQTL定位结果,得到了68TFs74个先前确定的跨多种代谢途径的eQTL热点的基础。这项研究强调了在一个物种内开发多个GRN用于检测重要植物途径的假定调节因子和为育种等应用提供潜在目标的实用性。

论文ID

原名: Meta Gene Regulatory Networks in Maize Highlight Functionally Relevant Regulatory Interactions

译名: 玉米中的元基因调控网络突出了功能相关的调控相互作用

期刊: Plant Cell

IF: 8.631(1区)

发表时间:2020.3.17

通讯作者: Nathan M. Springer

通讯作者单位: 美国明尼苏达大学

DOI号: 10.1105/tpc.20.00080

实验设计

PlantTFDB获得玉米TF数据。使用RNA-Seq数据包括8个使用相同基因型的不同组织/发育阶段建立的发育网络(B735个独立数据集,Mo171个独立数据集和B73×Mo171个独立数据集,以及1个包含247个不同组织或B73的不同阶段的综合数据集)、28个多个近交系、5个组织基因型以、4个重组近交系(B73×Mo17B73×H99,玉米×teosinteMAGIC RIL)。还比较了之前研究中的2基于玉米发育网络共表达的GRN以及4个组织特异性网络(叶、根、茎尖分生组织和种子)。这些数据集均与B73v4基因组对齐并使用一致的方法进行了标准化。

使用6TF突变的RNA-SeqChIP-Seq数据的分析来评估GRN的有效性。利用GRN包含注释为相同GO类别的基因或同一代谢途径的基因来验证其有效性。最后利用拟南芥的转录调控验证本结果的有效性。我们从拟南芥转录调控图谱(ATRM)中获得了1431个拟南芥中的高可信度TF-靶标相互作用,将靶标映射到玉米中它们差异最小的同源物。

评估基于基因表达的自然变异,用于支持基于共表达的GRN预测关联的频率。选择了4项已发表的转录组学研究,其中包括B73幼苗叶片组织、在寒冷和高温条件下的其他五种基因型之间的转录组差异、在干旱条件下B73Mo17根组织之间的转录组差异以及在标准生长条件下在B73Mo17的五个组织之间以及23个配对组织的组织图谱。

为了验证trans-eQTL与转录因子的关系,使用已经发表的eQTL研究:105B73×Mo17重组自交系、368个近交系以及623株玉米W22×teosinte重组自交系。这些研究分别确定了96个,518个和125个重要的跨eQTL热点。本研究根据每个基于共表达的GRN做出的TF-target预测,检测与每个热点相关的靶基因是否倾向于受共同的TF调节。

结果

玉米GRNs的构建

使用玉米公开数据集创建基于TF及其靶基因的表达模式的GRN。针对25个不同的玉米RNA-Seq数据构建了45GRN(以玉米B73v4基因组对照),(图1)。还比较了2基于玉米发育网络共表达的GRN以及4个组织特异性网络(叶、根、茎尖分生组织和种子)。对以上数据构建监管网络,用于研究网络以及使用更全面数据集的网络的可行性。

1. 研究使用的数据集和GRNB73的不同组织(蓝色)、不同的基因型(红色)、多种组织和基因型的组合(绿色)和重组近交系(紫色)的GRN

使用TF基因敲除和功能注释评估玉米GRNs

首先使用6个玉米转录因子突变的RNA-Seq(图2中的行)和ChIP-Seq(图2A的列)的数据来评估GRN的有效性

6TF中的4个至少有1个网络显着富集确定的直接靶标(图2A)。值得注意的是,TF表现出不富集靶标的可变表达的例子相对较少(图2A中的黄色的点),而不显着富集通常反映出表达不足或表达水平可变。例如,Opaque2O2-Zm00001d018971TF基因仅在胚乳组织中表达,因此在仅使用营养组织构建的GRN中未检测到O2相互作用。尽管这些直接靶点是通过将ChIP-Seq结合证据与RNA-Seq数据叠加在一起来确定TF突变体和野生型之间差异表达的基因而确定的,但基于共表达的GRN预测的TF-靶点相互作用可能包括直接和间接的调控关系。

具有至少两个生物学重复的突变体和野生型的17个玉米TFRNA-Seq数据进行分析。对于大多数TF17个中的14个),至少有一个基于共表达的GRN真的靶标基因比非靶具有更高的相互作用权重(图2B)。发育网络倾向于捕获许多TF的调节关系,而组织特异性网络通常更适合预测特定于相应组织的TF。例如,组合的发育网络可以准确预测几种玉米TF的目标,包括穗表达的fea4Zm00001d037317)、果皮表达的ufo1Zm00001d000009)以及胚乳表达的bZIP22Zm00001d021191)、O2nkdZm00001d002654)。同样,Hirsch2014幼苗网络仅在分生组织表达的KN1中显示富集(图2B)。

其次是利用GRN包含注释为相同GO类别的基因或同一代谢途径的基因来验证其有效性。针对每个网络中的每个GO/CornCyc类别评估了富集度(图3)。对每个网络进行了共享GO项或代谢途径的富集分析。在所有情况下,交互作用评分更高的富集度都更大(图3A)。且共享注释的丰富程度通常与样本数量有关,其中组合的集合表现出最大的丰富度(图2B)。结果表明, GRN中有许多捕获的信息可以预测受特定TF调节的途径或生物学功能。

最后利用拟南芥的转录调控验证本结果的有效性。从拟南芥转录调控图谱(ATRM)中获得了1,431个拟南芥中的高可信度TF-靶标相互作用。其中,可以将285TF-靶标相互作用定位到同源玉米基因,并将靶标映射到玉米中差异最小的同源蛋白。结果显示存在75个(26.5%)TF-靶标相互作用,代表了至少1/45GRN,这比概论预期高5.8倍(图4)。例如包括HY5(伸长的下胚轴5-AT5G11260)转录因子介导的途径(图3C)和脱落酸信号传导途径(图3B)。在这两种情况下,在不同的GRN中检测到TF-靶标相互作用都存在很大差异(图4B-C)。

综上所述,对注释和之前研究的TF-靶标相互作用的分析表明,为玉米构建的基于共表达的GRN丰富了功能相互作用,且本研究产生的新网络具有相同或更好的作用。这些分析还表明,就有效捕获哪种类型的注释或哪些TF而言,网络之间存在很大的差异。 

2.实验得出的TF靶标和敲除突变RNA-Seq支持了GRNs预测的TF-靶标相互作用。(A)源自ChIP-Seq和突变RNA-Seq的已发表TF研究的直接靶标; B)对于可获得基因敲除突变体RNA-Seq数据的17个玉米TF,使用DESeq2鉴定了突变型和野生型之间的差异表达基因(p<0.01)。然后使用一组靶标目标(DEG)与非目标(non-DEG)之间的预测交互得分进行Wilcox等级测试。Y轴对应于图1中列出的不同网络。X轴(例如,“ KN1_ear272“ KN1_ear [1576] [7.0]”)代表每个TF的通用名称及直接靶标的数量(图A)或TF突变体中差异表达基因的数量和比例(图B)。

3.网络中相同注释的GO/CornCyc术语的丰富度。(A)显示了4个选定网络的GO / CornCyc富集。(B)热图显示了GRN中第一个bin(即顶部100k)中带有共同注释的GO / CornCyc术语的富集。总共使用了6GO注释,但这里仅显示了3个:GO_HC(从玉米AGP_v3注释中转移过来的高质量手工术语),GO_arabidopsisGO_uniprot.plants

4. GRN预测显示来自拟南芥转录调控相互作用。(A)置换分析显示,与具有GRN支持的实际转录调控(拟南芥)相比,45GRN中的至少1个支持随机TF-靶相互作用的数量(直方图)(红色虚线)。(B)拟南芥脱落酸(ABA)途径显示12/20个支持GRN数据。(C)拟南芥11HY5(伸长的下胚轴5)靶标中有6个在至少1GRN中存在。(B)和(C)中网络的字母表示数据支持的特定GRN

GRN比较

进一步比较来自不同网络的信息,以评估相似性和差异性,并确定构建的网络是否具有优势。

为了突出使用多个GRN的潜在价值,选择了几个例子,其中TF与同一途径内的多个靶基因相连,以评估不同的基于共表达的GRN中的信息含量(图5)。在玉米中已知的花青素的生物合成途径(图5A),在多个GRN中鉴定出已知的两个调节花青素生物合成途径中结构基因的TF(图5B)。在玉米中已知的DIMBOA的生物合成途径可能调节的潜在TF的信息很少(图5C),本研究鉴定了4个与多个DIMBOA生物合成基因相关的TF(图5D)。在叶绿素生物合成途径中1TF被认为可能调控15个基因(图5E-F)。这些途径提供了从多个网络收集信息以揭示TF与代谢途径之间潜在联系的相对价值的例子。、

5.不同的基于共表达的GRN鉴定经典和CornCyc代谢途径。(A-B)由R1Zm00001d026147)和PL1Zm00001d037118)调节的花色苷生物合成途径(A)。(C-DDIMBOA生物合成途径(C)和4个潜在的调控元件(D):G2Zm00001d039260)、D8Zm00001d033680)、NACTF21Zm00001d036050)和MYB112Zm00001d046632)。(E-F)可能受HB26Zm00001d008612)(F)调节的叶绿素生物合成途径(E)。(G)在图(B)(D)和(F)中使用基因。

基于玉米间差异基因表达的玉米GRN评估基因型

试图评估基于基因表达的自然变异,基于玉米配对基因型的比较,用于支持基于共表达的GRN预测关联的频率。选择了4项已发表的转录组学研究,获得了总共42个配对组织/处理样品的数据,并确定DEG。从理论上讲,如果TF在两种基因型之间表现出差异表达(DE),该TF的靶标(如基于共表达的GRNs所预测的)也将出现在相同的组织/处理处理中。将每个TF分为不同的DE类别(非DEDE 1-2倍、DE 2-4倍、DE4 +倍和单亲表达(SPE))并评估TF的靶基因表现出的DE(图6)。结果表明,对于在两种测试基因型之间不显示DE或仅显示微小变化(1-2倍)的TF,其预测的靶标显示很少或没有DE(图6蓝线)。但是,当TF在两种基因型之间表现出高水平的DE(例如DE4 +)或SPE时,其预测的靶基因表现出DE水平的可能性显着增加(图6红色和紫色线)。此外,如功能注释富集所观察到的那样,TF-靶标相互作用得分对配对基因型数据集中的验证率有很大影响。在SPE组中,预测的前10TF靶标显示出更高比例的DE60-80%)(图6)。这些观察结果表明1TF基因表达的存在/不存在(即SPE)而不是其表达量变化(即DE1-2DE2-4)更可能导致靶基因表达水平的改变;2)只有最高的网络预测具有最高的互动得分,才具有成对的基因型数据集的高预测能力。因此,仅利用每个网络中排名前10TF-靶标的相互作用),并专注于显示SPE模式的TF组,以比较每个配对基因型数据集中不同网络的验证性能。

6.3个选定的自然突变数据集中对网络进行TF-靶标验证。每个小图显示了由TF调节的差异表达靶标的比例,TF在一种组织/处理条件下显示了两种基因型之间不同的DE水平。每个TF目标对根据每个网络中TFDE级别(DE”“ DE1-2”“ DE2-4”“ DE4 +”“ SPE”)进行分类。

当基于成对的基因型数据集比较不同GRN的支持水平时,会出现几种模式。除了包含247个不同组织/阶段的组合图集数据集(图7,蓝色的网络)之外,在单个基因型内构建的发育网络通常在预测DE方面的能力较低。尽管仅使用参考B73基因型构建,但组合的组织网络在几乎所有成对的基因型数据集中均显示出显着的预测能力(图7)。使用配对的B73Mo17发育图谱网络(图7中的组织图谱组合)观察到了富集程度最大,可能是因为这两者之间的差异在用于生成GRN的信息中包括了两种基因型。实际上,只要在验证数据集中比较的基因型包括其他基因型(例如Oh43PH207),此B73-Mo17配对发育网络就显示较差的预测能力(图7)。对于四个RIL(重组自交系)网络也是如此(图7)。

单组织网络通常显示出较低的预测能力。令人惊讶的是,最大的网络(Kremling2018和子网络)在调查的配对基因型数据集中没有显示任何预测能力。这可能是由于文库创建方法不同,测序深度相对较低(平均3-5x)或B73 -Mo17变异在大基因型组合中被稀释的原因(图7)。

7.TF调节的差异表达靶标的富集,显示了SPE模式。每个单元格中的颜色和数字表示DE靶相对于全基因组DEG的比例的富集P值。

带有Trans-eQTL热点的401重叠

之前3个研究中分别确定了96个、518个和125个重要的跨eQTL热点,每个热点都调节多个靶基因的表达水平。首先根据每个基于共表达的GRN做出的TF-靶标预测,检测每个热点相关的靶基因是否倾向于受到一个共同的TF调节。在15个网络中的至少2个中,总共鉴定出372TF与至少一个trans-eQTL热点具有显着的共调节作用。当将这些TF的物理位置与相应的trans-eQTL热点位置相对应时,发现经常出现共定位。这表明许多TF属于先前的trans-eQTL热点,并且被多个GRN预测来调节同一组靶基因。发现有68TF74个先前确定的trans-eQTL热点(同一条染色体上50 Mbp内)共定位,每个热点在其GRN预测的靶标和eQTL靶标之间均显示出明显的重叠(图8A)。换句话说,GRN的预测导致确定了74trans-eQTL热点的候选调控TF

验证得到的68TF既有经过充分验证的TF,也有许多功能未知的TF。其中包括colored1基因(R1Zm00001d026147),调节花色苷的生物合成途径(图8B)。之前研究发现10号染色体上一个trans-eQTL热点,调节类黄酮生物合成途径中8个基因的表达水平,并表明bHLH家族转录因子基因R1是潜在的调控因子。至少有3个独立的GRN预测R1调控的靶基因不仅在类黄酮和花色素苷生物合成途径中而且在先前确定的trans-eQTL热点中均显着富集(图8B)。共有的靶标是anthocyaninless2a2Zm00001d014914),bronze1bz1Zm00001d045055)和bronze2bz2Zm00001d052492)(图8B)。

发现许多转录因子参与光合作用相关的途径。其中一个C2C2-CO-like转录因子11COL11 – Zm0001d003162),与trans-eQTL热点(hs014Li2013)共调节一组相似的靶标(图8C)。尽管没有直接证据表明COL11在该途径中起作用,但拟南芥直系同源基因(AtCOL3-AT2G24790)被注释为光形态发生/花朵发育的正向调控因。

另一个未被研究的转录因子(myc转录因子7MYC7 – Zm0001d030028)可能调节许多与trans-eQTL热点相同的靶基因(图8D)。包括2个脂氧合酶基因(TS1LOX8LOX10)和3个丙二烯氧化合酶基因(AOS1-4),均参与了茉莉酸(JA)的生物合成途径(图8D)。拟南芥直系同源基因ATMYC2-AT1G32640是受到脱水胁迫和脱落酸处理诱导的,并调节多种JA依赖性功能。因此,本研究中构建的GRN提供了一种强大而有效的方法,用于表征trans-eQTL热点背后的真正的调控因子,以发现真正的TF-靶标关联。

8.在之前研究中确定的trans-eQTL热点关联的转录因子的鉴定。(AGRN预测的TF与以前的研究中确定的跨eQTL热点共定位。每个点代表1TF,至少由2个高质量网络支持,且与至少1个反式QTL热点的显着协同调节,并且距trans-eQTL热点位置50 Mbp之内。(B-D)鉴定R1COL11MYC7,与先前鉴定的trans-eQTL热点共定位并分别调控玉米花色苷生物合成途径、光合作用光反应途径和茉莉酸生物合成途径。 

讨论

通过一致地分析大量玉米RNA-Seq数据集,本研究产生了许多不同的基于共表达的GRN,不同的网络表征了不同的TF-靶标关联(图1)并显示出不同的过程和功能性(图24)。对于大多数情况下,多个网络的性能要优于单个组织特定的网络(图235)。但是,对于某些具有组织特异性表达模式的TF(图2KN1O2),组织特异的转录将在多个样本的网络中被稀释,导致信号减弱。因此,应采用哪种类型的网络取决于分析的目标。

虽然这些共表达网络包含有用的信息,但也很容易出现假阳性预测,尤其是在样本量较小的情况下。通过根据网络预测的交互作用得分对网络预测进行分类,发现得分最高的预测结果始终显示出比其余预测更好的性能(图25)。对于控制假阳性,最理想的选择是前100,000个预测。

通过检查共表达的GRN预测得到的同样变化的TF靶标,发现TF的存在/不存在表达变化(质变)很有可能导致靶基因的显着表达变化(图6)。而TF表达的定量变化不太可能与靶标变化相关。但是,TF组织特异性表达模式的改变可能导致特定组织中靶基因表达的变化。

在自然变异的背景下识别潜在的TF-靶标关联(图7)。从理论上讲,网络构建的基因型越多,网络捕获的表达变异范围就越广。但是,随着小组规模的不断扩大,稀有等位基因的基因型特异性信号可能会在如此大的基因型网络中被稀释。另一方面,尽管仅使用B73样本构建的综合发展网络在几乎所有验证数据集中均具有惊人的准确性,这表明发展协变是TF等位基因变异的良好预测指标,将影响基因型中的GRN。但是,应该注意的是,当构成发育网络的基因型(即B73)缺少其他系中存在的功能性TF时,将不会预测该TFGRN

TF与潜在途径联系起来,鉴定了许多调节代谢途径中多个结构基因的TF。对跨QTL热点的分析确定了68TF与先前确定的74个跨eQTL热点的关联性。这突显了大量基于共表达的GRNTF可能是跨eQTL热点的基础。

评论

将基因型与表型联系起来是为了了解转录因子如何调控不同类型和环境条件下动态基因表达的变化。基于共表达的基因调控网络(GRN)是一种用于鉴定具有重要生物学功能或基因特定途径的有效工具,但目前对于如何在大规模转录组数据集中开发GRNS的研究仍然存在问题。本研究使用各种公共RNA-Seq数据集构建转录因子调控网络。得到的共表达GRN极大地扩展了以前有关玉米基因调控研究的广度和深度。新建的GRN对靶标转录水平方面的预测具有较高的能力。这些转录因子网络为准确、有效地操纵有价值的性状和途径提供了极好的数据支持,创建的网站maizeGRN可以用于研究TF-靶标交互作用。


更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Plant Cell | 植物中基因调控网络的预测
Nat. Comput. Sci. | 深度学习建模基因调控网络
基于基因调控网络的单细胞转录组解析三阴性乳腺癌的瘤内异质性
GRNdb:单细胞水平的基因调控网络数据库
文献解析之通过干扰泛癌细胞中的微小RNA介导转录因子和靶基因
siRNA、shRNA和miRNA,还在傻傻分不清?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服