打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
原创解读 | PC:面包小麦的起源与演化(中)

2022年5月4日,The Plnat Cell 在线发表了题为 “Evolution and origin of bread wheat” 的综述系统地介绍了面包小麦的起源及演化历程。上期我们了解了六倍体面包小麦的起源,这期小编将带大家领学异源六倍体小麦演化的故事。

小麦的物种形成

异源多倍体化在植物物种的形成和进化过程中起着重要的作用,面包小麦即通过多倍化进化而来。异源多倍体化构建了一种激进和快速的物种形成模式,其通过不同物种的种间或属间杂交,再经历 F1 杂种的染色体加倍,即可产生一个新的物种。关于多倍体的适应性目前还存在很多争论,最近一项利用数万个物种进行meta分析的研究表明,影响多倍体适应性的因素诸多,其相对二倍体在干旱和低温气候条件下具有更强的竞争力。多倍体的这种强于二倍体近缘属的适应能力可以通过多种机制实现,包括新的基因组间的互作、基因表达的重新布局、新的剂量效应、新的蛋白质复合物和杂种优势固定。驯化是在植物进化过程中靠后发生的事件,其似乎有利于小麦和其它几种作物的异源多倍体化,这可能是因为异源多倍体可以快速的适应新的栽培环境所致。二倍体单粒小麦的种植规模小于四倍体硬粒小麦,而四倍体硬粒小麦仅占六倍体面包小麦面积和产量的 10%。

所有二倍体草种都被认为是经历了至少一次全基因组复制事件的古多倍体,在进化尺度上,多倍化发生在细胞学和遗传学二倍体化之后。遗传学上的二倍体化最早由 Ohno 于1970年提出,其可使异源多倍体中的冗余或不平衡的基因系统趋向于二倍体-like的表达模式。这可通过多种机制来实现,比如基因突变、消除、假基因化或基因剂量补偿等。同样,细胞学上的二倍体化对于新异源多倍体物种生育能力的获得至关重要,其可为亚基因组间新的有益的相互作用提供稳定的遗传。

核型进

前人研究表明,祖先的Triticeae核型被认为是来自 n = 12 的祖先草类核型,如在水稻中看到的那样。比较遗传学研究表明,在不丢失基因的情况下,从 n = 12 减少到 n = 7,是通过四个着丝粒祖先染色体融合、一个裂变和两个端粒祖先染色体融合来实现的。小麦科基本染色体数目 n = 7 是通过 5 个功能性着丝粒的缺失进化而来的,其中 4 个对应于水稻染色体 Os4、Os5、Os6 和 Os9,第 5 个对应于 Os3 或 Os11。

普通小麦的基因组在 A 亚基因组上的 A4 和 A5 之间以及 4A 和 7B 之间存在易位,形成了现在的 21 条染色体。小麦中最突出的大规模核型变异之一是染色体 5B 和 7B 之间的易位,在 Walkowiak 等人测试的大多数品系中均可见这种易位。序列数据显示,染色体 5B 和 7B 之间的易位长度分别约 737 和 762 Mb,导致易位的染色体长度分别为 488 Mb(5BS/7BS)和 993 Mb(7BL/5BL)。ArinaLrFor 和 SY Mattis 的易位断点被映射到了一个~5-kb GAA 微卫星上。

现在的面包小麦除了发生一系列的染色体重排外,其着丝粒或核仁组织等功能单位也在小麦的异源多倍体下迅速进化。小麦科的着丝粒与其它植物一样,由 CENH3 蛋白与卫星重复序列和逆转录元件的组装形成。
在小麦中,使用 CENH3 抗体进行的染色质免疫沉淀测序(ChIP-seq),能够识别小麦着丝粒的独特动态结构,这一结构可能是由于通过频繁的杂交和多倍化进化而来。与携带 150-180 bp 串联重复卫星的典型植物着丝粒不同,小麦 CENH3 核小体与两种不同类型的重复序列相关,这两种序列比其它着丝粒重复大得多,长度分别为 550 和 566 bp 。此外,不同的亚基因组往往包含不同的重复类型,其中一些染色体完全不包含卫星重复。系统发育分析表明,二倍体中的重复信号强于多倍体,并且着丝粒结构在多倍体水平上进化迅速。
核仁形成的核仁组织区 (NORs) 被视为染色体上的次级收缩区。NORs 包含编码核糖体 RNA (rRNA) 的核糖体 (rDNA) 基因,并且每个NOR组织在数千个串联排列拷贝的基因阵列中。中国春中的rDNA单元总数约有 11,160 个拷贝,对应于 100 Mb,其中 30.5% 在 Nor-B1 基因座上(Chr. 1B),60.9% 在 Nor-B2 上(Chr. 6B),8.6% 在其它 NORs 上。在杂交种和多倍体中,一个亲本组的 rDNA 基因被转录,而从另一亲本遗传的大多数或所有 rDNA 基因则保持沉默,这种现象被称为核仁优势,这一现象在 Aegilops 和 Triticum 属的异源多倍体物种中很常见。小麦的二倍体物种 Triticum monococcum T. urartu 包含两个核仁组织区,一个在染色体臂 1AS 上,另一个在染色体臂 5AS 上。在异源多倍体小麦品种中,1AS 的 NOR 不活跃,而 5AS 的 NOR 丢失了。新合成的异源多倍体在其 rRNA 编码基因中表现出与天然异源多倍体相似的遗传和表观遗传变化,表明这些变化是快速且可重复的,并且是在异源多倍体形成的早期产生的。Guo 和 Han (2014) 对包括合成和天然 BBAADD 基因组在内的几种异源多倍体小麦中的 NOR 进行了详细的分析,他们得出的结论是,来自 B 亚基因组的 NOR 在几种基因组组合中占主导地位,并且其它 NOR 的消除分两个步骤进行——首先通过第一代的沉默和高甲基化,然后逐步消除非 B rDNA 拷贝;从第四代开始,到多倍化后的第七代结束。

基因及其顺序的进化

异源多倍体涉及遗传冗余,即使在数百万年前不同亚基因组彼此歧化的异源六倍体中也是如此。Ernie Sears 在一项里程碑式的研究中证明了这一点,其证明了一个亚基因组的 7 对染色体中的每一对都可以弥补另一个亚基因组中一对特定染色体的缺失。补偿对被称为同源(具有部分同源性),因此,小麦基因组可以分为 7 个同源组和 3 个亚基因组。从进化的角度来看,这项研究还表明,尽管它们存在歧化,但亚基因组保持了相对高的相似性。

在分子水平上的研究揭示了面包小麦同源染色体中的高水平基因同线性和共线性。六倍体小麦亚基因组之间的差异/相似性的性质只有在面包小麦中国春的高质量注释序列公布后才能完全被理解,Ernie Sears 在分析小麦染色体同源性时也是用中国春。中国春基因的注释确定了 107,891 个“高置信度”基因,它们几乎均匀分布在 A、B 和 D 亚基因组之间。同线性在三个亚基因组中高度保守。与亚端粒区域或中心区域相比,间质区域的同线性更为突出,具有更大的同线性块。如 Akhunov 等人所示,亚端粒区域中较高的基因复制和缺失率是同线性减少的部分原因。只有 55% 的基因在所有三个亚基因组中都具有同线性同源物,而 15% 的基因至少有一个缺失的同源物但有旁系同源物。每个亚基因组中缺失同源物(基因丢失)的百分比相似(~10%)。

通过对单个小麦 BAC 克隆和 BAC 克隆重叠群的测序分析表明,基因聚集成许多由 3-4 个基因组成的小岛,其中散布着逆转录元件。普通小麦 3B 染色体远端区域的基因密度高于基因组其它区域,这是因为这些区域中重复基因的发生率较高。例如,在Ae. tauschii 和面包小麦 D 亚基因组中,只有 87.4% 的基因存在于预期的直系同源位置,这体现出了与全基因组重复无关的动态基因拷贝数变异。一些基因家族,如醇溶蛋白基因(包括麦谷蛋白和麦醇溶蛋白)和抗病基因是最容易与其它草类非直系同源的基因家族。

在面包小麦中,基因家族扩增通常发生在亚基因组的野生祖先或共同祖先中:在 8,592 个扩增的家族中,6,216 个家族在所有 3 个 A、B 和 D 亚基因组中扩增,而 1,109 个家族仅在一个亚基因组中扩增,并且只有 78 个基因家族收缩。有趣的是,亚基因组扩增的家族之间存在显着的功能差异:A 亚基因组中过度表达种子相关基因(胚胎和胚乳), B 亚基因组中过度表达营养生长和发育相关基因。在所有 3 个基因组中扩增的家族都富含被认为在小麦育种中发挥重要作用的基因,这些基因与产量或抗生物和非生物逆境有关。

Walkowiak(2020)等人分析了不同面包小麦品系的基因组序列,发现同源染色体上的基因顺序高度共线性,且基因组大小整体相近。然而,~12% 的基因在不同品种之间表现出“存在/不存在变异”。多倍体背景中的缺失可能比二倍体背景中的缺失快 10 倍。另一方面,重复丰富的基因间区环境可以将基因复制加速 20 倍。实际上,重复,通常是转座子(TE),可以通过不等/异位交叉、基因侧翼螺旋子或捕获移动结构中的基因来促进基因复制。这种动态的基因拷贝数变异可能是通过全基因组复制的缓冲效应来实现的,从而能够随着时间的推移耐受住广泛的遗传变化。

导致遗传和细胞学二倍体化的快速遗传和基因组变化

杂交种或异源多倍体的基因组融合对新生物种产生了细胞学和遗传学的挑战。例如,同源配对可能导致部分不育和多体遗传,不同亚基因组的调控元件之间的基因组冲突可能导致杂交坏死,基因表达的重新布局也可能会降低新生物种的适应性。据推测,无法迅速克服这些挑战的新异源多倍体物种将无法在自然界中形成和生存。

在异源多倍体化后,立即触发影响基因组结构和基因表达的各种基本遗传和表观遗传变化可能对于实现遗传和细胞学二倍体化至关重要。在新形成的异源多倍体中的这些变化已见报道,包括编码和非编码 DNA 序列的消除、转座子和串联重复消除或扩增,以及基因表达修饰。值得注意的是,序列消除通常是可重现的,因为具有相同基因组组合的合成和天然异源多倍体中消除了相同的序列。在许多情况下,序列消除会在基因组中留下同源特异性序列。这种差异消除导致同源染色体的快速分化,为促进染色体同源性识别提供了物理基础,并使六倍体小麦在完全同源的染色体之间表现出亚基因组内配对的形式(二倍体-like减数分裂行为)。小麦组的异源多倍体物种的 DNA 比其亲本物种的总和少 2%–10%,合成的异源多倍体表现出类似的损失,这些证据再次表明小麦异源多倍体化后迅速发生了DNA 消除。

TEs 活性可由异源多倍体化触发,从而影响基因表达并诱导许多包括缺失或重复在内的结构重排。由于 TE 的拷贝数多,其具有区分亚基因组的最高潜力。在面包小麦中,TE 占总基因组的 80%–85%,具有 70% 的长末端重复反转录转座子 (LTR) 和 12% 的 DNA 转座子 。最近转座的的“年轻” LTR 元件往往位于染色体臂的富含基因的重组远端部分,而“老”的 LTR 元件往往在小麦品系中保守,并且位于染色体中心周围的异染色质区域。因此,最近的转座有助于促进同源配对重要区域的亚基因组差异。TE 也有可能通过转座、诱导同源重组和表观遗传重新模式化来影响基因组结构和功能。由于 TEs 的活动受表观遗传调控,它们的激活可能是由遗传和环境变化诱导的。因此,TE 可能会突变基因、改变基因调控并产生新基因,以应对环境变化,从而为进化提供'燃料'。与基因相关的 TE 可以通过其 LTR 活性影响相邻基因的转录,有趣的是,~70% 的亚基因组同源基因的表达水平是平衡的,即同源等位基因通常以相同的水平表达。而剩余 30% 的不平衡表达通常与启动子区域附近 TE 的多样性有关。小麦 TE 可以影响剪接和内含子保留。微型倒置重复转座元素(MITEs)也显示出与小麦基因的紧密联系,其靠近基因,或在转录组内。所有这些都表明 TE 是动态基因组变化和基因表达调控的驱动因素,并在建立基因组结构、基因表达和进化中发挥重要作用。然而,一些 TEs 的活动是有害的,但可以通过抑制 TE 活性的几种表观遗传基因组稳定因子得到缓解,例如胞嘧啶甲基化或小 RNA 。尽管如此,TE 在整个小麦进化过程中仍保留了一定程度的流动性,这一点从面包小麦亚基因组之间以及同一亚基因组中不同品种之间的高度多样性中可以看出,而且新合成的小麦异源六倍体中的 MITEs 也体现出了这一点。

基因渗入是小麦进化过程中增加遗传多样性的重要机制。事实上,从野生二粒小麦到驯化二粒小麦或面包小麦的过程中均存在大量的自然渗入,导致基因组的变异性更高。这是因为具有相同 BBAA 基因组的野生二粒小麦和驯化的 T. turgidum 亚种之间容易杂交。此外,从考古记录中可以看出,驯化的初始过程可能需要大约 2-3,000 年。与这些生物学和考古学数据一致,驯化二粒小麦基因组的变异包含野生二粒小麦的 73%。T. aestivum 地方品种的基因分型表明,野生或驯化四倍体小麦的很大一部分变异也已进入到面包小麦基因组的 A 和 B 亚基因组中,这表明四倍体和六倍体小麦之间只有有限的遗传屏障。二倍体 Ae. tauschii 和六倍体小麦之间很难杂交,因为产生的基因组ABDD四倍体杂交种是高度不育的,这与D亚基因组的变异性比A和B亚基因组低2-5倍的发现想一致。尽管如此,从全基因组测序来看,还是发生了一定程度的基因渗入。在非同源基因组之间发现了基因渗入,被视为单核苷酸多态性 (SNP) 的不一致区块,这些 SNP 主要来自 B 到 D 谱系,其特异存在于另一个物种中,并且不遵循物种的系统发育。然而,这些基因渗入相对罕见,并且发生在四倍体小麦形成之前。

同源及同源重组

同源染色体之间的减数分裂重组是小麦进化和育种多样性的主要引擎。如上所述,通过面包小麦和野生近缘植物的同源基因组之间的重组,A和B基因组的渗入相对频繁。Dvorak (2009)分析发现,Triticeae基因组在基因含量从近端向远端增加后,沿中心粒-单粒轴有一个陡峭的重组梯度。Saintenac 等在对面包小麦3B染色体排序的交叉模式的研究中也显示,交叉频率从中心粒到端粒逐渐增加。此外,他们还表明,高基因密度和频繁重组的小染色体片段与低基因密度和不频繁重组的相对较大的区域交错在一起。交叉在这些基因密集区域内频繁发生,其中重组程度至少比基因组平均值大 11 倍。3B染色体交叉的精细图谱显示,82%的交叉发生在19%的染色体长度上,位于携带60%-70%基因的亚染色体区域,其余约 35% 的基因位于重组较差的染色体区域,阻碍了这些区域中有害突变的消除或有益突变的渗入。重组往往发生在基因中或基因附近,通常发生在启动子区域。大多数重组事件发生在以特异基序富集的区域上,例如 CCN 或 CTT 重复序列或富含 A 的区域,并且与典型的染色质修饰相关。最近发现RecQ螺旋酶基因家族的一个新成员与六倍体小麦的高杂交频率有关。

小麦亚基因组之间以及种间或属间杂种中同源配对的最有效抑制因子是基因 Ph1, 其位于染色体臂 5BL 上,并抑制 homoeologous 配对而不影响同源染色体配对。在没有 Ph1 的情况下,面包小麦的 A、B 和 D 亚基因组的同源基因之间或六倍体小麦与野生近缘种杂交的同源染色体之间可发生配对。Ph1 基因座的大小约在 2.5 Mb,该区域仍然包含几个可能影响染色体突变和重组的候选基因:C-Ph1CDK2-like基因、甲基转移酶基因和 TaZIP4-B2。最近,TaZIP4-B2 的两个突变体,即由甲基磺酸乙酯(EMS)诱导的点突变和由 CRISPR-Cas9 诱导的缺失,产生了大量同源配对,使其成为最有可能的 Ph1 候选基因。除了Ph1,在普通小麦中至少还有另外两种同源配对抑制因子,分别命名为Ph2 Ph3,它们的效力低于Ph1。最近分离出 3DS Ph2 基因座 ,发现其编码小麦的 DNA 错配修复基因 MSH7 的同源基因 TaMSH7

同源抑制是如何进化的仍然知之甚少。它似乎存在于二倍体水平。然而,二倍体活性似乎太弱,无法解释面包小麦中所见的同源抑制。Riley (1960) 和 Sears (1976) 假设 Ph1 在异源四倍体水平上进化,与异源多倍体化过程平行或紧随其后。Ph1 的进化似乎是渐进的,随着多倍体的活性增加,二倍体 < 四倍体 < 六倍体。只有在更充分地了解 Ph1 的分子作用模式时才有可能追踪同源配对抑制的演变,但这在没有现存的 B 供体物种的情况下很难实现。

在自然界中,面包小麦品系中通过同源重组引发的基因渗入数量似乎相对较少。然而,当它发生时,同源重组事件被证明优先发生在外显子内,以产生新的杂交转录物和蛋白质,可能是因为这些区域的同源性较高所致。这与优先发生在启动子中的同源重组不同。

总结

小麦基因组中的异源多倍体使许多层面上的快速变化成为可能。异源多倍体化提供了一种快速的物种形成模式,该模式引发了重复 DNA(如着丝粒、NORs 和 TEs)的大规模变化,以及基因的消除和复制,从而导致了同源基因组的差异。然而,尽管有这些快速变化,但由于表观遗传调节和 Ph1 基因座的存在,控制了同源染色体而非 homoeologous 的优先配对,从而维持了基因组的稳定性。据推测,所有这些机制都有助于小麦基因组的快速遗传和细胞学二倍体化,确保了新生物种的遗传和生育力,消除了冗余,并保持了亚基因组之间的杂种优势互作。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
浙江大学染色体变异详解
第六章 染色体变异
高中生物知识点总结 染色体变异常考知识点
PBJ | 7种小麦(二倍体 多倍体),3个组织,7个籽粒发育阶段中可变剪切的差异分析
Molecular Ecology | 兰州大学生态创新研究院揭示青藏高原四倍体韭的复杂进化历史和灭...
高考生物知识点之染色体变异
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服