打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Genomic landscape and genetic manipulation of the black soldier fly Hermetia illucens, a natural waste recycler | Cell Research

BSF基因组的特征

许多双翅目基因组已被测序,但很少有基因组信息可用于属于 Stratiomyidae 的物种。我们对 BSF 的第 10 代近交系的基因组进行了测序,覆盖度约为 Illumina 测序数据的 300 倍,包括短插入片段的配对末端文库和长插入片段的配对文库(补充信息,表 S1, S1  ). 最终的基因组组装包含 1102 Mb 的组装支架,长度为 1.69 Mb N50(图 1和补充信息,表 S2)。使用 BUSCO 确定装配的完整性17为 99.5%,使用 CEGMA 确定18是 100%,表明 BSF 基因组的近乎完整的表示(图 1和补充信息,表 S2)。GC 含量和测序覆盖率的分析揭示了组装支架之间的正态分布(补充信息,图 S2),表明组装中几乎没有污染。

与其他双翅目物种相比,BSF 基因组 (1102 Mb) 相对较大,并且比任何短角纲(一种最近进化的双翅目)基因组(范围从 90 到 750 Mb;补充信息,表 S2)都 与基因组大小的变化可能是由于转座因子和其他重复非编码 DNA 的相对数量有关的观点一致,19,20BSF 基因组的大约三分之二是重复的,这在一定程度上解释了大尺寸(补充信息,表 S3)。我们通过结合来自六种双翅目物种的同系物信息、来自 12 个连续 BSF 发育阶段的转录组数据和三组从头基因预测(补充信息,表 S4)生成了一组官方的 16,770 个蛋白质编码 基因BSF 基因组中的基因数量与其他双翅目物种的基因数量相当(补充信息,表 S5)。平均内含子大小是我们在本研究中调查的双翅目物种中第二长的(补充信息,表 S5)。

BSF 基因组与其他双翅目昆虫的比较

我们首先将 BSF 的基因库与其他双翅目物种的基因库进行了比较。直向同源分析表明,一半的 BSF 基因对于本研究中分析的所有双翅目物种是共有的(图 2a)。使用单拷贝直向同源物推断所有检查的双翅目物种的系统发育,将 BSF 祖先置于短角双翅目亚系(短角双翅目)中(图 2a)。因此,BSF 基因组填补了 Nematocera(双翅目最早分化的亚目)和最近的果蝇之间的空白。

图 2

BSF 和平行谱系之间不同的双翅目物种和途径的关系。A十种双翅目物种的系统发育关系和指定直系同源性。基于814个单拷贝通用基因计算最大似然系统发育树。标有棕色圆圈的节点表示具有高引导程序支持的节点(100 个重复中至少有 82 个)。彩色直方图表示直系同源类别如下:“1:1:1”,单拷贝通用基因;“N:N:N”,多拷贝通用基因;“仅限Brachyera”,Brachyera物种特有的基因;“仅限线虫”,线虫物种特有的基因;“物种特异性”,在任何其他物种中没有直向同源基因;“特异性重复”,具有物种特异性重复的基因;“Patchy”,某些物种的直系同源物;“同源性”,在其他物种中检测到的同系物(E < 1e-5),但未在直系同源分析中分组。分析中使用的物种是:埃及伊蚊,黄热病蚊子;Anopheles gambiae非洲疟蚊;Belgica antarctica,南极蠓;Mayetiola destructor,麻蝇;H. illucens , BSF; Zeugodacus cucurbitae,瓜蝇;黑腹果蝇,果蝇;Glossina morsitans采采蝇;家蝇,家蝇;Lucilia cuprina,真蝇。b确定 BSF 中快速发展的途径。d N / d S比率在两个平行进化谱系中独立计算,M. domesticaD. melanogaster,使用 BSF 作为共同祖先。每个点表示相应途径中所有相关基因的中值d N / d S 比率。KEGG 通路中显着富集(FDR 调整后的P  < 0.05)、快速进化的基因以红色突出显示

我们估计了BSF 和两个平行衍生谱系家蝇(家蝇双翅目:蝇科))之间的非同义到同义替换 ( d N/ d S) 比率21和果蝇 ( Drosophila melanogaster (Diptera: Drosophilidae))。22我们在 BSF 中鉴定了 342 个具有较高d N / d S 比率的基因。这些快速进化的基因仅在一个生物模块中显着富集,即核糖体(ko03010;FDR P =  5.2 × 10−17)(补充信息,表 S67),其中的基因有助于翻译机制和蛋白质合成的核心方面。鉴于该基因家族的相对保守性,23相关的核糖体 RNA (rRNA) 基因已被探索作为细胞遗传学标记来研究一个物种的进化史。因此,BSF 中 rRNA 基因的快速进化是出乎意料的。BSF 中d N / d S 比率高于其他受检物种的 16 条途径包括四种氨基酸代谢相关途径和两种免疫相关途径(图 2b和补充信息,表 S8),这也可能有助于异常丰富的蛋白质含量和对 BSF 中高病原体负荷的强烈适应性。

BSF 基因组编码 797 个 Brachycera 特异性基因,在 Brachycera 中最少,和 1798 个物种特异性重复基因,在 Brachycera 中最多(图 2a和补充信息,表 S4)。BSF 特定的重复基因通常以低水平表达,表明最近的起源。24这些重复基因根据表达谱分为三个主要组,其高表达阶段持续与发育过程一致(补充信息,图 S3)。有趣的是,这些基因中的大多数在幼虫晚期表达(L-D8 和 L-D12;补充信息,图 S3)。鉴于 BSF 在幼虫阶段回收有机废物,这些 BSF 特异性基因复制事件可能有助于塑造 BSF 生物学的这些关键方面。

我们还根据注释的 InterPro 域对跨双翅目基因库的基因家族进行分类和比较。BSF 中扩展最多的 20 个基因家族与解毒(细胞色素 P450GSTABC)、化学感受(OR基因)、免疫系统(AMP)和一些调节模块(补充信息,表 S9 )有关总之,几行全基因组证据表明 BSF 的环境适应与快速进化的适应性功能模块之间存在联系。

基因家族的扩展与 BSF 环境相互作用有关

接下来,我们将手动注释重点放在与环境适应具有潜在关系的基因家族上(图 3)。BSF 幼虫与各种病原体密切互动。先前的研究表明,BSF 的幼虫提取物具有广谱抗菌活性。25因此,我们预计他们的免疫系统已经适应了潜在的致病微生物。这可能类似于家蝇的基因组,家蝇是另一种生活在化粪池环境中的苍蝇物种,据报道其编码免疫系统识别和效应成分的基因拷贝数高于黑腹果蝇21我们注释了 BSF 基因组中的全套免疫相关基因(补充信息,表 S10),提供了比之前仅使用转录组的研究更完整的基因组。14尽管与其他已测序的双翅目基因组相比,BSF 基因组在大多数信号转导通路(例如,IMD、Toll 和 JAK-STAT 通路)中编码的基因数量相似,但它在识别和效应分子方面都有显着扩展(图 3a) . BSF 和家蝇的基因组分别编码 31 种和 20 种分泌型肽聚糖识别蛋白 (PGRP),这些蛋白在细菌感染期间调节信号通路。26,27这些数字大大高于其他双翅目物种(13 个或更少)。BSF 中最主要的 PGRP 是 PGRP-LB(BSF 中为 20 个,其他双翅目中为 4 个或更少),它负向调节 IMD 通路,以及 PGRP-SAs(其他双翅目中为 6 个,其他双翅目中为 3 个或更少),激活 Toll 通路.26,27有趣的是,家蝇有八个编码 PGRP-SC2 蛋白的基因(双翅目中最多),而 BSF 中完全没有这些基因。识别组件的扩展也可能促进对不同病原体的反应。21其中包括革兰氏阴性结合蛋白 (GNBP),即参与 Toll 通路激活的血淋巴蛋白。我们在 BSF 基因组中鉴定了 16 个 GNBP 编码基因(图 3b),明显多于任何其他双翅目物种(第二多的是蚊子中的 7 个(双翅目:蚊科))。

图 3

与 BSF 环境适应相关的基因家族的扩展。a所示家族中与双翅目物种的环境适应相关的基因拷贝数。每个饼图的面积大小表示每个家族中的相对基因数。be 三种双翅目昆虫物种的系统发育关系,其基因家族在 BSF 中具有显着扩展:革兰氏阴性结合蛋白 ( b )、天蚕素抗菌肽 ( c )、嗅觉受体 ( d )、细胞色素 P450s ( e )。使用最大似然法估计系统发育树

BSF 基因组还编码 50 种抗菌肽 (AMP),是迄今为止在昆虫中发现的最大的 AMP 家族。BSF 中的大多数 AMP 属于天蚕素家族:我们在 BSF 特异性扩展谱系中鉴定了 36 个天蚕素编码基因(图 3c)。相比之下,尽管家蝇基因组编码的 AMP 数量相似 (33),但其中只有 12 个是天蚕素。我们还在编码溶菌酶的基因中发现了大量的基因扩增,溶菌酶是另一种普遍存在的免疫效应物,26,27在 BSF 和家蝇中有 36 和 34 个溶菌酶基因,而在其他双翅目物种中有约 10 个。总而言之,这些结果表明,参与免疫反应的基因扩增是 BSF 适应富含病原体环境的基础。此外,这些扩张同时发生在生活在生态相似生态位中的两种不同的双翅目动物中。

双翅目动物栖息在广泛的栖息地。15鉴于昆虫主要通过嗅觉和味觉来感知环境,化学感受系统的进化可能在宿主特化中发挥重要作用。28我们手动注释了 BSF 中的三个主要化学感应受体家族:嗅觉受体 (ORs)、味觉受体 (GRs) 和离子型谷氨酸受体 (IRs)。与 GRs 和 IRs 的相当大的基因家族大小不同,我们在 BSF 中发现了总共 153 个编码 ORs 的基因,是家蝇中 OR 编码基因数量的两倍,家蝇中这些基因的数量是先前在双翅目中报道的第二多. 在这种大规模扩张中,91 个 OR 是潜在的 BSF 特异性信息素受体(图 3d)。这些 OR 可能涉及 BSF 特定的环境线索或交配/社会行为识别。其他扩展位于三个特定的 OR 中。据报道,Or56a 在果蝇中存在有害微生物时会引发回避行为29我们将 13 个 BSF OR 放置在DmOr56a 的单系姐妹簇中,这可能会增加 BSF 中微生物检测的可塑性。Or67c 对果蝇中的乳酸乙酯和许多酒精气味敏感;30我们发现 12 个 BSF OR 与DmOr67cDmOr92a共存于一个簇中我们还在BSF 和家蝇中发现了与DmOr46a相关的基因的共同扩增,我们分别为这两个物种鉴定了 17 个和 3 个基因。先前的研究表明,这种 Or46a 被预测为苯酚反应性 OR,31,32在成人中表达。

我们进一步注释了通常与异生素解毒相关的五组经典酶。其中,我们发现 BSF 和家蝇基因组中细胞色素 P450 的显着扩增(图 3e),其数量至少是其他蝇种中观察到的两倍。BSF 中最主要的 P450 聚集在氏族 3 中,这是一个通常与解毒相关的 CYP 进化枝。33,34与表现出对杀虫剂快速进化抗性的家蝇不同,35据信 BSF 对杀虫剂仍然高度敏感。36因此,CYP3 P450 的这种共同扩展挑战了以下假设,即解毒相关基因数量的进化增加必然有助于杀虫剂抗性。37,38

以有机废物为食的 BSF 幼虫的肠道转录组

BSF 是一种很有前途的天然回收商,可将有机废物生物转化为牲畜和水产养殖饲料。幼虫可以在包括粪便在内的多种基质上茁壮成长39甚至食物浪费。40在昆虫中,中肠直接与这些病原体密集的底物相互作用。41我们在补充有代表性有机废物形式的饮食中饲养 BSF 幼虫,包括食物垃圾和普通粪便类型(例如,家禽、奶牛和猪),并在四个时间点(第 4、6、8 天和第 4 天)解剖中肠12) 使用 RNA-seq 分析基因表达(补充信息,表 S11)。相关性分析未能根据饮食或时间点区分明确的簇(补充信息,图 S4),这意味着 BSF 幼虫利用一组共同的基因来响应不同类型的有机废物。我们确定了至少在一个样本中表达的 9417 个基因,其中一半在所有饮食中表达(图 4a )). 基于所有表达基因图谱的主成分分析将以乳肥为食的幼虫与其他饮食区分开来(图 4b)。这可能是由于奶牛喂养的特殊饮食与为家禽或猪配制的饮食完全不同。42

图 4

用有机废物喂养的 BSF 幼虫的肠道转录组。在用指定饮食喂养的第 4、6、8 和 12 天,对喂食食物垃圾 (FW)、家禽粪便 (PM)、乳制品粪便 (DM) 或猪粪 (SM) 的 BSF 幼虫的中肠进行取样。对样品进行 RNA-seq。a 16 个样本中表达基因的分布(n  = 9417):在每种饮食类型下每个时间点表达的基因标记为“全部”;16 个样本中有 15 个表示为“几乎所有”;在每种饮食下通常表达但并非在每个时间点都表达的基因被标记为“广泛”;仅在一个样本中表达的基因被标记为“孤儿”;只有用粪便喂养的幼虫表达的基因被标记为“粪便”;仅在以食物垃圾为食的幼虫中表达的基因被标记为“废物”。b基于整体表达谱的肠道样本主成分分析。绘制了解释 34.2% 和 20.4% 方差的前两个特征向量。c 500 个最高表达基因(约占所有表达基因的 5%)的维恩图,根据所有时间点的平均表达值为每种饮食选择。喂养所有四种饮食的幼虫总共表达了 326 个基因。d对喂养所有四种饮食的幼虫表达的 326 个基因进行了 KEGG 富集分析。蓝色通路属于消化系统,红色通路表示与传染病相关的通路。基因计数显示为直方图。超几何检验(FDR 调整):* P  < 0.05,*** P < 0.005,**** P  < 0.001。e一个典型的BSF 特异基因簇,在以有机废物为食的幼虫中高度表达。显示了BSF 中的基因组组织和D. melanogaster中的同源区域。这些物种之间的同系物对通过线连接。绿色和蓝色的基因表示属于两个直向同源组的 BSF 特异性基因。这 14 个基因与任何其他已测序的无脊椎动物物种的基因没有同源性。请注意,此集群位于组装的 BSF 脚手架的末端。热图显示了在四个时间点的每个时间点用其他饮食喂养的 BSF 幼虫中相应基因的表达模式

为了表征在消化中重要的 BSF 基因的核心集,我们从喂养每种饮食的幼虫中选择了 500 个表达最高的基因(大约前 5%)(图 4c  喂养所有四种饮食的幼虫总共表达了 326 个基因(补充信息,表 S12),支持我们的假设,即 BSF 利用共同的基因库来响应不同类型的有机废物。这 326 个基因在 13 个生物学途径中显着富集(图 4d和补充信息,表 S13)。令人惊讶的是,最突出的途径仍然是核糖体(ko03010;FDR P =  1.1 × 10−74),这也是 BSF 中快速进化基因最显着富集的途径(补充信息,表 S67)。核糖体是生物蛋白质合成的场所。BSF 能够在大量分解的有机底物上定殖并产生大量蛋白质。基因组进化和表达的特征都将核糖体确定为极端异常值,揭示了 BSF 的核糖体与其利用有机废物的独特能力之间的密切关联。其他显着富集的途径与人类的消化系统和传染病有关(图 4d中的红色途径)). 我们还确定了总共 150 个 BSF 特异性基因,这些基因高度表达(每百万份转录本 (TPM) ≥ 200)(补充信息,表 S14)但其功能尚未定义。这些基因可能对 BSF 独特的适应性状有独特的贡献,值得进一步的功能研究。此外,许多编码免疫系统相关因子的基因在整个饮食中都有表达,尽管其中一小部分在任何样本中都有表达(补充信息,图 S5)。有趣的是,这些新基因中的一些位于同一支架上的簇中,并以极高水平共表达(图 4e和补充信息,图 S6)),表明它们的生物学重要性,这可能推动了它们最近在 BSF 进化中的重复。这些基因簇在消化中的作用可以通过基因操作和生物测定来探索。

以有机废物为食的 BSF 幼虫的微生物群

除了中肠本身进行的新陈代谢外,肠道微生物群是昆虫生物转化过程的基础。43尽管一些研究报告了在有限条件下对 BSF 肠道微生物群的初步调查,10,44,45,46,47,48,49仍然没有完整的 BSF 微生物群响应常见类型的粪便和喂养时间动态。因此,我们研究了不同的有机废物如何影响 BSF 中肠中的微生物群。简而言之,我们进行了基于 16S rRNA 基因的群落分析以探测微生物载量和多样性(补充信息,表 S15),并根据操作分类单元 (OTU) 丰富度分析了每种饮食诱导的微生物多样性。用乳制品和猪粪喂养的 BSF 幼虫产生的微生物群复杂性高于用家禽粪便喂养的 BSF 幼虫(图 5a)。基于样本间多样性的主坐标典型分析显示了基于饮食的微生物群落的强烈聚类(图 5b )),这解释了 43.2% 的总体方差 ( P <  0.001)。与中肠转录组的未分化模式不同,样本间多样性和 Bray-Curtis 差异性分析均表明饮食极大地影响了 BSF 中肠中的细菌群落(补充信息,图 S7  最可能的解释是中肠菌群的一些成员是随饮食直接输入的,而不是诱导增殖的。

图 5

用不同类型的有机废物喂养的 BSF 幼虫的微生物组。a以指定饮食喂养的幼虫细菌群落的样本内多样性估计。b样本间多样性的约束主坐标分析。为前两个 CPCoA 绘制的受饮食限制的样本之间的 Bray-Curtis 距离。c在门级所有群落的 OTU 动态景观。OTU丰富度由相应符号的面积表示。符号表示包含序列的计数。颜色表示目标 OTU 相对于相应样本的所有 OTU 的比例

我们在不同类型的饮食和时间点生成了完整的微生物群组成目录(图 5c和补充信息,图 S8)。独立于饮食或时间点检测到总共 16 个 OTU 门;这些门是与 BSF 中有机废物消化相关的核心微生物组。厚壁菌门是最主要的细菌门,在用猪粪喂养的幼虫中丰度为 59%,在用奶牛粪喂养的幼虫中丰度为 74%(图 5c  ). 与饮食无关的厚壁菌门以相似的 OTU 丰富度水平存在,这表明平衡厚壁菌门群落对于 BSF 幼虫的消化过程至关重要。厚壁菌门在动物粪便的消化中具有重要作用,因为这些细菌分泌多种蛋白酶和果胶酶,并参与秸秆相关堆肥中难消化碳水化合物的降解。50,51厚壁菌门也与人类肥胖有关,其中大量的厚壁菌门能够以更快的速度将食物转化为能量。52厚壁菌门的主导地位进一步加强了 BSF 在回收废物和生产高脂肪负荷以用作饲料方面的经济意义。在 Firmicutes 中,属于 Bacilli 和 Clostridia 类的序列在 BSF 群落中占主导地位(补充信息,表 S16)。另外两个丰富的门是拟杆菌门和变形杆菌门,它们分别在以食物垃圾和家禽粪便为食的中肠中占主导地位。拟杆菌是降解高分子量有机物的专家。53此外,变形杆菌的丰度增加已被提议作为人类疾病的潜在微生物特征。52因此,BSF 中肠对高负荷变形菌的耐受性为变形菌相关疾病提供了一个潜在的信息模型。

促进 BSF 幼虫利用的遗传操作

尽管 BSF 具有巨大的消耗有机废物的潜力,但仍需要改进 BSF 的某些特性以供工业使用。本研究提供的多种组学数据,以及 BSF 与广泛使用的模式昆虫Drosophila之间的相对遗传保守性,为筛选分子靶点以优化 BSF 的关键特征提供了坚实的基础。因此,我们在 BSF 中开发了一种基于 CRISPR/Cas9 的基因组编辑方法,并实施了该技术来测试体内一些修饰的 BSF 基因的功能。

苍蝇主要在幼虫阶段进食。如果 BSF 的幼虫阶段能够稳定地延长,那么消耗有机废物的效率将得到提高。昆虫的变态受一系列激素和神经肽的控制。54通过筛选参与这种肽能信号通路的基因,我们专注于编码促胸腺激素 (PTTH) 的基因,该激素通过启动导致蜕皮激素生物合成和释放的信号级联反应来促进蜕皮和变态。55BSF 中Ptth的敲除显着延迟了 BSF 幼虫的化蛹过程。BSF 的基因组编码Ptth的单个拷贝,除了 N 末端外, Drosophila直系同源物具有边际保守性(补充信息,图S9)。我们设计了两个靶向第二和第四外显子的 sgRNA,以在体内显着 破坏HiPtth (图6a、b)。在 CRISPR/Cas9 介导的HiPtth消融后,最后一个幼虫龄期的平均持续时间从对照组的 4-5 天增加到任何镶嵌形式的HiPtth破坏的突变幼虫的 > 85 天。我们还发现身体尺寸(图 6cPtth突变体的)和重量(图 6d明显大于野生型。有人提出Ptth不介导果蝇的生长速度。56这表明Ptth突变体的体型增加可能是由于喂养时间延长所致。通过提高每只昆虫的消耗效率,增加的饲养能力可能有利于 BSF 幼虫的利用。

图 6

Ptth的诱变导致 BSF 幼虫的摄食能力增加。CRISPR/Cas9 系统用于在H. illucensHiPtth基因座处诱导突变。a HiPtth基因外显子/内含子边界的示意图外显子显示为方框;细线代表内含子;数字是以碱基对 (bp) 为单位的片段长度。目标站点 (TS) 位置已注明,PAM 序列以红色显示。b突变体中HiPtth基因座中目标区域的序列PAM 序列为红色。每行中删除的核苷酸数显示在右侧。c HiPtth的形态学突变体相对于野生型 (WT) 对照显示出更大的尺寸。d突变体和对照的平均体重(n  = 30;平均值±SEM)

另一个可能减轻维持大量 BSF 昆虫负担的特征是限制成虫的活动。飞行能力的丧失是动物(例如蚕、鸡)驯化中的典型表型变化。为了在 BSF 中开发此类表型,我们注释了参与翅膀发育的果蝇基因的直系同源物,并使用 CRISPR/Cas9 测试它们在 BSF 中的功能。Vestigial ( Vg ) 编码指定果蝇翅膀大小和形状的选择基因。57,58比对分析显示BSF 中的Vg与果蝇拷贝一起保存(补充信息,图 S10)。我们发现Vg的体细胞镶嵌突变体(图7a、b中的任何类型的缺失 )是可行的,但完全没有翅膀,没有表现出任何其他形态或发育异常(图 7c )). 由于马赛克诱变足以导致表型缺陷,因此未来可以通过分别与表达 Cas9 和 sgRNA 的细胞系异交,在实验室中维持这种不会飞的 BSF 细胞系。通过这项工作,我们有可能减少 BSF 群体的足迹,并在城市环境中开发出具有更高生产价值的工业昆虫。

图 7

BSF 中Vg的诱变消除了成虫的翅膀。a HiVg的外显子/内含子边界的示意图外显子显示为方框,细线代表内含子。目标站点 (TS) 位置已注明,PAM 序列以红色显示。b Vg突变体相应基因座中目标区域的序列PAM 序列为红色。每行中删除的核苷酸数显示在右侧。c表型图像显示Vg突变体在成虫阶段缺乏翅膀

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
高效课时作业2-7
生物进化【题组2】
“超有机体”:我们不只是我们自己
3月28日《科学》精选:全脑图将神经元与行为挂钩
NCBI的用法
2000只!沈阳海关截获活体黑腹果蝇 最可怕的是基因改造,威胁人类
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服