打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
萤火虫基因组

背景

萤火虫是甲虫纲内的一类昆虫,它们是生物发光的最有名和最受欢迎的昆虫之一。世界范围内有100多个品种的2,000多个物种,但随着生活环境的大面积破坏,萤火虫面临灭绝的危险目前公共数据库中关于萤火虫的信息很少为了提高对萤火虫的认识和探索其生活史复杂性状的机制,由华农、未来组等联合对萤火虫基因组进行了测序。


样品

野外采集的野生幼虫育成的雌性成虫


测序

文库插入片段为400 bpIllumina平台共47.4 Gb原始数据,过滤后剩余41.9 Gb的高质量数据

插入片段为20 KbSequel平台数据共57.8 Gb,其中reads平均长度和N50分别9.5 Kb15.6 Kb


组装矫正

利用二代数据评估基因组大小约785 Mb

组装利用Falcon软件,进过纠错后剩余36 Gb数据,平均长度为10.3 KbN5013.9 Kb。组装基因组大小1.1GbN502.3Mb接下来通过ArrowPilon对组装结果进行矫正。

由于这个测序样品杂合度很高,这也是组装出1.1 Gb基因组比预估基因组大了约315 Mb,因此对组装基因组进行冗余处理,最终组装基因组大小760.4MbContig N503.04 Mb,最长的重叠群长度为13.69 Mb。基因完整性评估通过BUSCO评估的结果很好,结果如下表。

接下来通过转录组进行评估,有98%unigenes可以比对到基因组上。

预测得到44.88%的重复序列,60.68%的重复序列是TEDNA转座子占15.25%。

最终预测得到23,092个蛋白质编码基因,与其他现有公布的鞘翅目基因组相比,萤火虫的基因数量相当于光肩星天牛基因22,035个),基因数量大于T. castaneum16,526个基因)。最终有88.44%的基因能注释到各大数据库。

总结

这是第一个萤火虫科的基因组,也是通过Sequel平台所测数据组装的高质量参考基因组。该基因组为研究萤火虫的性通讯和生物发光等复杂性状的机制提供了核心资源,可以为萤火虫的生物多样性提供更好的保护。


参考文章

 Long-read sequence assembly of the firefly Pyrocoelia pectoralis genome.


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
数据集 | 鼹鼠:你距离灭霸只差一步(无剧透)
菜鸟团一周文献推荐(No.10)
华大医学执行总裁尹烨:基因大数据
癌症研究人员联手汇集肿瘤基因组数据 - 组学专区 - 生物谷
Duang~“元宵的基因组”你造么?
282个儿科低级和高级胶质瘤的综合基因组分析显示基因组驱动因子,肿瘤突变负荷和超突变特征
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服