打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
高通量测序中的接头(adapter)到底是什么
userphoto

2021.07.08

关注
主要参考祝让飞 的文章及Tufts 网站中的信息,特此致谢。
首先放一张测序示意图,在DNA片段两端所加的序列即接头序列,也就是我们今天要讲述的主角。
测序示意图
1 基本概念
1.1 adapter
接头,为一段已知的短核苷酸序列,用于链接未知的目标测序片段
1.2 index或barcode
几个碱基组成的寡核苷酸链,用于在混合测序时,区分不同样本
1.3 insert
待测序的目标序列,位于两个adapter之间
测序片段示意图
测序片段包括几个部分:universal_adapter-insert-indexed_adapter。
测序由5'端开始,最开始的几个碱基无法测得,第一个adapter在数据输出时去除,由于测序读长的限制,第二个adapter通常测不到。
但是如果插入片段本身较短,测序会测穿,即会得到 insert-部分adapter 这样的read,这里的adapter便是我们常常提到的需要去除的接头部分。
2 序列信息
2.1 接头序列(示例)
universal adapter:
5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’
indexed adapter:
5’-GATCGGAAGAGCACACGTCTGAACTCCAGTCAC(barcode)ATCTCGTATGCCGTCTTCTGCTTG-3’
仔细看上面这对接头序列,universal adapter的3'末端的T与待测片段新增的A配对,那么剩余序列的反向互补链为
GATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT
与 indexed adapter 的前面12个碱基一致
GATCGGAAGAGCACACGTCTGAACTCCAGTCAC,即两段接头序列部分互补,形成Y型的结构。
2.2 index序列
可根据fastq序列中的信息获取
@HWI-ST1276:71:C1162ACXX:1:1101:1208:2458 1:N:0:CGATGT
fastq的格式信息不再赘述,第一行最末的 CGATGT 即本次测序所使用的index。
3 去接头的软件
常见的相关软件包括 Trimmomatic、cutadapt、fastx_toolkit、fastp 等。
关于Trimmomatic的使用,可以参见wangpeng905的文章,介绍很全面。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
小L生信学习日记-4丨原始数据质量如何判断?-下
cutadapt去除adapter序列
二代测序浅析
建库测序中的若干问题(1)
文库测序十问十答
【原创】三种NGS技术的科普介绍illumina、roche、ABI
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服