打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
测序技术及测序报告中的SNP用途



对于测序,首先我们要了解测序的数据测的是什么?
简单的讲,测序测的就是我们研究对象的遗传信息,即DNA分子中碱基的序列。

在DNA分子中具有遗传效应的片段就是基因,那我们为什么需要研究基因?
这里就不得不提中心法则了,所谓中心法则是指遗传信息从DNA传递给RNA,再从RNA传递给蛋白质,即完成遗传信息的转录和翻译的过程。也可以从DNA传递给DNA,即完成DNA的复制过程。这是所有有细胞结构的生物所遵循的法则。


通过知识点介绍和问题方式引起大家对解全基因组测序相关的认识。全基因组测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。全基因组测序的个体,通过序列比对,可以找到大量的单核苷酸多态性位点(SNP),插入缺失位点(InDel,Insertion/Deletion)、结构变异位点(SV,Structure Variation)位点和拷贝数变异位点(CNV,Copy number variation)。通过生物信息手段,分析不同个体基因组间的结构差异,同时完成注释。

如果要进行全基因组测序主要包括以下三个方面:材料选择、上机测序和数据分析。


在 测序方法中我们主要以二代测序为主谈谈测序的原理


作为最普遍的的测序平台Illumina,其核心技术是:“DNA簇”和“可逆性末端终止”,原理如下:将基因组DNA的随机片段附着到光学透明的玻璃表面(即Flowcell),这些DNA片段经过延伸和桥式扩增后,在Flow cell上形成了数以亿计Cluster,每个Cluster是具有数千份相同模板的单分子簇。然后利用带荧光基团的四种特殊脱氧核糖核苷酸,通过可逆性终止的边合成边测序技术对待测的模板DNA进行测序。  

其测序流程主要分为以下四步:DNA文库构建、Flowcell、桥式PCR扩增与变性、测序。
1
DNA文库构建
利用超声波把待测的DNA样本打断成小片段,主要是打断成200-500bp长的序列片段,并在这些小片段的两端添加上不同的接头,构建出单链DNA文库。
2
Flowcell
Flowcell是用于吸附流动DNA片段的槽道,当文库建好后,这些文库中的DNA在通过flowcell的时候会随机附着在flowcell表面的泳道上。
3
桥式PCR扩增与变性
桥式PCR以Flowcell表面所固定的接头为模板,进行桥形扩增。经过不断的扩增和变性循环,最终每个DNA片段都将在各自的位置上集中成束,每一个束都含有单个DNA模板的很多分拷贝。
4
测序
测序方法采用边合成边测序的方法。向反应体系中同时添加DNA聚合酶、接头引物和带有碱基特异荧光标记的4中dNTP(如同Sanger测序法)。这些dNTP的3’-OH被化学方法所保护,因而每次只能添加一个dNTP。在dNTP被添加到合成链上后,所有未使用的游离dNTP和DNA聚合酶会被洗脱掉。接着,再加入激发荧光所需的缓冲液,用激光激发荧光信号,并有光学设备完成荧光信号的记录,最后利用计算机分析将光学信号转化为测序碱基。这样荧光信号记录完成后,再加入化学试剂淬灭荧光信号并去除dNTP 3’-OH保护基团,以便能进行下一轮的测序反应。

弄明白测序的原理后,接下来面对的问题是测序的深度以及原始数据到底是什么、数据量的衡量标准等,最常见的问题就是样本测序该如何选择合适的测序数据量和测序深度首先给大家介绍基础概念:


PE:Pair end,即检测过程中分别从同一条序列的两端进行测序;SE:Single end,即从序列的一端开始测序。
那么在什么情况下选择PE或SE呢?


通常我们都希望测序Reads读长,越长越好,这样有利于后续分析,因此目前倾向于PE;而选择SE的情况比方说小RNA测序,SE可以满足这一需求。




而下一组概念,Gb和GB,大家常常会搞混。
Gb:是指在测序过程中测到的基因碱基数量;GB,是指一种储存单位,即文件大小。

这两个概念是在数据质量评估常用的。
Q30:碱基识别正确率99.9%;Q20:碱基识别正确率99%。
实际应用中,应该如何用两者去评估数据呢?


另外,还有两组概念:转换和颠换、fasta和fastaq,这两组分别代表了什么,在测序过程中有什么用呢?

最后一个介绍的概念是测序深度,小伙伴常常容易糊涂的概念。
测序深度:测序得到的碱基总量(bp)与基因组大小(Genome)的比值,常用X(读作层)来表示,例如30X,就是平均每个碱基覆盖30次的碱基总量。
那么我们在选择测序检测时,应该选择多少覆盖深度比较好呢,例如全基因组冲侧向、外显子捕获测序?有什么参考的标准呢?

如何来评估测序数据的质量呢?每个参数代表了什么意义呢?清楚这些问题后,测序流程和测序基础分析两个方面



1
测序流程


下图是一般的测序流程,首先是原始数据通过软件与标准基因组进行序列比对,根据原始数据可以统计每个样本的测序深度和质控情况。另外,根据比对结果,还可以得到SNP、InDel、SV检测情况,最后根据数据库得到SNP、InDel、SV的注释结果。通过生物信息学的分析,可以找到突变对生物体的影响,可以预测哪些突变与疾病相关。由于测序数据量比较大,通过这样的流程处理1个样本需要1周的时间
GCBI目前将测序分析速度提高至2.5小时左右,首先是原始数据通过序列比对、去冗余、去重,然后再对数据进行SNP或InDel的分析。接下来以SNP为例,通过GCBI快速整合样本数据进行单样本、样本-样本、样本组-样本组的分析,并且还可以快速给出哪些基因发生明显的变化。

2
测序基础分析
不管是哪种流程都要涉及到原始数据,这里以常用的Fastq文件为例。一个Fastq文件完整的测序信息包括四行:碱基序列的标签信息、测得的碱基序列、质量序列的标签信息和质量序列。

对于测序数据我们都会对其进行质量评估,来评估测序数据的准确性,例如:样本碱基质量、原始测序产量、平均测序深度、转换与颠换比值。

如果一条序列,有较多的测序错误的碱基,那么在往标准基因组上比对的时候,就会出现比对不上,或者强行比对上,会对后续的 SNP,INDEL,CNV,SV 的检测结果造成影响,使得假阳性的结果增多,所以需要对数据进行过滤。

顺便插入生物样本的样本处理,生物样本主要有细胞、组织、血液和其他样本类型(石蜡、血清、血浆、尿液、外泌体等),小编这里主要为大家分享细胞和组织的样本处理。

细胞收集保存方法


提取DNA
收集细胞后,离心去除培养液,PBS快速洗2次,弃掉PBS,保存于-80°C冰箱。
提取RNA
贴壁细胞:细胞培养好后,去除培养液,用PBS快速的洗一遍,将PBS弃干净,直接加入TRIZOL,并吹打裂解细胞,待细胞裂解完全后,即可收集样本,-80储存。(不必胰酶消化)
TRIZOL用量:106 的细胞需要1ML TRIZOL。

组织样本的收集方法


提取DNA
样本离体后,用生理盐水迅速洗一遍,装管后迅速投入液氮速冻30分钟,转移至-80度保存。
RNALATER作用:如样本无法立即液氮,分离组织(薄膜状的组织等),特别适用于临床样本,其用量是组织体积的5-10倍左右。
组织样本的用量:以脂肪组织为例,一般黄豆大小的样本即可提出5-10UG的TOTAL RNA。

注意事项


1、要用冻存管保存组织样本(不可用EP管),并且管盖不宜拧的过紧,以防止从液氮取出时管子炸裂,样本损失。
至于样本处理细节、血液样本及其他样本的处理工作、测序建库流程等,可以跟相关专业人士多交流。

测序报告中提及的SNP

什么是SNP?

SNP(全称Single Nucleotide Polymorphisms)即单核苷酸多态性,主要是指在基因组水平上由单个核苷酸的变异引起的DNA序列多态性,包括单个碱基的转换、颠换等。SNP定位分类:可分为基因编码区、基因周边以及基因间SNP等三类;包括UTR区、编码区的外显子或内含子区 、可变剪切位点等等。

SNP所在基因组的位置不同所产生的功能影响也不相同,例如:
剪切位点——可能会影响转录的可变剪切。
终止密码子——可能使翻译无法正常终止。
编码区——可能导致密码子发生改变,密码子改变可能导致氨    基酸发生改变。

SNP的研究意义是什么?



1,寻找致病基因:具有已知性、可遗传性、可检测性,可用于疾病基因的位、克隆和鉴定。寻找疾病相关的突变位点,发展疾病预防策略。


2.诊断及预测致病风险:凭借对致病基因的了解和认识,可进行比对,更正确的诊断与预测潜在的或遗传性疾病。

3.药物基因体学及新药的发现


SNP所表现的多态性只涉及到单个碱基的变异,它是人类可遗传的变异中最常见的一种。人类许多表现差异、对药物或疾病的易感性等等都可能与SNP有关。


举个例子。我们通过探讨METTL4基因的SNP,来探讨与高度近视发病的关系。们选择如下的样本:对照人群71例,高度近视患者157例(其中包括显性遗传家系59例、隐形遗传家系46例和无明显家系散发患者52例)。

通过制备外周血基因组DNA,PCR 扩增METTL4 基因的外显子序列,应用异源双链 -单链构象多态性 ( HA-SSCP)方法分析 PCR 产物,对存在差异条带的PCR 产物进行测序分析。


结果发现:在 METTL4 基因的编码区发现 2 个 SNPs 位点:SNP7438A-C 位于第 2 外显子,SNP131C-A 位于第 4 外显子。 SNP7438A-C:正常人与高度近视各SNP7438A-C 的基因型分布无明显差异; SNP131C-A :隐性遗传(AR)高度近视组、无明显家系散发(SF) 高度近视组的SNP131C-A 基因型分布与对照人群无显著差异, 而显性遗传(AD) 高度近视与对照组差异显著(P <0. 05) 。



结论:SNP7438A-C 与高度近视的发病无关,SNP131C-A 与 AD 高度近视发病的关系需要进一步研究。


SNP结果解读



这里的结果解读主要分为:注释结果解读和数据库结果解读。注释这里给大家展示的是表格,很简单啦,对应列表查看相关数据信息。


接下来我们可以根据数据库对结果进行筛选


老师使用的是“错义突变”对其进行筛选。错义突变:也称非同义突变,它使得氨基酸密码子发生变化,从而导致氨基酸改变,这种变化可能会影响蛋白的构象,从而影响到蛋白的正常功能。所以研究者可以找到发生错义突变的SNP位点,进而发现其可能导致的疾病。
至于与SNP结果解读的相关细节,可以跟专业的小伙伴一起学习讨论。

本文参考:GCBI





本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
NGS基础概念-depth and coverage
关于基因你不可不知的一些知识!
基因测序为何代替不了基因芯片以及 PCR?
测序技术检测拷贝数变异在染色体疾病综合检测中的应用
8大测序技术长文解读 | 测序前不得不知道的''秘密''
宏基因组检测技术与临床实验室检测要求
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服