(1)差异基因分析:
选用来自不同生理或病理状态组织/细胞的样本为研究对象,通过分析各样本基因表达情况,进行表达差异分析,从而筛选出与其状态相关的候选基因。
(2)差异基因富集分析:
对筛选到的差异基因进行功能富集分析(GO,KEGG 富集分析),进一步全面地挖掘与样本性状相关的分子机制。
(3)分子标记开发:
通过转录组测序进行SNP、SSR 等分析,能够更加全面高效地挖掘样本的分子标记。该分析广泛应用于遗传育种、基因定位、物种亲缘关系鉴别、基因库构建、基因克隆等方面。
(4)模式生物转录本深入研究:
对已有参考基因组的模式生物,转录组测序可以更加深入地分析其基因结构相关信息,包括分析可变剪切、基因融合、新转录本的预测和注释、lncRNA 的预测等。
(1)组织样品
动物组织:> 2g;植物组织:> 4g;培养细胞:> 1×107 个;血液样品:≥ 2ml(最好是全血)
(2)真核生物RNA
请提供浓度≥ 200ng/μL,总量≥10μg 的RNA(单次建库用量为5μg);
OD260/280介于1.8~2.2 之间,OD260/230≥2.0,RIN≥6.5,28S:18S ≥1.0,确保RNA 无降解;
送样时请标记清楚样品编号,管口使用Parafilm 膜密封;
样品保存期间切忌反复冻融;送样时请使用干冰运输。
(3)原核生物RNA
请提供浓度≥200ng/μL,总量≥10μg 的RNA(单次建库用量为5μg);
OD260/280 介于1.8~2.2 之间,OD260/230≥2.0,RIN≥6.5,23S:16S ≥1.0,确保RNA 无降解;
送样时请标记清楚样品编号,管口使用Parafilm 膜密封;
样品保存期间切忌反复冻融;送样时请使用干冰运输。
转录组测序所需的测序量随物种转录组大小的不同而有所差异。而转录组的大小受基因数目和丰度双重影响,不同物种间变化很大。因此在测序之前,需要对转录组的大小进行评估。
①针对有参考基因组的物种,可通过分析基因组信息,统计编码基因个数及其碱基数来评估转录组的大小,同时也可参考相近或相关物种转录组研究的文章;
②针对无参考基因组的物种,只能参考相近物种的转录组大小。
(1)RNA的降解会严重影响测序的质量:①若RNA 的3'端发生降解,则无法通过3'端的poly A 捕获mRNA,反转录后进行测序也无法得到全部的cDNA②若RNA 的5'端发生降解,通过3'端的poly A 捕获得到mRNA,测序结果将出现明显的3’和5’偏向。
(2)RNA起始量不足影响测序的质量:RNA 起始量不足时,需要增加PCR 扩增循环数才能获得足够的量用于后续测序,这会产生大量的冗余数据。
(3)文库中poly A多聚物的存在会对测序信号产生干扰,影响测序结果的准确性。
(4)由于转录组中基因的丰度不一致,高丰度的表达基因会掩盖低丰度的表达基因,导致寻找新基因失败或产生大量冗余数据。
根据研究物种的拉丁文名,可在Ensembl(http://asia.ensembl.org/index.html)、JGI (http://genome.jgi-psf.org/)和 NCBI (http://www.ncbi.nlm.nih.gov/)中搜索是否有该物种的基因组信息,也可在其他专门介绍某种物种的网站寻找参考基因组。
一般下载的文件包括:Assembled scaffolds (masked)、Genes 、Functional Annotations 三种文件;需要下载的文件具体如下:
(1)序列信息:.fasta 文件,用于进行mapping 比对。
(2)基因注释信息:.gff 文件,里面包含基因名字,基因所在位置等信息,用于进行测得序列的基因注释,注释所得基因可以进行下一步表达差异分析。
(3)GO 注释信息:.txt 文件,里面包含基因名字和对应注释信息编号(GO 号),有此信息可以不用再重新进行GO 注释,直接利用此信息进行GO 富集分析。
差异基因的筛选是基于统计学意义的,不能仅仅通过一个基因在两个样本中表达量数值的大小判断差异表达是否显著。差异显著情况可通过矫正后的p-value来看,矫正后的p-value越小,差异越显著。同时也可结合|log2Foldchange|值来判断差异的大小情况,|log2Foldchange|越大,差异倍数越大。
(1)实验样本搞反导致的结果;
(2)没有使用与RNA-seq同一批样本进行验证;
(3)挑选的基因表达差异并不显著,或者挑选的是差异基因但表达量较低;
(4)两种方法本身就不同,RNA-seq是大规模筛选用的,反应样本整体的基因表达变化趋势,但不能保证每个基因的变化趋势都与qPCR一致。存在一定量的不一致情况也属正常。
联系客服