打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
如何查找基因序列信息——献给初学者



查找基因信息,好多网站都可以做到。一般常用的经典基因数据库有NCBI、UCSC。下面我们就以BCL2为例看一下如何在这两个数据库查找基因信息,比如最常查询DNA序列、mRNA序列以及启动子序列、UTR序列甚至蛋白质序列


1F
DNA序列


1.
打开NCBIGene选项,输入BCL2后,点击search.


2.
首先寻找基因DNA序列,如图所示,可以看到基因在染色体定位。

3.Genomic一栏中,点击Genbank后,可以看到如下界面,选择send-File-GenBank格式后,可以将序列导出到电脑桌面,这样可以得到基因的DNA序列。在导出序列时有两种格式:GenBnak格式,因为这个格式提供了很多该基因的信息;FASTA格式只含有基因序列。可以根据需求选择。


2F
mRNA序列


1.mRNA and protein一栏中,可以看到BCL2基因有两个转录本NM_000633.2NM_000633.2

2.点击NM_000633.2,可以查询基因编码区CDS、以及外显子exon等。


应用小故事(1)

比如,近年来异常火爆的cas9技术,是在DNA的水平进行编辑。在验证cas9对基因效率时,一般将突变型与野生型的基因序列交给测序公司,通过分析测序结果判断基因是否发生突变。而为了实现DNA的水平的突变,在进行设计时就会在mRNA序列中的mRNA序列的外显子上进行设计引物,为什么是外显子呢?因为内含子在翻译过程中被剪切,即便发生序列发生改变,功能也不会改变。




3F
启动子序列、UTR序列、蛋白序列


1.打开UCSC主页,选择物种,输入基因名称

2.点击GO之后出现以下界面,点击黑色标注的BCL2

3.点击后进入以下页面,通过UCSC数据库可以查询该基因的基因组信息,蛋白质数据库UniprotKB相关信息,该基因在不同组织表达的RNA-seq数据,基因芯片数据,蛋白质功能域以及结构,GO富集分析等等内容

1)根据查询目的,比如查询基因启动子、UTRCDS区,点击Genomic sequence

2)根据需求选择需要查询的内容,同时可以设置UTRCDS区等,搜索结果会以大小写形式区分。转录起始位点前面是基因的调控区,启动子区没有明显的位置定义,大家也只是猜测它的大体位置,比如你要研究promoter区,建议选择转录起始位点前的2000个碱基进行研究。当然如果觉得长度太长,也可以只研究-10000这一千个碱基,一般情况下,启动子区的变异都在这个区域内。

应用小故事(2)

在mircroRNA的研究中,最关键的一步是验证mircroRNA与靶基因是否具有调控关系。可以通过将目的基因3’UTR区域构建至载体中报告基因luciferase的后面,通过比较过表达或者干扰miRNA后,监测萤光素酶的活性变化而验证报告基因表达的改变。


3)如果想要查寻蛋白序列,点击protein即可得到.

当然,如果不满足于获得蛋白质序列,还可以看看蛋白质功能域与3D结构。

应用小故事(3)

蛋白质的许多特性可直接从序列上分析获得,我们根据序列预测蛋白质功能比较该蛋白序列是否与已知功能的蛋白质相似,或者查找未知蛋白中是否包含与特定蛋白质家族或功能域有关的亚序列或保守区段。



本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
UCSC数据库,全方位巡视一段DNA序列
一文教会你查找基因的启动子、UTR、TSS等区域以及预测转录因子结合位点
如何提取一个转录本的3'UTR区域的序列
基因的启动子序列,你是怎么找到的?
手把手教你如何用数据库查找 miRNA 结合位点 | 实验时间
外显子、内含子、mRNA、CDS关系
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服