本期直播主题: 如何半小时搞定一篇医学文献?
点击预约按钮,领开播好礼!
解螺旋公众号·陪伴你科研的第2693天
首先,我们需要了解一下转录因子。转录因子(transcription factor, TF)是一类序列特异性DNA结合蛋白,能够结合在靶基因上游的转录因子结合位点序列(transcription factor binding site, TFBS),参与调控基因转录过程。转录因子至少含有一个DNA结合结构域(DNA binding domain, DBD),用以识别和结合靶基因上游TFBS序列;含有多个转录效应结构,用以结合其他转录调节因子形成一个“基因启动子区域+TF+RNA聚合酶+其他辅助转录调控因子”形式的转录起始复合物,参与调控下游基因转录过程。目前已有诸多网站可以用来预测转录因子/靶基因,比如JASPAR和GTRD等。但footprintDB(http://floresta.eead.csic.es/footprintdb/index.php)是笔者认为最简单和稳定的了。footprintDB数据库的开发者来自西班牙,数据库相关文章(PMID: 24234003)于2014年1月发表在Bioinformatics期刊(2020IF=6.932)上。截至2021-08-15该数据库相关文章已引用28次(数据来源:PubMed)。开发者们整合了包括JASPAR在内的19的数据库的信息和相关文献,得到了9451个转录因子和13768个DNA motifs和35163个DNA Binding Sites/Sequences。该数据库可以实现转录因子和靶基因的相互预测。现在我们就来实操一下。关键词检索支持转录因子、DNA motifs和DNA Binding Sites的检索。这三者既可以单独检索,也可以混合检索。我们直接使用网站的的Demo数据——myeloblastosis oncogene(成髓细胞血症癌基因)进行检索,所有的设置均为默认。(是的,该数据库还支持直接进行疾病检索)结果页面显示,在myeloblastosis oncogene为关键词检索的结果为2个转录因子和4个DNA Binding Motifs。点击“Show results”即可查看详细结果。网站将结果整理为6列的表格,包括了Accessions、Names、Organisms(种属)、Description and notes、Binding Motifs和Binding Sites共六种信息。蓝色字体表示带有超链接,可以直接点击查看详情。如点击第一个检索结果“UP00081A (UniPROBE 20160601)”可直接查看详情。而在“DNA Binding Motif”和“DNA Binding Site”也可查看详情。这里显示了在myeloblastosis oncogene中的4个靶基因及其对应的转录因子。同样以表格的形式呈现,包括了Accessions、Names、Consensus、Organisms(种属)、Binding TFs和Binding Sites共六种信息。蓝色字体表示带有超链接,可以直接点击查看详情。细心的小伙伴可能发现了靶基因和转录因子的结果是有重复的。他们作为myeloblastosis oncogene的结果在两个表格里面是交替出现的。结果仍然是以表格形式呈现,包括了footprintDB template、Source、Organisms、STAMP e-value、Motif similarity、footprinDB PWM / Consensus、Binding proteins、Interface sequences和Pfam domains等信息。绿色表示带有超链接,点击可查看详情;红色表示可以直接显示详情。感兴趣的小伙伴可以实操一下。总的来说,开发者们帮我们整理了来自多个数据库和已发表文献中的转录因子和靶基因的相关信息,并提供了一个方便快捷稳定的检索和结果显示,对于转录因子和靶基因之间的相互预测可以说是非常友好的了。另外,该数据库还支持疾病检索,这可能会为你的课题带来一丝灵感。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请
点击举报。