打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
跟着岳大师学ENCODE和RoadMap(三)——如何分类查看转录因子并可视化分析ChIP-Seq


骨头小师妹最近有点不对劲,自从表观遗传学习班回来后功夫练得有点走火入魔:以前遇到科学问题第一反应是下paper找参考书,最近变了,遇到麻烦就到处找“神器”。昨天看完了《跟着岳大师学ENCODE和RoadMap(二)》,骨头决定挑一些转录因子把他们在肿瘤中的表达都翻一遍。但是问题来了,第一这丫头找不到转录因子的总结性列表,更不想去看paper;第二,这丫头不会用Linux分析转录因子的ChIP-Seq data,于是跑来找我问有木有相关神器。小师妹开口,总不好一口回绝,只能先策神器再想法整治这个小妮子。


转录因子,英文名Transcription factor,简称TF,听说有个组合用了这个名字后火了。TF能够结合在某基因上游特异核苷酸序列上调控其基因的转录。真核生物在转录时往往需要多种蛋白质因子的协助,包括染色质重塑因子(Chromatin Remodeling Factors,常常以复合体形式发挥作用,依靠水解ATP产生的能量改变染色质结构,从而参与基因表达调控)和转录辅助因子(Trancription Co-factors,与转录因子一起构成转录复合体,但不直接结合DNA,调控基因表达)。今天要策的数据库完全涵盖了上述三类蛋白,这就是AnimalTFDB,链接如下:http://bioinfo.life.hust.edu.cn/AnimalTFDB1.0/。AnimalTFDB是由华中科技大学郭安源教授研究小组维护,2011年1.0版本上线,2014年更新至2.0,该数据库对65种常见模式动物的TF进行了注释,做转录因子特定家族研究一定要熟悉这个数据库。如果看到好的paper中发现了一个功能强大的转录因子,也可以通过这个数据库找到其同家族成员,做平行研究。数据库paper链接如下:http://nar.oxfordjournals.org/content/43/D1/D76.full。该数据库理所当然也收录于NARDatabase Summary(说了多少次了,这是挖掘神器的神器http://www.oxfordjournals.org/our_journals/nar/database/c/)。


进入主页,整个数据库构架简单界面友好,基本点点鼠标就能完成操作。1-1中可以直接输入基因名检索特定分子信息,1-2是按照分子家族检索,1-3按照物种检索。1-4可以去看1.0版本,不过1.0和2.0相差不大,但是注释少了很多,有一段时间没更新了,不建议使用。1-5点进去可以下载每个物种的TF列表。



1


点击1-2,可以看到多个转录家族(图2)。Trancription Co-factors和Chromatin RemodelingFactors没有分家族,点进去可以看到基因列表。这里我们随便进一个,比如人p53家族(图3)。该家族有三个成员,3-1中提供了基因的Ensemble编号、Entrez编号、官方简写、曾用名和基因全名。3-2中是该家族的简述,可以改写一下放在文章里。



2



3


这个数据库就这么简单,一网打尽转录因子的所有信息。接下来就是分析这些TF调控的下游基因是什么。本篇中介绍一个ChIP-Seq分析神器CR Cistrome。

CR Cistrome(http://cistrome.org/db/#/)由哈佛大学和同济大学生物信息系联合开发,论文发表与《核酸研究》杂志,通讯作者为同济大学张勇(ChIP-Seq算法发明人)和哈佛大学刘小乐教授,论文链接如下:http://nar.oxfordjournals.org/content/early/2013/11/17/nar.gkt1151.full.pdf。该数据库理所当然被NARDatabase Summary收录(现在该知道这个挖掘神器的神器有多么牛逼了吧)。这个数据库收集了人类和小鼠中所有公开可获得的ChIP-Seq数据,GEO中可以找到的全部ChIP-Seq数据都可以通过该数据库进行分析。

进入主页可以看到该数据库界面十分友好,图4-1中可以观看数据库使用教程,不但有图文攻略,还有手把手的视频教程,只要能看懂10min即可上手操作。4-2中可以直接输入感兴趣的关键词进行搜索,比如特定组织名或转录因子名。4-3三个选择框中可以通过选择物种、实验选取细胞名称和具体感兴趣的转录因子,来找到ChIP-Seq data。今天我们就看看明星分子Notch1在CUTLL1细胞中调控了哪些下游基因。



4


选好数据后首先可以看到Inspector一栏(图5),介绍了整个实验的概况。5-1是该引用数据的文章,点击PMID号可以直接连接到pubmed阅读文章。5-2是ChIP-Seq的细胞系、细胞种类、组织来源和病种。5-3是质量控制数据,一共有6个指标,绿色代表合格,红色代表出现问题。5-4是数据可视化浏览,可以再UCSC和WashU两个数据库中实现可视化,WashU我们后面的帖子还会详细介绍。5-5提供数据下载,包括BED文件(详细列出了每一个peak的位置信息和可信度,追踪研究reads到底比对到了参考基因组的什么区域),BIGWIG文件(压缩版wig文件,追踪参考基因组的各个区域的覆盖度,测序深度)和预测的结合基因列表。



5


Inspector一栏下方是数据分析栏Tools。QC reports中主要是各种质量报告参数(图6-1)。QC motif中提供了序列motif。这里多说两句,DNA序列的Motif指的是DNA上的反复出现的一种碱基排列模式,拥有潜在的生物学功能,ChIP-Seq中的Motif通常指可被特定蛋白结合,如TATA box中的“TATAAT”序列就是一种非常经典的DNA Motif。想看Motif总结的可以去扒这篇paper——PMID: 24555784。6-2中点击蓝色字即可看到对应的motif(6-3)。点击7-1中Get top putative target可以看到排名靠前的一些转录因子作用靶点。7-2中点击链接可以去UCSC或WashU中查看靶基因中的Peak和Signal。也可以点击7-3手动检索自己感兴趣的基因是否存在在ChIP-Seq结果中。



6



7


不过还是那句话,神器再好没有科研思路也白搭,骨头就是个典型例子,最近玩惯了神器的缺乏头脑风暴的骨头看起来体重一直在往上飙,马上就要赶超李莫愁的师妹小笼包姑娘了,怪不得木有男朋友。为了拯救小师妹,我准备了一个500M的文献包……


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
转录调控实战 | 一文解决转录调控问题 | CHIP-seq
转录因子调控了谁?100%可行的完整解决方案V2.0
转录因子和靶基因系列(二)按类检索转录因子ChIP-seq数据
这题我会--如何弄清转录因子调控的基因(Cistrome DB数据库)
不做实验也能预测转录因子?推荐你这个预测神器
FactorBook:人和小鼠转录因子chip_seq数据库
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服