转录因子金标准数据库有 TRANSFAC 以及 JASPAR,但是这些数据都没有直接给出TF-target的互作关系,反而是提供位置频率矩阵 PFM 及 PFM 在染色体上的位置信息(小伙伴们可以想一想,为什么多数都没有直接提供TF-target互作信息呢?看谁能猜到一些)。
(图源网络)
实际上,不提供TF-target直接互作信息,部分是因为通过TFBS profile预测转录调控互作的假阳性率太高了,而且,TF和target的互作非常复杂,受到很多时空以及环境因素的调节,所以,通过TFBS profile预测的转录调控,实际上可能毛关系都没有。
今天,我们就来介绍一个数据库,不仅仅直接提供了TF-target互作信息,而且还克服了很多数据库中假阳性很高的问题,这个数据库就是TRRUST(https://www.grnpedia.org/trrust/)。
这个数据库最早是韩国人在2014年构建的,目前,这个数据库已经是第2个版本了。而且,TRRUST V2的文章,在2018年发表在大名鼎鼎的核酸研究上。
为什么说这个数据库能够克服其他数据库的假阳性呢?
这个我们得从这个数据库的构建说起。这个数据库使用MeSH词汇查询、不断改进的sentence-based文本挖掘算法,加之挖掘后仔细的人工校对,保证了该数据库中的TF-target调控互作都是经过实验验证的。目前该数据库收录了已经报道的人和小鼠的6552对TF-target调控信息。
下面,我们看一下怎么使用这个数据库吧。
用途一:查询转录因子的靶基因,而且都是经过实验验证的靶基因。
选择物种,然后直接在查询栏中输入一个转录因子的gene symbol,点击submit,就出来结果了。
出来的结果包含3个部分:
第一部分是TP53的靶基因列表:包含TF-target、调控类型(激活还是抑制),以及调控关系的支持文献。点击下载图标就可以下载此tsv表格。
第二部分是调控TP53转录的转录因子列表:转录因子作为蛋白,他自身的转录多数也是要受到其他转录因子的调控的(当然,有些TF受到自己调控)。所以这一部分就给出了文献报道的调控该TF转录的转录因子列表。
第三部分是和该TF密切相关的disease ontology、KEGG以及GO BP terms。研究该转录因子的,要密切关注这些研究主题哦!
用途二:查询某个基因受到哪些转录因子的调控
实际上,还是在和用途一一样的查询栏输入目的基因,点击submit即可。也就是说,该服务器会自动判断你查询的基因是否属于转录因子(当然,仅限于该数据库收录的转录因子),然后给出结果。
该结果就比较单调,只有转录因子及其调控互作列表,不过我们想要的结果已经有了。
用途三:查询基因列表的关键调控因子
因为转录因子往往同时调控了诸多功能密切相关的基因,因此,在我们通过各种实验或者数据挖掘获得差异基因列表后,我们可以直接将此列表扔给这个网页服务器,服务器会自动计算最有可能调控这些差异基因的转录因子,这个和iRegulon插件的功能比较类似。
数据库的搭建者们拿2017年一篇文献中报道的ESR1敲除后获得的差异基因列表进行计算,该服务器能够计算出来ESR1是最有可能受到干扰的转录因子,完美地猜中了结果。
用途四:数据下载
虽然官网没有将它算作一个用途,但是这个用途才是最重要的。相信各位懂生信的小伙伴们已经知道这个数据库的意义了吧!
联系客服