那我要用这个,怎么来给你搜呢?今天要秀一下,过去一年内,高分杂志的肿瘤研究热点。首先搜这个关键词,只能搜一个月的
为啥只能搜一个月的肿瘤研究的关键词呢?
这里会显示近一个月相关杂志的发文数量(#号是指蚊帐数量,旁边是杂志名)。当然,我会进行简单的分析,比如加上了各个杂志的影响因子,别问我是怎么加的
这其实是我获得的第一个数据,就是肿瘤相关的蚊帐,近一个月的杂志发文情况,所以,我就进行了初步的分析:
这个气泡图就是近一个月肿瘤相关蚊帐的发表情况,可以看到IF位于IF平均线以下的,越是靠右,就越是灌水
好了,别忘了我们要做什么
于是,就得到了高频词汇表:
这里的#代表的是蚊帐数量,count则是词汇出现的次数。也就是一篇蚊帐里,可以出现多次,比如“吃葡萄不吐葡萄皮,不吃葡萄倒吐葡萄皮”
有很多词出现频率很高,但实际分析的意义并不是很大,就像你分析一篇文章,全都是“That”,“a”,“The”等等
这就是高分杂志上肿瘤的研究热点,不难发现,好像一年里,研究肿瘤疫苗、肿瘤免疫、Treg、NK细胞的相对来说比较多。MiRNA的研究也比较多(LncRNA就少了很多,位于双平均线下),突变和多态性的词频也相对较高,甲基化研究也排得上。此外就是大量单抗类药物的研究大多位于左下角绿色的气泡集群里,还有一些肿瘤代谢相关的词汇(葡萄糖啊,脂肪酸啊之类的)频率也较高。实际上并没有太多的类似外泌体之类的和circRNA之类的研究。做成词频分析的色块的话,大概是这样:
我发现里面还参杂着不少基因,于是我把这些基因调出来,还分析了一下这些基因之间的关系:
联系客服