在《CiteSpace:科技文本挖掘及可视化(第二版)》书中有这么一个流程图,这个流程图大体概括了CiteSpace数据分析流程。我们按照这个顺序,首先进行数据采集和数据处理。
CiteSpace支持分析的数据库众多,其中:
中文数据库主要有:CNKI,CSSCI,CSCD。
外文数据库主要有:WOS,Scopus,Derwent专利数据。
OA数据库:Pubmed,ADS天文学-物理学,arXiv天文学-物理学,美国科学基金会数据库。
在这里我们以Web of Sciences数据库为例,进行一次简单的文献计量学分析。
具体的WOS数据库使用流程和检索策略,本篇文章不在赘述,我们直接从检索结果的导出开始。
下图为检索结果:
点击页面中的导出按钮,点击其他文件格式
WOS数据库单次导出纪录最多是500条,若你的检索结果为2000条,那么就需要重复导出4次,我们选择记录来源选项,记录内容选择全记录与引用的参考文献,文件格式选择纯文本,点击导出即可。
检索记录下载完成后,我们要统一将下载后的文件命名为download_XXX。
重命名之后,我们需要建立一个文件夹作为工作目录,文件夹以英文命名。
建好文件夹后,进入文件夹,分别建立四个新的文件夹,命名为:data,input,output,project。
其中:
input文件夹的作用是存放原始数据,例如我们刚才在WOS数据库导出的数据
output文件夹是用来存放原始数据进行格式转换,过滤去重处理之后的数据。
data文件夹的作用是用来存放原始数据进行格式转换,过滤去重处理之后的数据。与output相似,不同点是data文件夹是CiteSpace运行时指定的数据存放目录,我们这里设置output和data文件夹的意义在于使项目更加有条理性。
project文件夹是我们的项目目录,未来分析的结果和一些记录会保存在这个文件夹里。
所有的工作准备好之后,我们运行CiteSpace软件,点击New新建项目
选择上面我们新建相应文件夹的文件路径,这里进操作前四项。点击sava保存即可。
新建项目完成后,我们开始进行数据处理的一些操作。
点击Data按钮,点击Import/Export
点击选择对应的数据库平台,这里我们使用的是WOS,选择我们前面新建的数据输入和输出目录路径。
不同的数据库导出数据的格式各不相同,CiteSpace提供了将不同数据转换为WOS数据格式的功能,因为本文使用的是WOS数据库检索平台,故数据格式不需要再转换。
点击WOS->WOS数据框中的Remove Duplicates按钮,弹出的数据框是一些去重时的选项,我这里是默认选项。
点击start,程序会进行去重操作。结果如下
处理后的数据会输出在我们之前选择的output文件夹中
我们所有的数据拷贝到data文件夹中,因为data文件夹是项目数据存放的文件夹,output文件夹是原始数据进行数据处理后存放的文件夹。
到此,数据的简单的处理完成,接下来我们进行文献共被引分析
首先我们更改Time Slicing功能框中的时间,时间改为文献检索时设置的时间。
然后我们选择Node Types功能区中的Reference,选择完成后,点击GO按钮进行文献共被引分析。
点击Visualize按钮
等待程序运行,如果图的变化很小,可以点击左上角停止按钮。刚刚完成分析的图会显得杂乱无序,我们可以在Node Lables功能区内调节参数进行优化。
我们可以按照自己的需求进行调节,这里我们仅进行简单的调节,结果如下:
左侧数据栏可以看到具体的数据:
点击export-Generate a narrative,会自动生成研究报告
这里仅展示一部分
当然,还有很多其他的表现形式,我们这里就不再详述。
共现图如下:
以上是一次简单的CiteSpace使用实例,我们将在下一节中详细讲解:
1.软件的使用
2.各个参数的含义
3.各个分析图的含义
4.其他数据库的使用
参考资料:
CiteSpace科技文本挖掘及可视化(第2版)
李杰-CiteSpace 中文指南
联系客服