文献计量学之CiteSpace使用示例

在《CiteSpace：科技文本挖掘及可视化（第二版）》书中有这么一个流程图，这个流程图大体概括了CiteSpace数据分析流程。我们按照这个顺序，首先进行数据采集和数据处理。

CiteSpace支持分析的数据库众多，其中：

中文数据库主要有：CNKI,CSSCI,CSCD。

外文数据库主要有：WOS,Scopus,Derwent专利数据。

OA数据库：Pubmed,ADS天文学-物理学，arXiv天文学-物理学，美国科学基金会数据库。

在这里我们以Web of Sciences数据库为例，进行一次简单的文献计量学分析。

数据采集

具体的WOS数据库使用流程和检索策略，本篇文章不在赘述，我们直接从检索结果的导出开始。

下图为检索结果：

点击页面中的导出按钮，点击其他文件格式

WOS数据库单次导出纪录最多是500条，若你的检索结果为2000条，那么就需要重复导出4次，我们选择记录来源选项，记录内容选择全记录与引用的参考文献，文件格式选择纯文本，点击导出即可。

检索记录下载完成后，我们要统一将下载后的文件命名为download_XXX。

重命名之后，我们需要建立一个文件夹作为工作目录，文件夹以英文命名。

建好文件夹后，进入文件夹，分别建立四个新的文件夹，命名为：data,input,output,project。

其中:

input文件夹的作用是存放原始数据，例如我们刚才在WOS数据库导出的数据

output文件夹是用来存放原始数据进行格式转换，过滤去重处理之后的数据。

data文件夹的作用是用来存放原始数据进行格式转换，过滤去重处理之后的数据。与output相似，不同点是data文件夹是CiteSpace运行时指定的数据存放目录，我们这里设置output和data文件夹的意义在于使项目更加有条理性。

project文件夹是我们的项目目录，未来分析的结果和一些记录会保存在这个文件夹里。

数据处理

所有的工作准备好之后，我们运行CiteSpace软件，点击New新建项目

选择上面我们新建相应文件夹的文件路径，这里进操作前四项。点击sava保存即可。

新建项目完成后，我们开始进行数据处理的一些操作。

数据处理

点击Data按钮，点击Import/Export

点击选择对应的数据库平台，这里我们使用的是WOS，选择我们前面新建的数据输入和输出目录路径。

数据格式转换

不同的数据库导出数据的格式各不相同，CiteSpace提供了将不同数据转换为WOS数据格式的功能，因为本文使用的是WOS数据库检索平台，故数据格式不需要再转换。

过滤数据及去重

点击WOS->WOS数据框中的Remove Duplicates按钮，弹出的数据框是一些去重时的选项，我这里是默认选项。

点击start，程序会进行去重操作。结果如下

处理后的数据会输出在我们之前选择的output文件夹中

我们所有的数据拷贝到data文件夹中，因为data文件夹是项目数据存放的文件夹，output文件夹是原始数据进行数据处理后存放的文件夹。

到此，数据的简单的处理完成，接下来我们进行文献共被引分析

文献共被引分析

首先我们更改Time Slicing功能框中的时间，时间改为文献检索时设置的时间。

然后我们选择Node Types功能区中的Reference，选择完成后，点击GO按钮进行文献共被引分析。

点击Visualize按钮

等待程序运行，如果图的变化很小，可以点击左上角停止按钮。刚刚完成分析的图会显得杂乱无序，我们可以在Node Lables功能区内调节参数进行优化。

我们可以按照自己的需求进行调节，这里我们仅进行简单的调节，结果如下：

左侧数据栏可以看到具体的数据：

点击export-Generate a narrative,会自动生成研究报告

这里仅展示一部分

当然，还有很多其他的表现形式，我们这里就不再详述。

作者共被引分析

共现图如下：

期刊共被引分析

国家合作网络

关键词共现网络分析

领域的共现网络

以上是一次简单的CiteSpace使用实例，我们将在下一节中详细讲解：

1.软件的使用

2.各个参数的含义

3.各个分析图的含义

4.其他数据库的使用

参考资料：

CiteSpace科技文本挖掘及可视化（第2版）
李杰-CiteSpace 中文指南

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。