科技文献数量随时间的增长规律,在一定程度上反映了人类科研的活跃程度,可以大致地揭示科学发展的特点和规律。通过统计特定学科的文献数量和变化情况,绘制相应的增长曲线,对判断该学科发展现状,预测其未来发展趋势,并为做好相应的科学研究计划、文献馆藏科技情报工作提供决策依据。
图2 文献增长指数模型
图3 文献增长逻辑曲线模型
f(t):t年限的文献累积数
a:当t=0时文献数量
b:文献年增长率
t:时间,以年为单位
图3 文献增长线性模型
1 library(bibliometrix) # 文献计量学包
2 library(tidyverse) # 包含ggplot2, stringr等包
3 library(ggpmisc) # 添加公式,R^2, P值等
4 ###############系列2###########
5 D <- readFiles("E:\精鼎统计\savedrecs.txt") # 读取数据
6 M <- convert2df(D, dbsource = 'wos', format = 'plaintext') # 数据格式转换
7 ###############系列3###########
8 results <- biblioAnalysis(M, sep = ";") # 文献计量学分析
9 s <- summary(object = results, k = 30, pause = F) # 描述统计,返回列表, 包含9个指标的统计结果
10 ############系列4#########################
11 doc_num <- s$AnnualProduction # 从s中提取数据数据框
12
13 # 因为有些年份没有发表文献,数据缺失,所以要补全缺失年份数据。
14 # 构建插入缺失年数据的函数
15 missyearadd <- function(data,...){
16 names(data)[1] = "Year" # 更改第一列列名
17 data$Year <- as.character(data$Year) %>% as.numeric() # 格式转换
18 missY = setdiff(seq(min(data$Year, na.rm = TRUE), max(data$Year, na.rm = TRUE)), data$Year) # 求缺失年份
19 allY_data = data.frame(Year = c(data$Year, missY), Articles = c(data$Articles, rep(0, length(missY)))) # 填补缺失年份数据
20 allY_data = allY_data[order(allY_data$Year),] # 按年递增排序
21 }
22
23 doc_num <- missyearadd(data = doc_num) # 补全数据
24
25 #绘图
26 #每年文献发表规律############
27 fig1 <- ggplot(data = doc_num, aes(x = Year, y = Articles))+ #绘制底图层
28 geom_bar(stat = "identity")+ # 添加柱状图图层
29 labs(x = "", y = "Annual publication number")+ # 更改坐标轴名称
30 theme_bw()+ # 设置主题
31 theme(panel.grid = element_blank(), # 去除画板内网格
32 axis.text.x = element_text(angle = 90, vjust = 0.4))+ # 设置x
33 轴坐标角度和位置
34 scale_x_continuous(breaks = seq(1986,2019,1))+ # 设置x轴刻度
35 scale_y_continuous(breaks = seq(0,35,5))# 设置y轴刻度
36 fig1
图3 文献年增长规律
37 #累积文献增长规律################
38 doc_num$Acc_articles <- cumsum(doc_num$Articles) # 添加每年累积文献列
39 #write.csv(file = "E:\精鼎统计\Cumulative publication.csv", doc_num)# 数据导出
40 #绘图
41 fig2 <- ggplot(data = doc_num, aes(x = Year, y = Acc_articles))+ #添加底图层
42 geom_line(color = "blue")+ #添加线图层
43 geom_point()+ #添加点图层
44 labs(x = "", y = "Cumulative publication number")+ #更改坐标轴名称
45 theme_bw()+ #设置主题
46 theme(panel.grid = element_blank(), #去除画板内网格线
47 axis.text.x = element_text(angle = 90, vjust = 0.4))+ #设置x轴刻度角度与位置
48 scale_x_continuous(breaks = seq(1986,2019,1))#设置x轴刻度
49 fig2
(可左右拉动展示)
图4 文献累积增长规律
50 #添加公式, 2次多项式函数拟合
51 formula = y ~ poly(x, 2, raw = TRUE) #构建函数
52 fig2 + stat_smooth(method = 'lm', formula = formula, lty = 2, color = "red", se= FALSE)+ #拟合函数曲线
53 stat_poly_eq(aes(label = paste(stat(eq.label), stat(rr.label), sep = "~~~~")), formula = formula, rr.digits = 3, parse = TRUE) #添加公式和p值
(可左右拉动展示)
图6 文献增长曲线模型拟合
参考文献:
靖培栋,康仲远.关于科技文献增长的数学模型.情报学报,2000,19(1):90-96.
李晨璐. 对未来科技文献发展趋势的预测. 情报杂志,2011,30:76-77.
整理撰写不易,请点亮支持!
点亮再看,后续更加精彩哦!
联系客服