打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
文献计量学系列04:文献增长规律与指示意义
导读

    科技文献数量随时间的增长规律,在一定程度上反映了人类科研的活跃程度,可以大致地揭示科学发展的特点和规律。通过统计特定学科的文献数量和变化情况,绘制相应的增长曲线,对判断该学科发展现状,预测其未来发展趋势,并为做好相应的科学研究计划、文献馆藏科技情报工作提供决策依据。

经典文献增长模型简介





根据学科发展特点不同,文献增长规律各异。文献增长模型有若干种模型,常见的模型,也是经典模型有3种:指数增长模型,逻辑曲线模型和线性模型。本文针对此三种经典模型作简要介绍。

指数增长模型

文献计量学奠基人之一,美国著名情报学家普赖斯在统计分析大量文献资料的基础上,提出了科技文献随时间指数增长的规律,其数学表达式为:


f(t):t年限的文献累积数
a:参数
b:文献持续增长率,即每一年文献累积增加量与前一年文献累积总数之比
t:时间,以年为单位

图2 文献增长指数模型

逻辑曲线模型

在指数模型研究的基础上,前苏联学家纳里莫夫和弗莱杜茨认为文献数不可能无限增长,其根据实际文献的研究,提出了文献逻辑曲线增长规律,其数学公式为:


f(t):t年限的文献累积数
K:当t →∞时文献累积量,即文献累积量最大值
a:参数
b:文献持续增长率,即每一年文献累积增加量与前一年文献累积总数之比
t:时间,以年为单位

图3 文献增长逻辑曲线模型

线性模型

线性模型可以看作是任何曲线的特例,因此可以看作是上述模型的特殊形式;或是某特定时期文献增长的规律。

f(t):t年限的文献累积数

a:当t=0时文献数量

b:文献年增长率

t:时间,以年为单位

图3 文献增长线性模型

文献增长模型指导意义






对于一般学者来说,我们需要根据文献增长呈现的规律,利用外推法来预测未来研究的发展趋势,判断其发展是呈减少还是增加的趋势,从而指导实际的科学研究和科学活动。普赖斯根据文献增长的指数和逻辑曲线模型,提出了文献增长的4个阶段,此4个阶段对实际科学研究具有一定的指导意义。4个阶段如下:
1) 学科诞生初期,此时期文献增长不稳定,理论不完善,难以用数学公式表达;
2) 学科大发展期,此时期专业理论迅速发展,论文绝对数急剧增长,严格服从指数增长规律;
3) 学科理论日益成熟,论文数量增长缓慢,演变为线性增长,仅维持固定的文献增长量;
4) 学科理论完备,学科论文数量日趋减少,曲线逐渐平行于横轴,或呈不规则的波动。
因此, 根据文献增长拟合曲线,可以判断学科发展的所处的学科阶段,从而指导实际的科学研究。比如在第4阶段,研究应该偏向于理论上的突研究。如现有理论出现重大突破,则该学科可能进入一个文献增长循环。同时要注意,科学文献增长既受科学发展的客观过程控制,也受社会经济与政策等因素影响。因此,文献增长可能不完全符合数学模型,在实际指导科研工作中要注意社会经济等因素,尤其是国家科研相关政策。
案例:
本文以第二期数据为例,利用R语言绘制文献增长图,探索文献增长规律。
1 library(bibliometrix) # 文献计量学包
2 library(tidyverse) # 包含ggplot2, stringr等包
3 library(ggpmisc) # 添加公式,R^2, P值等
4 ###############系列2###########5 D <- readFiles("E:\精鼎统计\savedrecs.txt") # 读取数据
6 M <- convert2df(D, dbsource = 'wos', format = 'plaintext') # 数据格式转换
7 ###############系列3###########8 results <- biblioAnalysis(M, sep = ";") # 文献计量学分析
9 s <- summary(object = results, k = 30, pause = F) # 描述统计,返回列表, 包含9个指标的统计结果
10 ############系列4#########################
11 doc_num <- s$AnnualProduction # 从s中提取数据数据框
12
13 # 因为有些年份没有发表文献,数据缺失,所以要补全缺失年份数据。
14 # 构建插入缺失年数据的函数
15 missyearadd <- function(data,...){16 names(data)[1] = "Year" # 更改第一列列名
17 data$Year <- as.character(data$Year) %>% as.numeric() # 格式转换
18 missY = setdiff(seq(min(data$Year, na.rm = TRUE), max(data$Year, na.rm = TRUE)), data$Year) # 求缺失年份
19 allY_data = data.frame(Year = c(data$Year, missY), Articles = c(data$Articles, rep(0, length(missY)))) # 填补缺失年份数据
20 allY_data = allY_data[order(allY_data$Year),] # 按年递增排序
21 }22
23 doc_num <- missyearadd(data = doc_num) # 补全数据
24
25 #绘图
26 #每年文献发表规律############
27 fig1 <- ggplot(data = doc_num, aes(x = Year, y = Articles))+ #绘制底图层
28 geom_bar(stat = "identity")+ # 添加柱状图图层
29 labs(x = "", y = "Annual publication number")+ # 更改坐标轴名称
30 theme_bw()+ # 设置主题31 theme(panel.grid = element_blank(), # 去除画板内网格
32 axis.text.x = element_text(angle = 90, vjust = 0.4))+ # 设置x
33 轴坐标角度和位置
34 scale_x_continuous(breaks = seq(1986,2019,1))+ # 设置x轴刻度
35 scale_y_continuous(breaks = seq(0,35,5))# 设置y轴刻度
36 fig1
(可左右拉动展示)

图3 文献年增长规律

从图3可知,1999年以前,该领域发展缓慢,每年文献发表数均在10篇以下,年均发表3.6篇;2000年突破了10篇,一直到2014年,文献发表数在10-15左右,最大值为17篇,年均发表11.7篇;2015年文献发表数突然跳过20这个阶段,每年文献发表量高于30篇,年均发表量达到33.4篇,此时期该学科得到了相对较快的发展。由于文献增长模型是每年累积文献和时间的函数,接下来,将探讨累积文献增长规律。
37 #累积文献增长规律################
38 doc_num$Acc_articles <- cumsum(doc_num$Articles) # 添加每年累积文献列
39 #write.csv(file = "E:\精鼎统计\Cumulative publication.csv", doc_num)# 数据导出
40 #绘图
41 fig2 <- ggplot(data = doc_num, aes(x = Year, y = Acc_articles))+ #添加底图层
42 geom_line(color = "blue")+ #添加线图层
43 geom_point()+ #添加点图层
44 labs(x = "", y = "Cumulative publication number")+ #更改坐标轴名称
45 theme_bw()+ #设置主题46 theme(panel.grid = element_blank(), #去除画板内网格线
47 axis.text.x = element_text(angle = 90, vjust = 0.4))+ #设置x轴刻度角度与位置
48 scale_x_continuous(breaks = seq(1986,2019,1))#设置x轴刻度
49 fig2

(可左右拉动展示)

图4 文献累积增长规律

从图4可知,1990年之前,文献没有增长,1990年以后开始增长。1990-1999年期间增长较为缓慢,2000-2014年增长速率有所提高,2015-2019年增长速率显著提高,表明该学科正在进入快速发展阶段,但每一段似乎更符合线性模型,而不是指数模型。

在实际中,我们是对整个曲线进行拟合,而不是分段拟合。初步判断该曲线与2次多项式曲线相似,因此接一下来将对文献累积增长曲线进行2次多项式函数模拟。

50 #添加公式, 2次多项式函数拟合
51 formula = y ~ poly(x, 2, raw = TRUE) #构建函数
52 fig2 + stat_smooth(method = 'lm', formula = formula, lty = 2, color = "red", se= FALSE)+ #拟合函数曲线
53 stat_poly_eq(aes(label = paste(stat(eq.label), stat(rr.label), sep = "~~~~")), formula = formula, rr.digits = 3, parse = TRUE) #添加公式和p值

(可左右拉动展示)

图6 文献增长曲线模型拟合


图6可知,2次多项式曲线很好地拟合了文献增长曲线,验证了我们的猜想。此模型同样也说明未来该领域文献累积数仍然将呈快速上升趋势。从实际指导意义来看,目前该学科处于第二阶段初期,论文绝对数快速增长,但总量仍然较少(共392篇,系列3),其理论或研究方法尚未完善,需要加大研究。

另外,应结合该时期该学科的具体特征(需要阅读一定量的该时期的专业文献,尤其是综述文章),能够准确把握该学科研究趋势的更多细节,能够从而更详细地制定未来研究的政策、方向与措施。

注:本数据中所涉及的领域研究方法尚未完善,研究方法中有众多假定条件,导致研究结果存在较多的不确定性。未来研究应注重如何满足或是量化假定条件,或是重新定义研究方法)

本期小结





本文介绍了3种文章增长模型及其指示意义,运用了第2期数据进行了探索,发现该学科目前处于学科发展的第二阶段初期,文献增长较快,但研究方法需要完善。下一期,我们将寻找本领域重要文献,并探索本文案例所涉及的文献发表速度增加时期的影响因素。

参考文献:

靖培栋,康仲远.关于科技文献增长的数学模型.情报学报,2000,19(1):90-96.

李晨璐. 对未来科技文献发展趋势的预测. 情报杂志,2011,30:76-77.

整理撰写不易,请点亮支持!

文献计量学系列03:文献计量学主要指标描述统计分析 2020-02-20
R语言文献计量学2-某领域文献检索、下载与导入 2020-02-13
文献计量学系列1:bibliometrix包简介 2020-02-09

精鼎特邀

点亮再看,后续更加精彩哦!

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
文献信息增长规律
网络计量学研究的应用与发展--阿呆与阿瓜
科学网
引文分析的基本概念及简介
内容分析法的理论与实践研究
信息计量学
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服