点击上面小程序卡片进入小程序可获取小程序开放全功能(3级检索命令)权限至20170825 23:59:59
被分析对象是所有IPC大类为H04的中国申请,共806509篇。
希望获得80万篇申请中申请量最多的前20个申请人之间的相互被引用关系。
这是一个非常复杂,有大量数据处理的任务。已经有群友认为“8万篇要卡半天,80万篇那就直接瘫痪”。
Patentics的大数据分析模块是如何完成这个任务,请看下面,
分析分2步做,上述介绍的第一步先获得最多申请量的前20申请人。结果是,
第二步利用已经分出的20个申请人为模板,对20个申请人中的每一个申请人,再按REFS进行分组。
这个概念有点复杂,实际上就是要通过Patentics的大数据分析模块,获得一个20x20的矩阵。
如下,在h04节点上点击右键,大数据/模板分组,
利用模板分组来获得申请量最多的前20个申请人列表。
按“取消”,回到分类器界面(当前分组命令被记忆)。
下面是最关键的一步,利用获得的前20个申请人对分出的前20个申请人,按被引用进行2次分组(获取数据立方体)。也就是对每一个申请人的每一篇专利,按列表中的20个申请人,进行2次分组。
第一条命令 ann%20%,就是对“主搜索”上的检索结果(80万篇)进行大数据分组;
第二条命令是对分出的每一个申请人的申请,按参数定义的20个申请人,进一步按被引用(refs),进行分组。
点击“确定”后,获得这样的一棵被引用树。
这样,每一个申请人节点下,除了一个自引用外,其余19个都是引用该申请人节点的其它申请人,称为“被引用”节点。
有了这样一棵被引用树,看看可视化输出结果。
这就是我们今天的介绍。
总结,关键是生成一个2级分组命令,例如,希望分析某一指定对象组,如3个申请人(a1,a2,a3)间的被引关系,可以直接输入命令
ann%$a1$a2$a3%
refs%$a1$a2$a3%
就可。
如果把Patentics的大数据分组模块看成一把锋利无比的“智能数据切割刀”,我们期待大家使用这一把“智能数据切割刀”,精准切割出描述复杂关联关系的数据立方(data cube),通过最新数据可视化模块,从各种不同的视角观察、分析这些复杂的数据关系,完成智能专利分析的任务。
联系客服