可视化输出被引用关系的多变量分析

Patentics Patentics智能语义检索小程序

小程序

点击上面小程序卡片进入小程序可获取小程序开放全功能（3级检索命令）权限至20170825 23:59:59

被分析对象是所有IPC大类为H04的中国申请，共806509篇。

希望获得80万篇申请中申请量最多的前20个申请人之间的相互被引用关系。

这是一个非常复杂，有大量数据处理的任务。已经有群友认为“8万篇要卡半天，80万篇那就直接瘫痪”。

Patentics的大数据分析模块是如何完成这个任务，请看下面，

分析分2步做，上述介绍的第一步先获得最多申请量的前20申请人。结果是，

第二步利用已经分出的20个申请人为模板，对20个申请人中的每一个申请人，再按REFS进行分组。

这个概念有点复杂，实际上就是要通过Patentics的大数据分析模块，获得一个20x20的矩阵。

如下，在h04节点上点击右键，大数据/模板分组，

利用模板分组来获得申请量最多的前20个申请人列表。

按“取消”，回到分类器界面（当前分组命令被记忆）。

下面是最关键的一步，利用获得的前20个申请人对分出的前20个申请人，按被引用进行2次分组（获取数据立方体）。也就是对每一个申请人的每一篇专利，按列表中的20个申请人，进行2次分组。

这是修改后的最终大数据分析命令。从这里看可能清楚了。

第一条命令 ann%20%，就是对“主搜索”上的检索结果（80万篇）进行大数据分组；

第二条命令是对分出的每一个申请人的申请，按参数定义的20个申请人，进一步按被引用（refs），进行分组。

点击“确定”后，获得这样的一棵被引用树。

这样，每一个申请人节点下，除了一个自引用外，其余19个都是引用该申请人节点的其它申请人，称为“被引用”节点。

有了这样一棵被引用树，看看可视化输出结果。

这就是我们今天的介绍。

总结，关键是生成一个2级分组命令，例如，希望分析某一指定对象组，如3个申请人（a1,a2,a3）间的被引关系，可以直接输入命令

ann%$a1$a2$a3%

refs%$a1$a2$a3%

就可。

如果把Patentics的大数据分组模块看成一把锋利无比的“智能数据切割刀”，我们期待大家使用这一把“智能数据切割刀”，精准切割出描述复杂关联关系的数据立方（data cube），通过最新数据可视化模块，从各种不同的视角观察、分析这些复杂的数据关系，完成智能专利分析的任务。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。