打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
情报收集分析和服务 - 图情博览 - 档案界论坛 档案界 - Powered by Dis...

情报收集分析和服务


情报采集

  情报采集模块是CIS的重要输入系统,是竞争情报工作的基础。其工作质量     和   速度很大程度决定着CIS的效能和效益。

  当今多源异构的情报信息特征对情报采集模块是一大挑战。因此,CIS的采集模块必须具备全面的数据采集能力。针对不同的信息源设计相应的采集器,每个采集器都可以根据用户信息源的差异与用户的需求来设定。
  采集器被设置好以后将会自动地运行,并在运行时不断地观察信息源的变化和更新,把新的或更新过的信息传送给情报分析模块,并具备一定的信息排重功能。
  针对以下主流数据源,CIS应该具备相应的采集器:
  互联网采集器 按用户指定地址采集因特网上信息,主要由Spider/Robot程序实现。
  文件系统采集器 把各种文件格式的文件(包括Office文档、pdf、html、txt、xml、Flash、视音频等)自动读取到系统中。对不同格式文件的访问需要相应的应用程序接口。
  Lotus Notes采集器 采集存储于Notes文档库中的资料,例如OA系统信息。这可以通过OA系统输出获得,也可以直接访问Notes数据库,并集成其中的用户访问权限。
  关系数据库采集器 通过ODBC协议,采集存储于关系数据库(例如Oracle、IBM DB2、Microsoft SQL Server等)中的信息。
  此外,采集系统还应能够识别出信息源中真正有效的内容,这一点对采集目前“绚丽多彩”的互联网信息显得尤为重要,从而为情报分析模块作好准备。
  情报分析
  情报分析模块是企业CIS的核心,对于传统结构化数据,尤其是关系型数据的分析处理已有成熟的分析方法,而目前大多数情报信息来源于非结构化数据当中,因此提取其特征和进行基于自然语言的理解是分析的根本。
  目前常用的基于自然语言理解的技术主要有:
  文本分类 文本分类方法主要有基于统计的方法和基于人工智能的方法。
  基于统计方法的文本分类处理过程可以描述为:首先要对分类的文档建立其特征表示,一般是采用文档特征向量的方法。由于文档特征向量具有惊人的维数,因此必须进行特征抽取,以缩减特征向量的维数。得到文档的特征子集后,便可生成分类器进行分类。最后需要对分类器进行评估。其中的关键在于文本的向量化表示、特征提取、分类器构造和评估算法。这种方法基于经典的概率理论,目前得到了比较广泛的运用。 如SPSS、SAS等专门的统计软件。
  基于人工智能的方法主要有人工神经网络、支持向量机等,这些方法是从基本数据挖掘的分类算法中演化而来,目前正逐步得到认可。
  相关文章分析 相关文章分析技术是文本挖掘的重要功能,是实现相关反馈的基础,也可用于去重分析。
  通常相关文章链接技术的原理如下:首先对文档建立索引,可以是全文索引,或者是部分词(被确认为表达文章主要概念的词)的索引。这些词主要是名词、动词、形容词等实词(连词、助词等通常不包含具体意义的虚词被过滤掉)。
  在进行相关文章链接处理时,首先对输入的文档进行分析,找到有意义的索引词,然后逐个词到索引库中查找与之相关的文档,并记录查询结果。然后根据每篇文档中包含索引词的多少、词频、文档的长度等信息来计算相似度。最后还可以根据相似度的大小进行排序,这样就找到了最相似的文档。
  自动摘要 自动摘要有助于用户快速把握情报信息的核心内容。它是利用计算机自动地从原始文献中提取文摘。
  自动文摘包括自动摘录、基于理解的自动文摘、信息抽取和基于结构的自动文摘四种主要的文摘方法。其中比较实用化的是自动摘录(Automatic Extraction)技术。
  自动摘录将文本视为句子的线性序列,将句子视为词的线性序列。它通常分4步进行:a.计算词的权值;b.计算句子的权值;c.对原文中的所有句子按权值高低降序排列,权值最高的若干句子被确定为文摘句;d.将所有文摘句按照它们在原文中的出现顺序输出。
  目前的自动摘要技术还处于一个初级阶段,实用化的自动摘要技术必将给承担大量信息处理CIS起到极大的性能提升作用。
  情报服务
  情报服务模块是CIS的输出系统,它的主要功能是根据不同层次用户的情报需求,动态地提供情报产品和情报服务。在这里,信息发布技术构成了主要支撑。
  通过互联网络进行信息发布是主要手段,基于B/S结构的企业信息门户(EIP)技术的CIS已成为当今主流,进行网络发布采用的主要技术体现在:
  内容的组织与表现 通常信息发布采用频道及模板技术,这样可以使得内容的展现分类有序而风格统一,便于用户浏览。
  用户管理和权限控制 为不同级别的用户设定相应的角色和访问权限,并提供单点登录功能,有效整合用户已有的应用系统。

  访问统计和评估反馈 基于系统日志功能,统计单条信息的浏览次数。并提供交互手段,支持用户的评论等反馈交流。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
word如何自动生成目录
企业竞争情报系统(CNKI CIS)
【首页模块】音画欣赏索引
工学博士学位论文 汉语句法歧义消解的统计方法研究
Lucene学习总结之二:Lucene的总体架构
生成目录,需要手动吗?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服