打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
在线词频、语义、情感分析工具

根据之前在@数据化管理 微博那里看到的一些在线效率工具,来试用一下。首先就从在线词频、语义、情感分析工具开始吧。@数据化管理 推荐了三个网站,分别是图悦、大数据搜索与挖掘平台和腾讯文智。以新浪微博“英国公投决定脱欧 新浪正实时解读”的直播页面为试用对象,地址为http://live.sina.com.cn/zt/l/v/news/ygtogt2016/

①图悦:http://www.picdata.cn/

初始页面背景是黑色的,看着不舒服,页面换肤后变成白底还可以接受。

左边文本栏可输入待分析的文本,也可以直接复制链接,很人性化。贴入要分析的网页地址,点击分析出图,右边就获得了分析结果。、

结果显示有多种模式,下面截图显示的是默认的热词权重图-标准模式。热词词频图是每个热词后面带括号显示词频,比较乱,不好看。微信模式是圆形的显示框变成扁椭圆式,地图模式是显示框为中国地图的轮廓。可以导出EXCEL,列明分析出来的关键词、词频和权重。

  

②大数据搜索与挖掘平台:http://ictclas.nlpir.org/nlpir/

看上去功能比较强大,同样可以输入网页URL进行文本抓取。分析结果分为多个板块:

分词标注:可以对词语的词性进行分类分析,发现新词

实体抽取:对文本的实体类型和实体内容进行分析,下图是图表效果,●代表实体类型,●代表实体内容。另外还有文本效果,内容是一样的,效果不如这个好看,就不截图了。

词频统计:按照名词、动词、形容词分类显示词频,有柱状图和折线图两类图表,鼠标停留在某个词上会显示词频数量。

文本分类:似乎是对文本所讨论的问题进行归类,猜哒。

情感分析:不太明确是啥意思 --,什么叫正面,什么又叫负面呢,特定人物又是谁?

 

关键词提取:有两种模式,一是图表,二是文本。图表是个动态图,鼠标放上去的时候会不停的转动,所以看到的文字大小不代表权重。

Word2vec:似乎是分析词的相关性的,有两种模式,一是力导向布局图,二是和弦图

依存文法:看不懂简繁转换:不解释自动注音:不解释

摘要提取:所分析的网页本身就有事件简介,所以看不出太多,下文中到“脱欧派取得胜利”是原来的简介,后面两句是根据后续的消息自己补上的??

英国公投决定脱欧新浪正实时解读_直播_新闻中心_新浪网时间:2016062211:26直播已进行3小时12分简介自1973年加入欧盟前身欧共体后,英国姓“欧”已43年,624日,英国全民公投,根据投票结果,脱欧派取得胜利。目前请愿签名已快接近100万。有日本媒体称,日方担心英国离开了欧盟将向中国靠近,这会给日本带来压力。

③腾讯文智:http://nlp.qq.com/semantic.cgi

看起来是个试用版,只是提供产品体验的。分为词法类分析、句法类分析、篇章类分析、下载类分析。

词法类分析--分析结果就是把句子拆解成词语进行词性标注。

句法类分析--对句子的词性分析基础上,继续分析主谓宾定状补的句子结构。

篇章类分析--有内容分类、情感分析、关键字分析。下图是对上面那段摘要提取的分析。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
NLPIR大数据搜索与挖掘共享平台
关于文本舆情数据的6个分析方法
用Python做自然语言处理,你不知道这8个工具就Out了
大数据时代舆情的内涵与分析方法
干货:详解《十九大的大数据语义分析报告》分析过程 – NLPIR自然语言处理与信息检索共享平台
自然语言处理简介
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服