打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
黄河连线专访丨刘康:如何用计算机“读懂”人类情感?



导读

随着社交媒体,如论坛、博客、微博等的发展,使得在世界各地的人们可以随时分享、评论或讨论任何话题成为了可能。在社会媒体文本中表达的意见、情绪和情感就成为对社会和经济具有较高价值的文本。挖掘这些文本中的“潜台词”就要用到情感分析这一技术。通过情感分析,可以看出商品的优缺点,可以预测某国大选,也可以让机器人能听懂人说的话。那么情感分析究竟如何做到的呢?黄河连线特此采访了知名情感分析专家,中国科学院自动化研究所模式识别国家重点实验室成员刘康,以下为采访实录:



情感分析如何理解用户的“意图”


1.什么是情感分析?能否结合一个案例解释一下。


刘康:情感分析本身是从用户的各模态输入中识别其表达出的情感或情绪。从广义上来说,情感分析需要从各种数据,如文本、视频、图像、语音里识别其中所蕴含的情感。我自己的研究方向是自然语言理解,从我的研究角度来看,情感分析是一个研究如何从文本中识别用户所表达出来的情感和情绪的任务。

 

从文本中识别用户的情感和情绪,不仅要识别用户的情感状态,是褒义还是贬义、是悲伤还是喜悦,更重要的是希望从文本中挖掘有用的观点信息,其中涉及的内容非常多,如如何抽取识别用户观点的倾向性,以及倾向性蕴含的强度,同时需要抽取与观点相关的要素,如观点持有者、评价的主体等。

 


举个例子,我们可以在各大购物网站上可以看到用户对于商品评论的文本,比如要购买一部手机或是选择某个餐厅吃饭时,我们都会看一下关于手机或餐厅的用户评论信息。情感分析在针对用户评论方面,需要从用户评论中判别出已经购买该商品的用户的观点和意见。例如在针对餐厅的评论中,会有菜名和相关的评价词,比如“停车不太方便”中“不方便”就是一个情感词、“菜不好吃”中“不好吃”就是另一个情感词,我们需要用自动的方法把这些评价词提取出来,判别其倾向性,同时抽取用户评价的对象,例如“菜”、“停车”,从而对于用户评论进行细粒度的分析。

 

总而言之,情感分析涉及到了自然语言处理的各个子任务,是自然语言处理领域的基础任务。

 

2.您刚才说到,情感分析需要有一个分析来源,也就是观点挖掘和情感分析需要大量的文本进作为分析数据,这些数据的获取渠道有哪些?


刘康:用计算机进行情感分析和观点挖掘,需要一些有标注的数据,即人告诉计算机一些词的情感程度是怎样的。对于普通的数据,我们可以获取的渠道有很多,包括微博、微信、产品的评论、新闻数据等等,关键是怎么获取标注的数据这样才能计算机能够学习到与、段落、篇章对应的情感,进而发现情感信息表达各种方式和规律。总体来说,可以获得的文本内容和渠道还是有很多的,关键是如何获得高质量的标注文本。

 

现在的标注数据的获取渠道有两个:第一是人工标注,第二是从网站或者社交平台上获取一些原有的标注,比如用户在评论时会写一段文本,在评论时会同时打分或是标注星级,一般认为五星是褒义的情感,一星就是贬义的情感。再如,用户在微博上写了一段文字,然后加一个表情,笑脸可能就是褒义的情感,哭脸就是贬义的情感。

 


3.人的情感与机器不同,对某些事物的喜爱程度不一样,比如“非常好、好、很好”这几个极性,即使人们用了一样的词汇,每个人的喜爱程度也会有偏差。这又是如何分析匹配的?


刘康:大部分用户在评价某一事物时,会用“特别好”、“非常好”这类词语并且给其打一个非常高的分数或者星级,而“一般”、“好”这些强度略低的词语和分数比较低会有很大的相关性。基于这样的统计,我们会统计出不同强度的评价词语,然后给这词语打上不同强度的信息。

 

这种强度的表达具有很大的主观性,比如性格比较内敛的人不太习惯用强度很大的词语,而性格外向的人就会用“赞”这类情感强度明显的词表达。人们的用词习惯会在很大程度上影响情感分析的结果,使情感分析成为了一项非常有主观性的工作,而且难度也非常大。

 

总体上讲,情感分析的准确度是比较高的。在一个限定领域内,对单个用户而言,准确度可以达到80%—90%,但是在一个开放的领域内,尤其是用户特别多的情况下,准确度可能70%甚至更低。

 

情感分析让社会更“智能”


4.中文因其语言背景的丰富性和词语的多边形被称为世界上最难的语言之一,同英语相比,现在中文领域的观点挖掘与情感分析发展状况如何?


刘康:中文不止在情感分析方面,在其他自然语言处理任务中,和英语相比,技术的发展是并行的。也就是说,目前来看,中英文语言分析在技术层面上不会有太大的区别。但是从准确性上来说,目前中文的处理效果和英文还是有一定的差距的。这个不是处理方法、技术的问题,而是因为中文是一种意合语言,语法结构更加的松散,在实际表达中并不拘泥于一定的语法,所以没有语法结构的约束,导致中文在处理上比英文要难很多,结果准确性也低一些。

 


其次,中文还有一些特别的语言现象,如成语、歇后语、古文等,都可以表达各种情感,现在还没有一个特别好的方法对这些语言现象做处理。但是现在在中文领域,各个研究团队都在努力提高着中文分析的准确度,也进行了多次相对应的情感分析评测。

 

5.目前观点挖掘与情感分析应用的准确性如何?例如之前通过对 Twitter 用户的情感分析,来预测股票走势、预测电影票房、选举结果等,这些准确度如何?是否可信?

 

刘康:美国利用Twitter上的用户评价再通过情感分析的方法进行大选预测,奥巴马在任时期就已经有人做过了。虽然现在情感分析技术准确性还不能达到100%,但是对于全美Twitter用户的观点分析,大体上还是可以分析出总体走势的。但是这样的方法较为适用于整体型、宏观型的判断,在微观层面的处理就不一定很准确了。比如在股票预测,尤其是个股方面,效果还是非常不好的,在某一电影的票房预测上也是一样。

 

6.目前的情感分析大多基于已有文本。比如情侣吵架,女方故意说了气话,情感分析能不能结合上下文的关系,分析出女方的潜台词?


刘康:目前的技术可以从文本中分析出显性表达的情感,比如“我生气了”、“你真讨厌”,这是可以很容易分析出来的。但是中文里讽刺、比喻等隐性的语言现象,在分析上会遇到很大的困难。

 


在很多情况下,如果一句话里没有情感表达词语,人理解起来不会有难度,但是对于依托标注性情感词分析文本的计算机,就存在很大的难度。比如情侣之间的对话,女方说:“我一会儿到地铁站,我到了你就等着,我到了你还没到你就等着!”这类语言,有很多情感是通过非情感词表达出来的,我们统称这种情感表达为隐式情感表达。目前的情感分析对这种情感表达的分析还存在很大的问题。另外,情感的表达还与文本的上下文、环境领域密切相关,给情感分析带来更大的技术要求

 

7.现在出现了一些“情感机器人”,可以通过判断人类的语言、语调等,“读”出人类情感,甚至还有机器人获得了公民身份。在这些机器人的背后,情感分析技术功不可没,您怎么看待这个现象?


刘康:将情感分析技术应用到情感机器人上,这是一个大的趋势,情感机器人在和人的交互中,一定会涉及与人情感的交流。以我的研究领域来说,我们是基于从文本中获取情感和观点,在情感机器人中,不仅需要文本的分析,还存在语音、语调、表情等多模态的判别。我个人的观点是,不管哪种模态的分析,目前还都处于研究的阶段,还没有一个完美的解决方案。人工智能对客观性文本的理解尚且存在很多问题,理解主观性文本更是一个任重而道远的任务。但是试图在机器人对话过程中加入情感信息,我个人认为这是一个非常好的方向。

 


当然,除了情感机器人,情感分析和观点挖掘可以运用到的领域还有很多,包括刚才提到的大选预测、购物网站上对商品性能的分析等等。

 

情感分析仍然任重道远

 

8.情感分析的应用离不开底层技术的支撑。就目前而言,观点挖掘与情感分析的难点在哪里?近来又有哪些重大的突破?


刘康:近些年,深度学习技术自然语言处理领域已经得到了广泛的应用,情感分析与观点挖掘应用深度学习,可以提高个别任务上的处理性能。但是总体来说,还没有重大技术的突破。

 

文本的观点挖掘和情感的分析的难点还是在于如何判定各种语言现象的情感分析,不同词语的组合会带来很大的情感变化,对分析会带来很大的挑战,这是目前一个特别难的点。比如“大”形容房子的时候是个褒义词,在“大手大脚”这个成语里,就是一个贬义词了。情感的变化会根据评价对象的不同、使用语境的不同而产生变化,如何判断在不同场景和不同对象中的不同语义,一直都是情感分析的难点所在。

 


9.目前情感分析的难点很多,必然要求更多的人才去攻克。那对于想要学习或者进一步研究情感分析的人而言,需要具备哪些素质?能否结合您的个人研究经历,推荐一下学习路径以及参考资料?


刘康:从文本性情感分析来说,需要有自然语言处理的知识,包括机器学习知识等。除此之外,情感分析还是一个多角度、交叉的方向,包括心理学、社会学,都可以一定程度上帮助情感分析的研究。所以说情感分析是一个以计算机知识为基础,跨学科的研究领域。

 

我个人本科就读于西安电子科技大学,硕士从事模式识别与智能系统学科方向的研究,特别是图像方向的研究。然后到现在的组里攻克博士学位,研究方向是文本情感分析。2010年博士毕业,除了情感分析,还在做与信息抽取相关的工作,包括实体、关系、事件等等。目前是在中国科学院自动化研究所模式识别国家重点实验室一直从事情感分析方面的研究。

 

就个人经历而言,我认为学习这一领域看懂两本书是很有必要的,一是Pang Bo老师曾经写的一有关情感分析的Tutorial,二是美国伊利诺斯芝加哥大学教授刘兵老师的所著的情感分析方面的书籍,这两本书对于了解情感分析研究历史和研究分支等知识,都是非常有帮助的。我自己特别推荐刘兵老师写的、由我们组翻译的《情感分析——挖掘观点、情感和情绪》这本书,这是近些年来在情感分析领域比较好的一本书。



本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
明察秋毫,精准狙击——如何处理阅读中的选择题
ChatGPT的工作原理是什么?
​NLP对人工智能发展的贡献有哪些
自然语言处理技术驱动的情感分析系统:洞察用户真实需求
诗歌鉴赏考点分析、诗歌形象、语言、表达技巧、情感、观点态度..
2023元宇宙趋势二:AI将让元宇宙“活”起来
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服