情感分析讲解

news2024/11/16 23:41:23

情感分析简述

情感分析(Sentiment Analysis)又称倾向性分析,或意见挖掘,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。利用情感分析能力,可以针对带有主观描述的自然语言文本,自动判断该文本的情感正负倾向并给出相应的结果。在评论分析与决策、电商评论分类以及舆情监控中有非常广泛的应用。

通常情感识别依据所处理文本的级别分为以下三类:

文本级别:通过完整文档或段落来获取情绪;
句子级别:获得单句的情绪。
子句级别:获得句子中,子表达的情感。

情感字典方法

下面是词典中的部分情感词,词后面的数字代表其情感正负程度。比如"fuck"是负向情感词,其情感值是"-6.70400012637"。再比如"好赞"是正向情感词,其情感值是"4.03663526"。情感词及其极性可以由人工搜集标注,也可以由算法挖掘。

最尼玛 -6.70400012637
扰民 -6.49756445867
fuck... -6.32963390433
Fxxk -5.87247473641
MLP -5.87247473641
吃哑巴亏 -5.77120419579
IAQI -5.77107837123
太好 1.51096421722
好赞 4.03663526827

文本分词

原句: 真是太差劲了!
分词: 真是太/差劲/了/!

情感计算

查询情感词典,累加每个词的情感值。

0[词典中没有’真是太’,默认为0]-2.76814873241[“差劲”]+0[“了”]=-2.76814873241

因此"真是太差劲了!"的情感极性为负向

考虑程度副词

原句:这个游戏不是太好玩。

分词:这个/游戏/不是/太好玩/。

按照上面的算法,如果仅仅考虑"太好玩",原句的情感是正向的,显然这是不对的,主要是由于忽略了情感词(太好玩)前面的程度副词(不是)。由于程度副词是对情感词情感极性的加强,所以最终的情感值可以通过程度副词的程度值(正值表示加强,负值表示否定)乘以情感词的情感值。

还是上面的例子,“太好玩(+2)” * “不是(-1)” = -1 ,原句的情感极性为"-2"。

情感词:是主体对某一客体表示内在评价的词语,带有强烈的感情色彩。
程度副词:本身没有情感倾向,但能够增强或减弱情感强度
否定词:本身也没有情感倾向,但能改变情感的极性
停用词:完全没有用或者没有意义的词

基于依存句法的规则方法

前面所讲的基于情感词典的方法只是简单的匹配,而实际的语言是复杂的非线性系统。一种改进的思路是利用句法分析技术将文本解析成结构化的语法树,然后依据规则从中提取感兴趣的内容。句法分析是根据给定的语法体系,自动推导出句子的句子结构,分析句子包含的句法单元及其之间关系,并转化为结构化的句法分析树。
在这里插入图片描述
其中,ADV->状中结构,ATT->定中关系,HED->核心关系,RAD->右附加关系。除此之外,在NLP中依存句法分析是更加常见的句法分析技术。
在这里插入图片描述
在这里插入图片描述 根结点指向"棒",表明"棒"是整个句子的核心。以"棒"为起点的各边指向的句子成分,分别以某种"依赖关系"依赖于核心词"棒"。因此以核心词为线索可以解析出句子的语法结构,进一步依据"预定义的规则"抽取出评论文本中的依存情感单元,包括评论对象、情感词、否定词、程度副词等。

1).否定词修饰情感词

否定词修饰情感词会改变情感倾向,如"不喜欢"这个短语 中,“不"作为否定词修饰"欢”。

2).程度词修饰情感词

程度词修饰情感词会改变情感强度,如"太棒" 短语中,“太"作为程度词修饰"喜欢”。

3).否定词修饰否定词

否定词修饰否定词即为双重否定,一般情况下不影响原来的情感倾向,对于情感程度的影响需要具体分析依存关系。如"不是不喜欢"中,第一个"不"作为否定词修饰了"是",后面的"不喜欢"和"是"是动宾关系。

4).否定词修饰程度词

否定词修饰程度词相当于对程度的否定,而非情感的否定,因此否定词修饰后,最终情感倾向未变,但是程度有所降低。如"不很喜欢"中,“不"修饰了"很”,然后才是"很"修饰"喜欢"。"很"作为程度词表现了一种情感等级的加强,但是“不”作 为否定词对“很”这个程度词的否定使得最终的强度有一定的削减。"不很喜欢"这个情感短语仍然表现了"喜欢"这种情感类 别,但是在强度上强于"喜欢"这个情感词,弱于"很喜欢"这个情感短语。

5).程度词修饰否定词

程度词修饰否定词相当于给否定加个强度,因为否定本身无强度可言,最终的强度会随否定词一起携带到情感词上。如 “很不喜欢"中,“很"修饰"不”,然后才是"不"修饰"喜欢”。因此,“很不喜欢"在情感类别上是"厌恶”,在强度 上比"不喜欢"更强,和"很喜欢"强度一致。

6).程度词修饰程度词

程度词修饰程度相当于程度的叠加。多用于微博等非正式语料中,此类表达方式多用于表现强烈情感。如"非常极其喜欢"中,“非常"修饰"极其”,然后是"极其"修饰"喜欢"。对于此类的表述,其情感强度相比于"非常喜欢"和"极其喜欢"都要强一些。

Attention机制

Attention机制通俗的说,对于某个时刻的输出y,它在输入x上各个部分上的注意力,这里的注意力也就是权重,即输入x的各个部分对某时刻输入y贡献的权重。具体的在情感识别任务中,原句中每个Word对情感类别的影响是不同的。
在这里插入图片描述

HAN模型

层次注意力网络。对文档/较长文本进行分类的时候,仅仅对word粒度进行Attention是不够的,还需要对各个句子(短句)进行Attention的学习,不同句子也需要分配不同的权重,每个句子里的词语也分配不同的权重。网络结构如下图所示:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/506780.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MongoDB 聚合操作Map-Reduce

这此之前已经对MongoDB中的一些聚合操作进行了详细的介绍,主要介绍了聚合方法和聚合管道;如果您想对聚合方法和聚合管道进行了解,可以参考: MongoDB 数据库操作汇总https://blog.csdn.net/m1729339749/article/details/130086022…

ClickHouse为何能超越Elasticsearch?

背景 Elasticsearch是一个强大的分布式全文检索和数据分析引擎,也是日志分析系统经常使用的一种实现方案,但近年来随着ClickHouse的发展,Elasticsearch在日志分析领域的地位逐渐被取代,许多公司已经将自己的日志分析解决方案从ES…

games101作业1

作业1的大致要求就是让我们实现如下两个函数,一个是返回在三维空间中绕着Z轴旋转的矩阵,另一个是返回投影矩阵。正确完成这两个函数之后,运行代码你就会在窗口中看到一个三角形,并且按a键和d键会发生旋转。 首先来实现get_model_m…

RuleApp1.4.0 文章社区客户端

简介: 可以打包成安卓,苹果,h5,小程序,全新的版本增加了私聊和群聊,动态模块等,还有自动和手动封禁机制。[滑稽][滑稽]主要模块:用户模块,文章模块,动态模块…

国产服务器tomcat开机自启

目录结构 前言方法一方法二方法三参考连接 前言 国产服务器配置tomcat开机自启动;目前测试两种服务器 银河麒麟(Linux localhost.localdomain 4.19.90-52.22.v2207.ky10.x86_64 #1 SMP Tue Mar 14 12:19:10 CST 2023 x86_64 x86_64 x86_64 GNU/Linux&am…

多模态速读:ViLT、ALBEF、VLMO、BLIP

ViLT : Vision-and-Language Transformer Without Convolution or Region Supervision ViLT : Vision-and-Language Transformer Without Convolution or Region SupervisionIntroductionApproach参考 ALBEF: Vision and LanguageRepresentation Learning with Momentum Distil…

如何在香港服务器上进行网站迁移?五个主要步骤

​  服务器迁移是将大量关键信息从一台服务器移动到另一台服务器的过程,同时确保新服务器已正确配置以承载这些新信息。对于业务涉及中国大陆、香港及亚太区地区往来的用户,您可能需要将网站迁移到香港服务器上,来更好地发展业务。香港服务…

【c语言】字符串常用函数组件化封装 | 字符串总结

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; &#x1f525;c语言系列专栏&#xff1a;c语言之路重点知识整合 &#x…

【JavaScript】9.事件

事件 1. 注册事件&#xff08;绑定事件&#xff09; 给元素添加事件&#xff0c;称为注册事件或者绑定事件 1.1 注册事件两种方式 传统注册方式&#xff08;onclick&#xff09; 传统方式注册事件特点&#xff1a; 注册事件的唯一性同一个元素同一个事件只能设置一个处理函数…

离了大谱,公司测试岗却新来了个00后卷王,3个月薪资干到20K.....

最近聊到软件测试的行业内卷&#xff0c;越来越多的转行和大学生进入测试行业。想要获得更好的待遇和机会&#xff0c;不断提升自己的技能栈成了测试老人迫在眉睫的问题。 不论是面试哪个级别的测试工程师&#xff0c;面试官都会问一句“会编程吗&#xff1f;有没有自动化测试…

spring-web HandlerAdapter 源码分析

说明 本文基于 jdk 8, spring-framework 5.2.x 编写。author JellyfishMIX - github / blog.jellyfishmix.comLICENSE GPL-2.0 HandlerAdapter 接口 提供作为处理器适配器的能力。 supports 方法判断是否支持该 handler。 public interface HandlerAdapter {/*** 判断是否…

【跟着陈七一起学C语言】今天总结:初识C语言

友情链接&#xff1a;专栏地址 知识总结顺序参考C Primer Plus&#xff08;第六版&#xff09;和谭浩强老师的C程序设计&#xff08;第五版&#xff09;等&#xff0c;内容以书中为标准&#xff0c;同时参考其它各类书籍以及优质文章&#xff0c;以至减少知识点上的错误&#x…

Ansys Zemax | 设计抬头显示器时要使用哪些工具 – 第二部分

本文为使用OpticStudio工具设计优化HUD抬头显示器系统的第二部分&#xff0c;主要包含演示了如何使用OpticStudio工具设计分析抬头显示器&#xff08;HUD&#xff09;性能&#xff0c;即全视场像差&#xff08;FFA&#xff09;和NSC矢高图。&#xff08;联系我们获取文章附件&a…

RabbitMQ之工作队列 ( Work Queues )

Work Queues 1. 轮询分发消息1.1 抽取工具类1.2 启动两个工作线程1.3 启动一个发送线程1.4 结果展示 2. 消息应答2.1 概念2.2 自动应答2.3 消息应答的方法2.4 Multiple 的解释2.5 消息自动重新入队2.6 消息手动应答代码2.7 手动应答效果演示 3. RabbitMQ 持久化3.1 概念3.2 队列…

逍遥自在学C语言 | 条件控制的正确使用姿势

前言 在C语言中&#xff0c;有三种条件判断结构&#xff1a;if语句、if-else语句和switch语句。 一、人物简介 第一位闪亮登场&#xff0c;有请今后会一直教我们C语言的老师 —— 自在。 第二位上场的是和我们一起学习的小白程序猿 —— 逍遥。 二、if语句 基本语法 if (条…

大厂过来人忠告:学java有没有前途?想转行应该准备什么?

对于想转行学习java来人说&#xff0c;最可怕的问题就是信息闭塞。很多人开始的时候都是因为没能了解清楚情况&#xff0c;找不到学习思路&#xff0c;胡乱下手学习一通其实效果并不好&#xff0c;只是感动了自己&#xff0c;没有太大成效。毕竟时间这么宝贵&#xff0c;你也不…

ThingsBoard教程(四十):规则节点解析 计算增量节点 Calculate delta

本篇文章介绍一个ThingsBoard 规则引擎中的一个节点,Calculate delta Calculate delta 计算增量 该节点可以在规则中获取上一次遥测的值,以此可以实现二次遥测的差。比如一个设备,一天上传一次数据,如果你要对比今天和昨天的数据,并将两者数据差保存到数据库,就能够使用…

三子棋游戏的实现(C语言)

三子棋游戏的实现&#xff0c;在这里我们要求满足&#xff1a; 游戏不退出&#xff0c;继续下一把&#xff08;循环&#xff09;用多文件的形式实现&#xff0c;如下&#xff1a; 用game.h文件存放函数的声明并包含需要的头文件用game.c文件存放各个函数的具体实现用test.c文件…

【Linux】Keepalived+Haproxy实现数据库集群负载均衡

1、简介&#xff1a; 本文章的负载均衡和高可用是体现在两个从服务器上的。一般来说高可用是用在主服务器中的&#xff0c;例如双主多从的结构&#xff0c;双主做keepalived的高可用&#xff08;当然也可以加上haproxy做负载均衡&#xff09;&#xff0c;多从做haproxy的负载均…

微盟餐饮SaaS蜕变时刻:战略投资奥琦玮,领军之势已成

从火爆了整个春天的淄博烧烤&#xff0c;到“五一”人山人海的全国各地核心商圈&#xff0c;餐饮业热度狂飙不止。餐饮SaaS领域&#xff0c;大事件也在发生。 5月8日&#xff0c;微盟集团&#xff08;2013.HK&#xff09;宣布以“资产现金”方式&#xff0c;向餐饮行业数字化服…