使用 VADER 对股票新闻进行情绪分析

news2024/11/16 11:45:44

什么是情感分析?

提示:情感分析

定义:

  • 情感分析或意见挖掘是自然语言处理 (NLP)的一个子领域,它试图在给定文本中识别和提取意见。情感分析的目的是根据文本中主观性的计算处理来衡量说话者/作者的态度、情绪、评价、态度和情绪。

  • 情感分析是一种机器学习技术,可以检测文本中的极性(例如正面或负面意见),无论是整个文档、段落、句子还是从句。


为什么情感分析如此重要?

提示:重要性

当今的企业严重依赖数据。然而,这些数据中的大部分是来自电子邮件、聊天、社交媒体、调查、文章和文档等来源的非结构化文本。来自Twitter和Facebook的微博内容提出了严峻的挑战,不仅因为涉及的数据量大,还因为它们用于表达情感的语言类型,即短格式、模因和表情符号。

了解人们的情绪对于企业来说至关重要,因为客户能够比以往任何时候都更坦率地表达他们的想法和感受。通过自动分析客户反馈,从调查回复到社交媒体对话,品牌能够认真倾听客户的意见,并定制产品和服务以满足他们的需求。

情感分析对从业者和研究人员也很有用,尤其是在社会学、市场营销、广告、心理学、经济学和政治学等领域,这些领域非常依赖人机交互数据。


为什么有时情绪分析变得难以执行?

提示:执行性
尽管在纸面上看起来很容易,但情感分析实际上是一个棘手的主题。有多种原因:

通过文本理解情绪并不总是那么容易。有时甚至人类也会被误导,因此期望计算机 100% 的准确度就像要求一些完全不可能的东西。
计算机不太擅长理解修辞。比喻语言以偏离其通常接受的定义的方式使用单词,以传达更复杂的含义或增强的效果。使用明喻、隐喻等都符合比喻性演讲的条件。让我们通过一个例子更好地理解它。


歧义:

“关于这部电影,我能说的最好的就是它很有趣。
在这里, “有趣”这个词并不一定能传达积极的情绪,而且可能会让算法感到困惑。

在 Twitter 和 Facebook 等社交媒体文本中大量使用具有情感价值的表情符号和俚语也使文本分析变得困难。例如,“😃”表示笑脸,通常表示积极的情绪,而“😦”则表示另一方面的消极情绪。此外,“LOL”、“OMG”等首字母缩略词和“Nah”等常用俚语, “meh”、“giggly”等也是句子中某种情绪的有力指标。

维德情绪分析

VADER( Valence Aware Dictionary and sEntiment Reasoner)是一种基于词典和规则的情绪分析工具,专门针对社交媒体中表达的情绪。VADER 使用的组合 情感词典是词汇特征(例如,单词)的列表,这些特征通常根据其语义方向标记为正面或负面。

人们发现 VADER 在处理社交媒体文本、纽约时报社论、电影评论和产品评论时非常成功。这是因为 VADER 不仅告诉我们积极性和消极性分数,还告诉我们情绪是积极还是消极的程度。

使用 VADER 的优势
与传统的情感分析方法相比,VADER 具有很多优势,包括:

它不会受到速度与性能权衡的严重影响。

  • 它在社交媒体类型的文本上效果非常好,但很容易推广到多个领域
  • 它不需要任何训练数据,而是根据可概括的、基于效价的、人工策划的黄金标准情感词典构建的
  • 它足够快,可以在线使用流数据,并且它不会受到速度与性能权衡的严重影响。

让我们从代码开始:
导入我们的情感分析所需的库
在这里插入图片描述
2. 用 BeautifulSoup 解析 Finviz 文章数据
在这里插入图片描述

  1. 用 Pandas 操作文章数据
    在这里插入图片描述
  2. 解析所有代码的数据(Amazon、Google、Face Book)
    在这里插入图片描述
  3. 对文章标题应用情感分析
    在这里插入图片描述7. 我们项目的最佳部分是使用 MatPlotLib 进行情感分析可视化
    在这里插入图片描述

在这里插入图片描述
github 存储库中找到。
https://github.com/akash-ranjan8/SENTIMENT_ANALYSIS_OF_STOCK_NEWS

参考:https://medium.com/backyard-programmers/sentiment-analysis-of-stock-news-using-vader-5ba554d7cc19

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/83220.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

WIN10 共享文件夹并取消密码访问

目录 一、前言 二、共享文件过程 1、选择需要共享的文件夹右键-授予访问权限-特定用户 2、选择共享用户Everyone并点击添加 3、再点击右下角共享,一个共享目录就生成了 4、但是别人访问还需要提供密码,非常不方便,此时需要关闭密码 一、…

DataHub Docker安装 PostreSQL元数据集成

install docker & docker-compose,包括docker-compose升级 curl -L https://github.com/docker/compose/releases/download/v2.14.0/docker-compose-uname -s-uname -m-o /usr/local/bin/docker-compose install jq wget http://dl.fedoraproject.org/pub/epel…

前端大文件上传及切片上传-提升上传效率

一、使用场景: 1.大文件上传 2.网络环境环境不好,存在需要重传风险的场景 二、名词解释: 切片上传:也叫分片上传,就是将所要上传的文件,按照一定的大小,将整个文件分隔成多个数据块来进行分…

【Docker】Docker如何构建自己的镜像?从镜像构建到推送远程镜像仓库图文教程

专栏往期文章 《Docker是什么?Docker从介绍到Linux安装图文详细教程》《30条Docker常用命令图文举例总结》 本期目录专栏往期文章1. 构建镜像2. 本地镜像发布到公有云3. 本地镜像发布到私有云1. 构建镜像 提交构建镜像的命令如下: $ docker commit -m…

大二学生《web课程设计》中华英雄人物介绍袁隆平HTML+CSS+JavaScript(期末考核大作业)

🎉精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业…

2021年网络安全省赛--服务器内部信息获取解析(中职组)

2021年省赛服务器内部信息获取解析 任务环境说明:Linux20210510 服务器场景操作系统:未知 (关闭连接) 服务器场景操作系统:Linux(封闭靶机) 用户名:test密码:123456 1.收集服务器场景中的服务信息。并获取服务器中开放的端口号信息,将服务器端口号作为flag提交…

GCN解读并附数据处理代码

此文GCN不是之前提到的lightGCN,而是真正的GCN图卷积,这个问题源于paper分类,同样是GAT所用的数据,其中paper之前的引用关系构成了图的边信息,之所以称之为半监督,并不是因为部分paper没有label及embedding信息&#x…

Nacos--命名空间、分组、ID的概念及用法

原文网址:Nacos--命名空间、分组、ID的概念及用法_IT利刃出鞘的博客-CSDN博客 简介 本文介绍Nacos的命名空间、分组、ID的概念及用法。 Nacos通过命名空间(Namespace)分组(Group)应用(Data ID或Name&#…

在Maix duino开发板上实现LED闪烁

文章目录简单介绍编程实现效果展示后简单介绍 如果你还不知道如何点亮LED,请看:点亮LED 今天开始上手在开发板上运行程序了,学习点亮LED灯就像是学习编程语言的Hello,worldHello, worldHello,world。学会电亮一盏LED灯之后,我便…

深度学习中计算量和参数量介绍、实现代码、例子

计算量 参数量 模型内存前言1 计算量和参数量2 统计计算量、参数量和模型内存3 源码分享3.1 thop实现3.2 ptflops实现pytorch_model_summary实现各层参数量统计4 总结前言 理清FLOPS和FLOPs,大写S代表的是显卡的运算性能,小写s代表的是模型的运算次数&a…

异构混排在vivo互联网的技术实践

作者:vivo 互联网算法团队- Shen Jiyi 本文根据沈技毅老师在“2022 vivo开发者大会"现场演讲内容整理而成。 混排层负责将多个异构队列的结果如广告、游戏、自然量等进行融合,需要在上下游和业务多重限制下取得最优解,相对复杂和难以控制…

基于外业移动端GIS+CAD在工程行业中的应用

摘要: 本文以广东九建某某高校施工项目前期准备和施工验证工作为依托,以图新地球精准导入CAD为研究对象,总结了一套相对成熟且完善的应用技术。该应用技术能在实际地形和现状数据中迅速找到施工点的大致位置,为前期工程勘测争取足…

【云原生消息中间件】RocketMQ消费者启动(consumer start)流程

目录 一、前言 二、消费者启动(consumer start)流程 1、RocketMQPushConsumer初始化 1.1、InitializingBean的afterPropertiesSet() 实现 1.2、RocketMQPushConsumer初始化 2、DefaultMQPushConsumer#start()逻辑 3、defaultMQPushConsumerImpl.start()逻辑 3.1、预设置…

哈希表题目:“气球”的最大数量

文章目录题目标题和出处难度题目描述要求示例数据范围解法思路和算法代码复杂度分析题目 标题和出处 标题:“气球”的最大数量 出处:1189. “气球”的最大数量 难度 2 级 题目描述 要求 给你一个字符串 text\texttt{text}text,你需要…

无线通信信号传输模型

1. 概述 在移动通信网的规划阶段和网络优化期间,最重要的传播问题是路径损耗,它代表大尺度传播特性,具有幂定律的传播特征。路径损耗是移动通信系统规划设计的一个重要依据,对蜂窝设计中的覆盖范围、信噪比、远近效应都有影响。因…

css色彩主题适配思路

网站主题,之前一直考虑的是通过替换css文件来实现,这种方式虽然可以,但不够方便。毕竟要写两套css主题,需要花费足够多的时间来适配。 后来琢磨出了一点东西出来,发现通过修改root里的css变量来实现,比较优…

计算机研究生就业方向之去银行券商信息技术部门

我一直跟学生们说你考计算机的研究生之前一定要想好你想干什么,如果你只是转码,那么你不一定要考研,至少以下几个职位研究生是没有啥优势的: 1,软件测试工程师(培训一下就行) 2,前…

NR HARQ(一)概述

HARQ是MAC层的快速重传机制,5G部分HARQ相关内容分布在38.331,38.321,38.213,38.214,38.212,38.211等spec中,这篇仅仅针对NR HARQ 进行简单的概括梳理。 NR中上下行HARQ均为异步HARQ;NR中每个HARQ反馈信息可以针对一个上/下行 TB块&#xff0c…

PDF文件怎么打印?分享两种打印方法

如何将PDF文件打印出来呢?大家在使用PDF文件的时候,在确定一份文件没有问题的时候,会选择将文件打印出来使用,有很多小伙伴身边有打印设备,但是不知道怎么打印,今天小编给大家分享两种打印方法,…

Resolution-robust Large Mask Inpainting with Fourier Convolutions 阅读笔记

基于傅里叶卷积的鲁棒分辨率大Mask修补 WACV 2022 论文链接 代码链接 图1:本文提出的方法可成功修复大区域,并很好处理具有复杂重复结构的图像。该方法在256256低分辨率下训练也能泛化到高分辨率图像上。 摘要: 现代图像修复技术主要受阻于大…