什么是情感分析?
提示:情感分析
定义:
-
情感分析或意见挖掘是自然语言处理 (NLP)的一个子领域,它试图在给定文本中识别和提取意见。情感分析的目的是根据文本中主观性的计算处理来衡量说话者/作者的态度、情绪、评价、态度和情绪。
-
情感分析是一种机器学习技术,可以检测文本中的极性(例如正面或负面意见),无论是整个文档、段落、句子还是从句。
为什么情感分析如此重要?
提示:重要性
当今的企业严重依赖数据。然而,这些数据中的大部分是来自电子邮件、聊天、社交媒体、调查、文章和文档等来源的非结构化文本。来自Twitter和Facebook的微博内容提出了严峻的挑战,不仅因为涉及的数据量大,还因为它们用于表达情感的语言类型,即短格式、模因和表情符号。
了解人们的情绪对于企业来说至关重要,因为客户能够比以往任何时候都更坦率地表达他们的想法和感受。通过自动分析客户反馈,从调查回复到社交媒体对话,品牌能够认真倾听客户的意见,并定制产品和服务以满足他们的需求。
情感分析对从业者和研究人员也很有用,尤其是在社会学、市场营销、广告、心理学、经济学和政治学等领域,这些领域非常依赖人机交互数据。
为什么有时情绪分析变得难以执行?
提示:执行性
尽管在纸面上看起来很容易,但情感分析实际上是一个棘手的主题。有多种原因:
通过文本理解情绪并不总是那么容易。有时甚至人类也会被误导,因此期望计算机 100% 的准确度就像要求一些完全不可能的东西。
计算机不太擅长理解修辞。比喻语言以偏离其通常接受的定义的方式使用单词,以传达更复杂的含义或增强的效果。使用明喻、隐喻等都符合比喻性演讲的条件。让我们通过一个例子更好地理解它。
歧义:
“关于这部电影,我能说的最好的就是它很有趣。
在这里, “有趣”这个词并不一定能传达积极的情绪,而且可能会让算法感到困惑。
在 Twitter 和 Facebook 等社交媒体文本中大量使用具有情感价值的表情符号和俚语也使文本分析变得困难。例如,“😃”表示笑脸,通常表示积极的情绪,而“😦”则表示另一方面的消极情绪。此外,“LOL”、“OMG”等首字母缩略词和“Nah”等常用俚语, “meh”、“giggly”等也是句子中某种情绪的有力指标。
维德情绪分析
VADER( Valence Aware Dictionary and sEntiment Reasoner)是一种基于词典和规则的情绪分析工具,专门针对社交媒体中表达的情绪。VADER 使用的组合 情感词典是词汇特征(例如,单词)的列表,这些特征通常根据其语义方向标记为正面或负面。
人们发现 VADER 在处理社交媒体文本、纽约时报社论、电影评论和产品评论时非常成功。这是因为 VADER 不仅告诉我们积极性和消极性分数,还告诉我们情绪是积极还是消极的程度。
使用 VADER 的优势
与传统的情感分析方法相比,VADER 具有很多优势,包括:
它不会受到速度与性能权衡的严重影响。
- 它在社交媒体类型的文本上效果非常好,但很容易推广到多个领域
- 它不需要任何训练数据,而是根据可概括的、基于效价的、人工策划的黄金标准情感词典构建的
- 它足够快,可以在线使用流数据,并且它不会受到速度与性能权衡的严重影响。
让我们从代码开始:
导入我们的情感分析所需的库
2. 用 BeautifulSoup 解析 Finviz 文章数据
- 用 Pandas 操作文章数据
- 解析所有代码的数据(Amazon、Google、Face Book)
- 对文章标题应用情感分析
7. 我们项目的最佳部分是使用 MatPlotLib 进行情感分析可视化
github 存储库中找到。
https://github.com/akash-ranjan8/SENTIMENT_ANALYSIS_OF_STOCK_NEWS
参考:https://medium.com/backyard-programmers/sentiment-analysis-of-stock-news-using-vader-5ba554d7cc19