【计算机情绪分析】十大数据集合集!宝藏合集,速看!

news2024/9/17 9:01:33

本文将为您介绍10个经典、热门的数据集,希望对您在选择适合的数据集时有所帮助。

1

AWARE

  • 发布方:

    Imam Abdulrahman Bin Faisal University·法赫德国王石油与矿产大学

  • 发布时间:

    2021-09-26

  • 简介:

    AWARE 数据集的同行评审论文发表在 ASEW 2021,可通过以下方式访问:http://doi.org/10.1109/ASEW52652.2021.00049。使用 AWARE 数据集时请引用本文。 基于方面的情绪分析 (ABSA) 旨在识别关于特定方面的意见(情绪)。由于缺少注释以支持 ABSA 任务的智能手机应用程序评论数据集,我们提出了 AWARE:ABSA 应用程序评论仓库。 AWARE 包含来自三个不同领域(生产力、社交网络和游戏)的应用评论,因为每个领域都有其不同的功能和受众。每个句子都标注了三个标签,如下所示: 方面术语:存在于句子中的术语,描述了应用程序的一个方面,由情感表达。 “N/A”的术语值意味着该术语没有在句子中明确提及。 方面类别:预定义的一组特定于域的类别,代表应用程序的一个方面(例如,安全性、可用性等)。 情绪:正面或负面。 注意:游戏域不包含方面术语。 我们提供了来自三个领域的 11323 个句子的综合数据集,其中每个句子都附加了一个布尔值注释,表明该句子是否表达了正面/负面意见。此外,我们提供了三个独立的数据集,每个域一个,只包含表达意见的句子。名为“AWARE_metadata.csv”的文件包含数据集列的描述。 如何使用 AWARE? 我们设计了 AWARE,使其可用于服务于各种任务。任务可以是但不限于: 情绪分析。 方面术语提取。 方面类别分类。 方面情绪分析。 显式/隐式方面术语分类。 意见/非意见分类。 此外,研究人员可以试验和调查不同领域对用户反馈的影响。

  • 下载地址:

    hhttps://doi.org/10.5281/zenodo.5528481

  • 论文地址:https://ieeexplore.ieee.org/document/9679823

2

FIQA (Financial Opinion Mining and Question Answering)

  • 发布方:

    曼彻斯特大学·帕绍大学·爱尔兰国立大学

  • 发布时间:

    2018

  • 简介:

    自然语言处理 (NLP) 技术和资源的日益成熟正在极大地改变许多应用程序领域的格局,这些领域依赖于大规模分析非结构化数据。金融领域依赖于对多个非结构化和结构化数据源的解释,以及对快速和全面的决策制定的需求,已经成为NLP,Web挖掘和信息检索 (IR) 技术实验的主要基础。这一挑战的重点是推进金融领域基于方面的情绪分析和基于观点的问题回答的最新技术。

  • 下载地址:

    https://sites.google.com/view/fiqa/

3

CovidET

  • 发布方:

    德克萨斯大学奥斯汀分校·伊利诺伊大学芝加哥分校

  • 发布时间:

    2022

  • 简介:

    我们介绍了CovidET (新型冠状病毒肺炎期间的情绪及其触发因素),这是一个大约1,900篇与新型冠状病毒肺炎相关的英语Reddit帖子的数据集,其中包含感知情绪的手动注释和帖子中描述的触发因素的抽象摘要。我们开发了强大的基线来共同检测情绪并总结情绪触发因素。我们的分析表明,CovidET在特定于情绪的摘要以及长时间社交媒体帖子中的多情绪检测方面提出了新的挑战。

  • 下载地址:

    https://github.com/honglizhan/CovidET

  • 论文地址:

    https://arxiv.org//pdf/2210.12531.pdf

4

HurricaneEmo

  • 发布方:

    伊利诺伊大学芝加哥分校·University of Texas at Austin

  • 发布时间:

    2020

  • 简介:

    HurricaneEmo 是一个情感数据集,其中包含 15,000 条英语推文,跨越三个飓风:哈维、艾尔玛和玛丽亚。自然灾害(例如飓风)每年影响数百万人,并在其后造成广泛的破坏。人们最近开始使用社交媒体网站(例如 Twitter)与更大的社区分享他们的情绪和感受。因此,这些平台已成为大规模理解和感知情绪的工具。在本文中,我们介绍了 HurricaneEmo,这是一个包含 15,000 条英语推文的情感数据集,跨越三个飓风:Harvey、Irma 和 Maria。我们对细粒度情绪进行了全面研究,并提出了分类任务来区分粗粒度情绪组。我们最好的 BERT 模型,即使在利用未标记的 Twitter 数据进行任务引导的预训练之后,也只能达到 68% 的准确率(所有组的平均值)。 HurricaneEmo 不仅作为模型的具有挑战性的基准,而且作为分析以灾难为中心的领域中的情绪的宝贵资源。

  • 下载地址:

    https://github.com/shreydesai/hurricane

  • 论文地址:

    https://arxiv.org/pdf/2004.14299v1.pdf

5

Cross-cultural pop song mood ratings (US, KR, BR)

  • 发布方:

    莱比锡大学·马克斯普朗克人类认知和脑科学研究所·马克斯普朗克经验美学研究所·纽约大学阿布扎比分校

  • 发布时间:

    2021

  • 简介:

    来自 360 首流行歌曲的 8 种情绪的情绪评分来自美国、韩国和巴西的 166 位评分者来自 Spotify 的 MIR 功能

  • 下载地址:

    https://osf.io/3uw9d/

  • 论文地址:https://arxiv.org/pdf/2108.00768v1.pdf

6

DeepGlobe

  • 发布方:

    Facebook·瓦赫宁根大学·数位全球

  • 发布时间:

    2018-03-13

  • 简介:

    我们观察到,与传统图像相比,卫星图像是强大的信息来源,因为它包含更结构化和更统一的数据。尽管计算机视觉社区一直在使用深度学习来完成日常图像数据集上的艰巨任务,但卫星图像直到最近才引起人们对地图和人口分析的关注。该研讨会旨在汇集各种研究人员,以推动卫星图像分析的最新技术。

    为了更多地关注此类方法,我们提出了围绕三种不同卫星图像理解任务的DeepGlobe卫星图像理解挑战。为此竞赛创建和发布的数据集可以作为卫星图像分析未来研究的参考基准。此外,由于挑战任务将涉及经典计算机视觉问题的 “野外” 形式,因此这些数据集有可能成为遥感领域以外的强大视觉算法设计的有价值的测试平台。

  • 下载地址:

    http://deepglobe.org/

  • 论文地址:

    https://arxiv.org/pdf/1805.06561.pdf

7

Legal Case Reports

  • 发布方:

    新南威尔士大学

  • 发布时间:

    2012-10-19

  • 简介:

    法律案件报告是澳大利亚联邦法院案件的数据集,主要用于文本摘要。 该数据集包含所有案例2006年2009年,来源自AustL II,由出版商用来构建实验摘要和引文分析,每个文件包含流星、引文句子、引文标语和引文类别。 该数据集由UNSW计算机科学与工程学院2012年发布,Filippo Galgani为主要出版商。

  • 下载地址:https://archive.ics.uci.edu/ml/datasets/Legal+Case+Reports

  •  论文地址:

    https://link.springer.com/chapter/10.1007/978-3-642-32695-0_6

8

EmoSynth

  • 发布方:

    华盛顿大学·奥格斯堡大学

  • 发布时间:

    2018

  • 简介:

    EmoSynth是144个音频文件的数据集,这些文件已被40个听众标记为其感知的情绪,跨价和唤醒维度。

  • 下载地址:

    https://dagshub.com/kingabzpro/EmoSynth

  • 论文地址:

    https://opus.bibliothek.uni-augsburg.de/opus4/frontdoor/deliver/index/docId/65886/file/65886.pdf

9

DeepFish

  • 发布方:

    不列颠哥伦比亚大学·詹姆斯库克大学·Element AI

  • 发布时间:2020

  • 简介:

    DeepFish 作为具有大规模数据集的基准套件,用于训练和测试多个计算机视觉任务的方法。该数据集包含从热带澳大利亚海洋环境中的 20 个栖息地水下收集的大约 4 万张图像。它包含分类标签以及点级和分割标签,以获得更全面的鱼类分析基准。这些标签使模型能够学习自动监控鱼的数量、识别它们的位置并估计它们的大小。

  • 下载地址:

    https://github.com/alzayats/DeepFish

  •  论文地址:

    https://arxiv.org/pdf/2008.12603v1.pd

10

EPRSTMT

  • 发布方:

    CLUE

  • 发布时间:

    2021-01-01

  • 简介:

    EPRSTMT (EPR-情感) 用于情感分析数据量的电子商务产品评论数据集: 训练集 (32),验证集 (32),公共测试集 (610),测试集 (753),未标记语料库 (19565)

  • 下载地址:

    https://github.com/CLUEbenchmark/FewCLUE

  •  论文地址:

    https://arxiv.org/pdf/2107.07498.pdf

 温馨  小贴士

如有您想了解的计算机方向数据集

请联系我们

免费为您提供数据集搜索服务

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1963465.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Maven实战.插件

文章目录 插件目标插件绑定内置绑定自定义绑定 插件配置命令行插件配置POM中插件全局配置POM中插件任务配置 插件目标 在进一步详述插件和生命周期的绑定关系之前,必须先了解插件目标(PluginCoal)的概念。我们知道,Maven 的核心仅…

外星人入侵_计分

外星人入侵_计分 1添加Play按钮1.1创建Button类1.2在屏幕上绘制按钮1.3开始游戏1.4 重置游戏1.5 将Play按钮切换到非活动状态1.6隐藏光标 2提高等级2.1修改速度设置2.2重置速度 3计分3.1显示得分3.2创建记分牌3.3在外星人被消灭时更新得分3.4将消灭的每个外星人的点数都计入得分…

Linux:shell命令

Linux:shell命令 Shell echo命令 显示普通字符串 echo "i am wsf"显示转义字符 echo "i\" am usf"显示变量 read name#相当于python中的input echo "${name} is a name"read -p "请输入您的名字:" names#提…

怎么用U盘重装系统

在使用电脑的过程中,难免会遇到系统故障、运行缓慢等问题。当这些问题严重影响使用电脑的体验时,重装系统往往是一个有效的解决办法。用U盘重装系统是一种简单快捷的方法,本文将详细介绍如何使用U盘来重装系统,帮助大家轻松完成这…

推荐|代码签名证书怎么选?EV还是OV?

代码签名证书支持给.exe,.cab,.dll,.ocx,.msi,.xpi,.xap 等软件、控件进行数字签名!在选择代码签名证书时,EV和OV是两种常见的选择。这两种证书都用于对软件或应用程序进行数字签名。应该如何选…

在线短剧APP开发,短剧市场的新赛道新盈利

近几年中,短剧行业规模飞速上涨,越来越多的入局者开始进入市场,随着短剧市场的不断升温,也衍生出了短剧APP,为行业的发展带来了新的赛道! 短剧APP的出现为观众提供了一个专属的短剧“港湾”,让…

探索智慧园区的创新实践与未来展望

智慧园区是指运用物联网、大数据、云计算、人工智能等新一代信息技术,对园区进行全方位、全时段的智能化改造,实现管理高效、服务便捷、环境友好、创新驱动的现代化园区形态。其核心理念在于通过技术赋能,优化资源配置,提升园区运…

基于MT76X8平台的Mtk-openwrt-sdk配置单网口方法

一、配置. 在SDK的工程下,运行make kernel_menuconfig,如下图所示: Ralink Module --->选上“One Port Only”,如下图所示: 如果P0网口实现WAN口,就配置成W/LLLL,否则就配置成LLLL/W. 二、修改网口的…

Camera Raw 修图简明教程

Adobe Camera Raw(简称为 ACR )是 Adobe 开发的一款强大插件,专为处理和编辑相机原始文件(Raw 格式)而设计,旨在帮助摄影师和图像编辑人员实现高质量的转码和图像处理。 如果想用 Camera Raw 处理 JPEG、TI…

使用C++和Mysql进行图像存取操作记录

使用C和Mysql进行图像存取操作记录 配置: 1.Mysql 5.5.19 2.Vs2019 3.C 一、创建图像存储表格 选择数据库指令: 将databasename改成你想操作的数据库就行。我这边依旧在student_manager数据库下进行操作。 use databasename;CREATE TABLE images(im…

知迪动态丨北斗智联领导团队莅临知迪科技上海研发中心

7月29日,北斗智联领导团队来到知迪科技参观考察。知迪科技总裁周强先生率公司管理层与技术代表热情接待。 北斗智联一行在知迪科技公司团队的陪同下,首先观摩了在技术展示区陈列的车辆数据记录设备、总线信号分析及仿真设备、ADAS HiL测试台架、测试自动…

【PostGresql】---- pgSql 将列中合并字符串拆分为多行 实例代码

-- 将 AQY_ID,AQY 中的字符串拆分为多行 SELECT"ID","AQY_ID","AQY",UNNEST ( string_to_array( "AQY_ID", , ) ) AS "AQY_ID_1",UNNEST ( string_to_array( "AQY", , ) ) AS "AQY_1" FROM"JF_SGC…

科目一考试题库(超全)!7分钟一把过科目一(总结经验)

1、先看视频 先了解考试规范、流程以及重要的考点难点,做到心中有数,大部分人觉得重难点在扣分题和罚款题上面,可以在网上看一些视频讲解,1.5倍速快速过一遍看的过程中记录一些笔记,可以随便看的而且真滴有用 2、认真刷…

教你如何从Flink小白成为Contributor最终拿到腾讯的Offer

简言:一开始我也是怀揣着成为一个技术大老的梦想开始的,尽管我现在已经入职腾讯三年多了有时候觉得自己还是一个菜鸡哈..... 写这个文章希望可以帮助到刚刚接触大数据,并且对技术怀揣着梦想的朋友们,大家互相学习哈(对Flink不是很…

成都云飞浩容文化传媒有限公司领航电商新纪元

在数字经济浪潮汹涌的今天,电商行业作为时代的弄潮儿,正以前所未有的速度改变着商业版图。成都,这座历史悠久而又充满活力的城市,正孕育着一家在电商服务领域独树一帜的企业——成都云飞浩容文化传媒有限公司。作为一家深耕电商服…

Linux系统编程(4):消息队列

Linux下的进程通信手段基本上是从Unix平台上的进程通信手段继承而来的。 而对Unix发展做出重大贡献的两大主力AT&T的贝尔实验室 以及 BSD(加州大学伯克利分校的伯克利软件发布中心), 他们在进程间通信方面的侧重点有所不同; 前…

歌唱比赛活动策划方案书

(一)海选 1、时间:12月16日 2、地点:公司食堂 3、比赛评委设置:共计6名评委。 4、比赛规则: (1)选手按报名顺序及上报歌曲进行清唱(限时2分钟,类型…

时间序列分析方法之 -- 指数平滑(Exponential Smoothing)原理及Python代码示例

目录 原理 适用情况 Python 示例代码 结论 原理 指数平滑(Exponential Smoothing)是一种用于时间序列分析和预测的平滑技术。与简单移动平均(SMA)和加权移动平均(WMA)不同,指数平滑通过对最…

手势传感器 - 从零开始认识各种传感器【第十八期】

手势传感器|从零开始认识各种传感器 1、什么是手势传感器 手势传感器是一种能够感知人类手势或动作的传感器。它可以捕捉、识别和解释人类的手部动作或姿势,并将其转换成电信号或数字信号,通过识别人体的手势动作来实现与电子设备的交互,如控…