权威硬核认证|数说故事携手IDEA共创学术论文获NLP国际顶会 ACL 2023收录

news2024/11/29 4:51:49

日前,数说故事携手IDEA共创的学术论文——《A Unified One-Step Solution for Aspect Sentiment Quad Prediction (一个统一的单步情感四元组识别方法) 》被国际学术顶会 ACL 2023 接收为 Findings长文。这是继上一年IDEA数说故事实验室论文获「国际AI顶会IJCAI-ECAI 2022 Survey Track」收录后,再次获得同一等级的国际学术顶会认可。

ACL大会由国际计算语言学协会主办,是自然语言处理与计算语言学领域最高级别的学术会议。是中国计算机学会(CCF)推荐的唯一A类的自然语言领域国际学术会议。其接收的论文覆盖了对话交互系统、语义分析、信息抽取、问答系统、文本挖掘、情感分析和意见挖掘、社会计算等自然语言处理领域众多研究方向。计算语言协会(ACL)是首屈一指的国际科学和专业协会,致力于研究涉及人类语言的计算问题。其中ACL、EACL、NAACL、AACL这几个会议都是计算语言协会(ACL)组织举办的。每年能被ACL录用的论文可谓兼具创新性、科学性、实用性及可读性。

DataStory

突破传统情感分析边界 

极致粒度实现实时跟踪

本次论文中,双方合力研究的细粒度情感四元组识别 (ASQP) 任务,是突破传统统计分析的能力边界,基于数说故事海量的社媒数据,利用人工智能、大数据挖掘分析、算法等技术,实现产品的情感分析和用户情感反馈的实时跟踪,为企业提供深入的市场洞察和优化方案,提升产品核心竞争力。

此次的研究不同于整体的情感分析,细粒度情感四元组识别 (ASQP) 是基于特征词的情感分析,分析粒度更“细”,其主要目的是根据文本抽取出一系列简明的情感元素,识别消费者群体对某一产品各个属性的喜好程度。

四元组的四元即:维度 (category)、特征词 (aspect)、情感词/观点词 (opinion)、情感极性 (sentiment)。

/ 维度/ category

需预先定义,一般包含一级维度和二级维度

特征词/ aspect

一般为名词。特征词和情感词可组合为特征情感对

/ 情感词/观点词/ opinion

一般为形容词。特征词和情感词可组合为特征情感对

情感极性 / sentiment

一般为正面,中性,负面

举个美妆产品评价“栗子”体会一下!

了解社交媒体用户的态度和情感是成功部署影响力营销的最关键步骤之一,此篇论文中的细粒度情感四元组识别 (ASQP) 任务是数说故事Social Listening大数据系统的核心能力,且在数说故事的多个场景中落地应用:

✔ 解构用户谈论了什么,大大提升其情感偏好判断的准确度;

✔ 根据品牌在不同维度上的指标表现差异,感知用户对品牌的看法,对价值传递的偏差作出智能循环修正;

✔ 开展品牌活动并持续监测量化其传播效果;

✔ 广泛应用于品牌代言人价值情感分析、社媒心智品牌测量、热点话题追踪等细分场景。

DataStory

论文摘要

情感四元组识别是细粒度情感分析中的研究热点。现有方法包括Pipeline和Generation。Pipeline方案指流水线地识别情感元素,如先识别特征词和情感词,再基于此识别维度和情感级性。Generation方案指采用文本生成得到四元组。Pipeline方案易受误差传播影响,而Generation方案生成效率低下。

此外,过往方案主要在单句级别的数据集上进行实验。而在现实场景中,文本更复杂。数说故事每天要对海量的文本进行情感分析,这些文本有来源广泛、文本长度长、情感四元组密度高的特点。过往的建模方案在这些复杂的场景,无论是效果还是效率上都令人难以满意。

为了解决上述挑战,我们提出了单步识别(One-Step) 的情感四元组识别模型,简称One-ASQP。模型架构如下图所示,One-ASQP 把 ASQP 任务拆分成维度序列识别 (aspect category dectection) 和特征词-情感词-情感级性三元组抽取 (aspect-opinion-sentiment co-extraction) 两个独立的任务。

One-ASQP优点包括:

01、拆分成两个子任务并独立并行解决,避免错误传播,克服训练和推理的缓慢;

02、引入基于情感级性的角标签模式,使得情感元素在模型内部的交互更深入;

03、引入“[NULL]”标签,帮助有效识别隐含的特征词和情感词。

此外,为了刺激业界的研究发展,论文还开源了两个面向真实场景的ASQP数据集。实验表明,在已有的基准数据集和此次开源的数据集中,One-ASQP无论在效果还是效率方面都表现出色。

目前,情感分析已成为自然语言处理领域的研究热点。通过对情感语义的挖掘与理解,可以为品牌更好地理解社交媒体用户的情感状态和行为习惯。我们期待本次合作在ASQP任务上的探索能够为该领域的研究提供新的思路和方法,为品牌未来的发展揭示更多的机遇和挑战。同时期待更多的学术研究和商业实践探索ASQP任务,进一步完善情感分析的算法和技术,拓展其应用范围和深度。

IDEA数说故事实验室

IDEA DataStory AI Lab由数说故事携手IDEA共建,基于数说故事“大数据+AI”丰富的技术栈积累和平台化能力,结合IDEA国际TOP50的超级计算集群优势,将联合国内外顶尖高校和科研院所,围绕AI知识图谱、下一代动态海量事理图谱技术等领域展开国际一流的研究和产业化落地。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/532868.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

加密解密软件VMProtect教程(六):主窗口之控制面板“项目”部分(1)

VMProtect 是保护应用程序代码免遭分析和破解的可靠工具,但只有在正确构建应用程序内保护机制并且没有可能破坏整个保护的典型错误的情况下才能最有效地使用。 接下来为大家介绍关于VMProtect主窗口中的控制面板,其中包括:“项目”部分、“功…

AD20 原理图设计流程

Altium Designer 20 的原理图设计大致可以分为9个步骤: (1)新建原理图。这是原理图设计的第一步。 (2)图纸设置。图纸设置就是要设置图纸的大小,方向等信息。图纸设置要根据电路图的内容和标准化来进行。…

教你几分钟玩转.ipynb文件

找代码的时候最不喜欢遇到.ipynb文件,因为要打开jupyter,作为懒癌患者,即使电脑安装了jupyter也很少去用。不知道有没有人和我一样,真的很不喜欢在终端开一个程序,不能关的那种。 今天又遇到.ipynb文件,这…

我是如何利用midjourney制作表情包的

起初是在看到大厂文章《【Midjourney教程】设计麻瓜也能10分钟上架一套表情包》以后,才想自己试试的。如果你是midjourney的老鸟了,那么参照着文章,应该也能很顺利的完成。下面我介绍下,我遇到的问题和解决方案 准备:…

Tesseract.js离线识别图片中的文字

从官网下载Tesseract.js的离线版本 https://github.com/jeromewu/tesseract.js-offline 初始化 解压下载文件使用cmd命令行进入解压的文件夹(tesseract.js-offline-master),使用命令下载安装相关包npm install下载安装完成后,该…

看懂二维码识别OCR:从算法到API 接入代码

引言 二维码识别OCR(Optical Character Recognition)是结合了图像处理和OCR技术,以识别和提取二维码中的信息的技术,二维码识别OCR 可以实现对图像中的二维码进行自动检测和解码,并将其内容提取为可编辑的文本&#x…

腾讯云 Serverless Stable Diffusion 应用免费名额限量放送,试用申请开启!

近半年,AIGC 领域惊喜接踵而至。除了 Chatgpt,在AI绘图方面 Stable Diffusion 也大放异彩。网上的教程五花八门,有很多小伙伴根本不知如何下手,苦不堪言。 现在腾讯云 Serverless Stable Diffusion 应用免费名额限量放送&#xf…

阿里P6测试总监分享,这份《接口自动化测试》总结,让我成功入门接口自动化测试...

昨晚在某个测试交流群,听了一个测试老司机分享接口自动化测试的内容,对接口自动化有了更深的一些认识,也为接下来公司的接口自动化实施,提供了更多的思路。 这篇文章,就说说功能测试到接口自动化的进阶,以…

( 位运算 ) 318. 最大单词长度乘积 ——【Leetcode每日一题】

❓318. 最大单词长度乘积 难度:中等 给你一个字符串数组 words ,找出并返回 length(words[i]) * length(words[j]) 的最大值,并且这两个单词不含有公共字母。如果不存在这样的两个单词,返回 0 。 示例 1: 输入&…

sqlmap对dvwa靶场的账号密码进行破解

1.进行靶场搭建 准备两台虚拟机 靶机:win7 攻击机:kali linux win7IP 172.26.0.130kali linuxIP 172.26.0.129 虚拟机搭建好后,相互ping能ping同就行 安装xampp XAMPP Installers and Downloads for Apache FriendsXAMPP is an easy to install…

数字化赋能,探索智慧银行建设的最佳实践

导语 | 数字经济时代,数字化已成为银行业转型升级的战略手段。近年来,商业银行纷纷加大对信息科技的投入,数字化在改变银行业务模式的同时,更是构建起了数字金融新生态。今天,我们特邀腾讯云 TVP 行业大使、舜源科技合…

值传递、引用传递

​​​​​辟谣时间 错误理解一:值传递和引用传递,区分的条件是传递的内容,如果是个值,就是值传递。如果是个引用,就是引用传递。 错误理解二:Java是引用传递。 错误理解三:传递的参数如果是普通…

国内有哪些SAAS软件?SAAS软件有哪些优点?

国内有哪些SAAS软件?SAAS软件有哪些优点?不请自来答一下,通过SaaS软件与传统软件的对比来详细讲下SaaS软件有哪些优点? 配合以下内容食用更佳: 关于概念——深度详解什么是SaaS(软件即服务)关…

项目报告:turtle画小猪佩奇

目录 项目:一、项目思路二、项目实战1. 导入模块2. 创建画布3. 绘制鼻子4. 绘制猪头5. 绘制耳朵6. 绘制眼睛7. 绘制脸8. 绘制嘴9. 绘制身体10.绘制手11.绘制脚12.绘制尾巴 三、项目展示 总结: 项目: ​ 我们做的项目是小猪佩奇绘画的一个项目…

农场农庄偷菜卖菜h5多端流量主小程序开发

农场农庄偷菜卖菜h5多端流量主小程序开发 种菜,收菜,偷菜,卖菜)玩法。 功能:动态背包,动态排行榜,定时收获,广告组件接入,背景音乐,按钮点击声音接入&#x…

多线程概念,常用接口与多进程之间的比较

多线程概念,常用接口与多进程之间的比较 多线程概念与常用接口多线程概念与相对于线程的区别什么是多线程(概念)进程和线程的区别在Linux系统下,进程和线程的区别如下:多进程和多线程优缺点比较:在多任务处…

国产仪器 1612A无线信道仿真器

1612A无线信道仿真器是一款专门的无线信道仿真设备,可准确实时仿真复杂的无线信道特征,包含路径损耗、延迟、多径衰落以及噪声等,重现真实的信号传播环境,用于对比测试及反复测试,加快问题的发现及解决的过程。本产品突…

canvas学习笔记

其实还有react还没有学&#xff0c;但是公司技术栈里面有canvas&#xff0c;所以先系统学习一下canvas 一、canvas 简介 ​<canvas> 是 HTML5 新增的&#xff0c;一个可以使用脚本(通常为 JavaScript) 在其中绘制图像的 HTML 元素。它可以用来制作照片集或者制作简单(也…

微服务之服务间通信:关于Feign的练习demo

一、主要流程&#xff1a; 创建两个最基础的springboot项目调用方引入Feign的依赖在调用方服务项目中创建agent接口类&#xff0c;类使用FeignClient注解&#xff0c;注解重点配置url&#xff08;即被调用方服务所在的地址ip端口号&#xff09;、写接口方法等。在具体业务代码…

Softing邀您参加第16届诊断大会

第16届机电车辆系统诊断大会将于2023年5月23-24日在德累斯顿举行。今年的主题将再次围绕预测性维护、远程诊断、机器学习、标准化以及检验和ePTI方面的当前挑战和新技术展开。 在5月23日&#xff08;周二&#xff09;&#xff0c;Softing汽车电子的创新与测试经理-Jrgen Heilm…