日前,数说故事携手IDEA共创的学术论文——《A Unified One-Step Solution for Aspect Sentiment Quad Prediction (一个统一的单步情感四元组识别方法) 》被国际学术顶会 ACL 2023 接收为 Findings长文。这是继上一年IDEA数说故事实验室论文获「国际AI顶会IJCAI-ECAI 2022 Survey Track」收录后,再次获得同一等级的国际学术顶会认可。
ACL大会由国际计算语言学协会主办,是自然语言处理与计算语言学领域最高级别的学术会议。是中国计算机学会(CCF)推荐的唯一A类的自然语言领域国际学术会议。其接收的论文覆盖了对话交互系统、语义分析、信息抽取、问答系统、文本挖掘、情感分析和意见挖掘、社会计算等自然语言处理领域众多研究方向。计算语言协会(ACL)是首屈一指的国际科学和专业协会,致力于研究涉及人类语言的计算问题。其中ACL、EACL、NAACL、AACL这几个会议都是计算语言协会(ACL)组织举办的。每年能被ACL录用的论文可谓兼具创新性、科学性、实用性及可读性。
DataStory
突破传统情感分析边界
极致粒度实现实时跟踪
本次论文中,双方合力研究的细粒度情感四元组识别 (ASQP) 任务,是突破传统统计分析的能力边界,基于数说故事海量的社媒数据,利用人工智能、大数据挖掘分析、算法等技术,实现产品的情感分析和用户情感反馈的实时跟踪,为企业提供深入的市场洞察和优化方案,提升产品核心竞争力。
此次的研究不同于整体的情感分析,细粒度情感四元组识别 (ASQP) 是基于特征词的情感分析,分析粒度更“细”,其主要目的是根据文本抽取出一系列简明的情感元素,识别消费者群体对某一产品各个属性的喜好程度。
四元组的四元即:维度 (category)、特征词 (aspect)、情感词/观点词 (opinion)、情感极性 (sentiment)。
/ 维度/ category
需预先定义,一般包含一级维度和二级维度
/ 特征词/ aspect
一般为名词。特征词和情感词可组合为特征情感对
/ 情感词/观点词/ opinion
一般为形容词。特征词和情感词可组合为特征情感对
/ 情感极性 / sentiment
一般为正面,中性,负面
举个美妆产品评价“栗子”体会一下!
了解社交媒体用户的态度和情感是成功部署影响力营销的最关键步骤之一,此篇论文中的细粒度情感四元组识别 (ASQP) 任务是数说故事Social Listening大数据系统的核心能力,且在数说故事的多个场景中落地应用:
✔ 解构用户谈论了什么,大大提升其情感偏好判断的准确度;
✔ 根据品牌在不同维度上的指标表现差异,感知用户对品牌的看法,对价值传递的偏差作出智能循环修正;
✔ 开展品牌活动并持续监测量化其传播效果;
✔ 广泛应用于品牌代言人价值情感分析、社媒心智品牌测量、热点话题追踪等细分场景。
DataStory
论文摘要
情感四元组识别是细粒度情感分析中的研究热点。现有方法包括Pipeline和Generation。Pipeline方案指流水线地识别情感元素,如先识别特征词和情感词,再基于此识别维度和情感级性。Generation方案指采用文本生成得到四元组。Pipeline方案易受误差传播影响,而Generation方案生成效率低下。
此外,过往方案主要在单句级别的数据集上进行实验。而在现实场景中,文本更复杂。数说故事每天要对海量的文本进行情感分析,这些文本有来源广泛、文本长度长、情感四元组密度高的特点。过往的建模方案在这些复杂的场景,无论是效果还是效率上都令人难以满意。
为了解决上述挑战,我们提出了单步识别(One-Step) 的情感四元组识别模型,简称One-ASQP。模型架构如下图所示,One-ASQP 把 ASQP 任务拆分成维度序列识别 (aspect category dectection) 和特征词-情感词-情感级性三元组抽取 (aspect-opinion-sentiment co-extraction) 两个独立的任务。
One-ASQP优点包括:
01、拆分成两个子任务并独立并行解决,避免错误传播,克服训练和推理的缓慢;
02、引入基于情感级性的角标签模式,使得情感元素在模型内部的交互更深入;
03、引入“[NULL]”标签,帮助有效识别隐含的特征词和情感词。
此外,为了刺激业界的研究发展,论文还开源了两个面向真实场景的ASQP数据集。实验表明,在已有的基准数据集和此次开源的数据集中,One-ASQP无论在效果还是效率方面都表现出色。
目前,情感分析已成为自然语言处理领域的研究热点。通过对情感语义的挖掘与理解,可以为品牌更好地理解社交媒体用户的情感状态和行为习惯。我们期待本次合作在ASQP任务上的探索能够为该领域的研究提供新的思路和方法,为品牌未来的发展揭示更多的机遇和挑战。同时期待更多的学术研究和商业实践探索ASQP任务,进一步完善情感分析的算法和技术,拓展其应用范围和深度。
IDEA数说故事实验室
IDEA DataStory AI Lab由数说故事携手IDEA共建,基于数说故事“大数据+AI”丰富的技术栈积累和平台化能力,结合IDEA国际TOP50的超级计算集群优势,将联合国内外顶尖高校和科研院所,围绕AI知识图谱、下一代动态海量事理图谱技术等领域展开国际一流的研究和产业化落地。