ChatGPT实现语义分析情感分类

news2024/10/6 10:32:57

语义分析情感分类

我们从开源社区找到了中科院谭松波博士整理的携程网酒店评论数据集(https://raw.githubusercontent.com/SophonPlus/ChineseNlpCorpus/master/datasets/ChnSentiCorp_htl_all/ChnSentiCorp_htl_all.csv)。一共七千余条数据,包括 label 和 review 两个字段。review 是评论文本,label 是情感分类标记,为 1 表示正向,0 表示负向。

我们可以先试试,完全不给任何提示,ChatGPT 的分类能力如何。从数据集中间,正向和负向交汇的位置,复制 5 行数据交给 ChatGPT:

  1. 总的来说可以,总是再这里住,公司客人还算满意。就是离公司超近,上楼上班下楼回家
  2. 房间设施难以够得上五星级,服务还不错,有送水果。
  3. 标准间太差房间还不如3星的而且设施非常陈旧.建议酒店把老的标准间从新改善.
  4. 服务态度极其差,前台接待好象没有受过培训,连基本的礼貌都不懂,竟然同时接待几个客人;大堂副理更差,跟客人辩解个没完,要总经理的电话投诉竟然都不敢给。要是没有作什么亏心事情,跟本不用这么怕。
  5. 地理位置还不错,到哪里都比较方便,但是服务不象是豪生集团管理的,比较差。下午睡了一觉并洗了一个澡,本来想让酒店再来打扫一下,所以,打开了,请打扫的服务灯,可是到晚上回酒店,发现打扫得服务灯被关掉了,而房间还是没有打扫过。 对上述5 条评论进行情感分类,正向为 1,负向为 0.

ChatGPT 返回的结果如下:

  1. 正向 - 客人对房间位置的方便性和服务的满意度表示肯定。
  2. 正向 - 客人对服务的评价较好,但是认为房间设施不够五星级。
  3. 负向 - 客人对标准间的设施和质量表示不满意,建议酒店改善。
  4. 负向 - 客人对服务态度的评价非常差,前台和大堂副理的服务都不佳。
  5. 负向 - 客人认为地理位置还可以,但是对服务不满意,房间没有得到打扫。

对比数据集内实际的标注,完全正确。当然,要在 ChatGPT 聊天窗口一口气把 7000 条数据都标注一遍,还是挺费劲的,一次问答有字数限制。因此,想用 ChatGPT 做实际的文本标注工作,还是要学习如何使用 openai 公司的 API 接口,本书后续章节也有针对性的内容可以参照。

接下来,我们可以尝试一点更难的事情,在更复杂的语境中进行分类。我们摘录一段金庸《倚天屠龙记》的片段,看看 ChatGPT 如何判断张无忌的感情。为了避免狡猾的 ChatGPT 通过一些两不相帮的话术来躲避话题,我们这次在 prompt 中明确要求他只能回答 yes or no。这也是一种非常常用的技巧:

张无忌心中一片迷惘,想起赵敏盈盈笑语、种种动人之处,只觉若能娶赵敏为妻,长自和她相伴,那才是生平至福,但一转念间,立时忆起殷离脸上横七竖八、血淋淋的剑伤来,忙道:“赵姑娘是我大仇,我要杀了她为表妹雪恨。 仅从上面这段话来判断,张无忌喜欢赵敏么?你只用回答喜欢或不喜欢,不要说其他任何字。

ChatGPT给出了"喜欢"的回答。然后我们再来问它是如何得出这个结论的:

这个分析可以说相当到位,当语文老师绰绰有余。正向情绪溢于言表,负向情绪藏起来没明说,一多一少,总体就依然是正向的"喜欢"。可以说,ChatGPT 拆解完以后,我们甚至都学到了一点写作技巧呢。

情感分类,目前运用场景非常广泛。比如呼叫中心领域,在客服对话过程中,需要根据客户情绪及时转发或升级处理;对话结束后,可以根据对话过程生成客服满意度评级等等。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/464061.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Domino中的时间日期格式设置

大家好,才是真的好。 今天我们谈管理运维问题,相对于前面的技术来说,会简单很多。 就是Domino服务器运行时的时间日期显示问题。这和你的邮件、应用等里面的文档时间日期也有关系。 简单来说,在默认的设置情况下,Do…

java——最小的K个数

题目链接 牛客在线oj题——最小的K个数 题目描述 给定一个长度为 n 的可能有重复值的数组,找出其中不去重的最小的 k 个数。例如数组元素是4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4(任意顺序皆可)。 数据范围:0≤k,n≤10000&…

【刷题之路】LeetCode 206. 反转链表

【刷题之路】LeetCode 206. 反转链表 一、题目描述二、解题1、方法1——改变指针方向1.1、思路分析1.2、代码实现 2、方法2——头插到新链表2.1、思路分析2.2、代码实现 一、题目描述 原题连接: 206. 反转链表 题目描述: 给你单链表的头节点 head &…

4月26号软件更新资讯合集....

Tpflow V7.0.2,PHP 工作流引擎新版发布 ​欢迎使用 Tpflow V7.0.1 工作流引擎 TpFlow 工作流引擎是一套规范化的流程管理系统,基于业务而驱动系统生命力的一套引擎。彻底释放整个信息管理系统的的活力,让系统更具可用性,智能应用型…

设计模式天花板,详解23种设计模式+7大设计原则

这份文档完整覆盖GoF讲述的23个设计模式并加以细细研磨。初级内容从基本讲起,包括每个模式的定义、功能、思路、结构、基本实现、运行调用顺序、基本应用示例等,让读者能系统、完整、准确地掌握每个模式,培养正确的“设计观”;中高级内容则深…

速速报名| 米尔将精彩亮相2023 STM32中国峰会暨粉丝狂欢节

STM32峰会已成功举办五届,第六届将于今年5月12日-13日在深圳重磅回归!往年,米尔电子都作为官方合作伙伴,出席演讲并展出公司配套的核心板和开发板。 今年,STM32峰会更是集齐了值得你「点赞、收藏、转发」的一键三连精…

漫画 | Linux之父:财务自由以后,我失眠了!

前言:今年是Linux诞生的30周年! 1991年的8月, Linus在新闻组中公布了他正在开发的一个免费的操作系统,这也是以后风靡世界的Linux操作系统的雏形。 今天翻到这篇漫画,看到Linux的诞生过程,很是感慨&#x…

FPGA实现10G万兆网UDP通信 10G Ethernet Subsystem替代网络PHY芯片 提供工程源码和技术支持

目录 1、前言2、我这里已有的UDP方案3、详细设计方案传统 FPGA UDP 方案本 FPGA 10G UDP 方案(牛逼)10G Ethernet 框图10G Ethernet 发送解析10G Ethernet 接收解析10G Ethernet 寄存器配置10G Ethernet UI 配置 4、vivado工程详解5、上板调试验证并演示ping功能测试数据收发测…

新手必看:蓝牙耳机什么牌子的好用?2023年蓝牙耳机排名

上班通勤、健身运动、游戏娱乐都离不开蓝牙耳机,蓝牙耳机市场这几年逐渐饱和,涌现了大量的品牌,蓝牙耳机什么牌子的好用成为热议话题,新手们在挑选时会参考排行榜,小编接下来将盘点2023年蓝牙耳机排名。 ●JEET Air 2蓝…

【服务器数据恢复】HP MSA存储raid5数据恢复案例

服务器故障环境: HP MSA某型号存储,8块SAS的硬盘组建RAID5磁盘阵列,其中包括1块热备盘。故障存储中基于该RAID组的LUN均分配给HP-Unix小机使用,上层做的LVM逻辑卷,存储的数据为Oracle数据库及OA服务端。 服务器故障&a…

PyCharm更换pip源、模块安装、PyCharm依赖包导入导出

一、Pycharm更换安装源 在下载安装好Pycharm后,一个在实际编程开发过程中非常重要的问题是第三方库添加,然而Python默认的源网络速度有点慢,因此,我们常常需要做的是更换Pycharm的安装源。 在当前最新版(2022.03版&…

[排序算法]桶排序

参考:《漫画算法-小灰的算法之旅》 目录 一、什么是桶排序 二、桶排序的工作原理 三、代码 四、时间复杂度和空间复杂度 一、什么是桶排序 桶排序是一种线性时间的排序算法,它类似于基数排序所创建的统计数组。桶排序需要创建若干个桶来协助排序。 …

企业数字化管理中,数据治理到底怎么“治”

随着信息化、数字化的理念、技术及其应用在社会的方方面面进行扩散,数据的规模和丰富程度已经达到了一个新的高度,所以当下如何更进一步利用好数据,充分发挥数据的价值,将其真正变为高质量的数据资产成为了企业要面对的重要问题&a…

Matlab高光谱遥感、数据处理与混合像元分解及典型案例

站在学员的角度去理解“高光谱”,用大家能听的懂的语言去讲述高光谱的基本概念和理论,帮助学员深入理解这项技术的底层科学机理。方法篇,将高光谱技术与MATLAB工具结合起来,采用MATLAB丰富的工具箱,快速复现高光谱数据…

爱快 Docker NodeRed Tcp服务器远程连接试验

有一台基于4415软路由安装的ubuntu server系统,在Ubuntu上通过Docker安装了NodeRed。ubuntu通过爱快硬路由与外网连接。爱快硬路由通过动态域名和端口映射实现远程访问ubuntu。 平时通过如下命令运行NodeRed镜像: docker run -it --rm -e TZ"Asia/…

掌握这些Revit常见术语,从此BIM建模再无压力

BIM模型看似复杂,其实只要掌握模型中基本元素的概念,理清建模原理,就能轻松上手,游刃有余。 首先,我们要清楚,作为BIM主要建模软件的Revit,可以在三维空间中建立起数字化的建筑信息模型&#xf…

【更新公告】AirtestIDE更新至1.2.15版本

1. 前言 本次更新为AirtestIDE、Airtest、Poco、iOS-tagent更新。 AirtestIDE更新至1.2.15版本,Airtest更新为1.2.10版本,Poco更新为1.0.89版本,iOS-tagent重新梳理了master分支内容。更新内容详见下文。 2. 更新内容 1)Airte…

HBase之全文检索Phoenix

HBase高手之路6-HBase之全文检索Phoenix 一、全文检索 ​ 二、全文检索工具phoenix简介 三、OLTP和OLAP 1. OLAP 在线分析处理系统,hadoop、hbase、hive提供支持 2. OLTP 在线事务处理系统,传统的关系数据库支持 四、Phoenix的安装 1. 下载 2.…

企业数字化转型的核心是什么?如何才能真正做到数字化转型?

什么是数字化转型?如何才能做到数字化转型? 好像大家一直在讨论,但仍然没有一个明确的答案。 这其实很正常: 因为“数字化”一词对不同的企业来说有不同含义。它可以是从采用新技术——引入自动化操作中的任何一样东西。此外,“…

《一次性分割一切》阅读笔记

目录 0 体验 1 摘要 2 十个问题 参考文献 0 体验 体验地址:SEEM - a Hugging Face Space by xdecoder 体验结果: 将哈士奇和汽车人从图片中分割出来。 1 摘要 尽管对于交互式人工智能系统的需求不断增长,但在视觉理解(例如…