使用生成 AI 实现准确的新闻摘要

news2024/11/19 15:15:28

85187b7b13240a5c3aea21d45235fce9.png

cd524d92e19f74ad0e809e8820907e70.png

shadow

这篇文章介绍了作者 Alessandro Alviani 的实践经验,非常有参考价值。


指令冗余,多步引导,是目前提高LLM输出质量的方法之一。

Towards Accurate Quote-Aware Summarization of News using Generative AI

4ddd270b5fb47d252aa39e18813bb41c.png

Alessandro

Alviani

generative-ai-newsroom.com/towards-accurate-quote-aware-summarization-of-news-using-generative-ai-b786493e0c3d

归因是新闻业的基本原则。正确引用新闻来源而不扭曲所表达内容的含义,或者更糟糕的是,添加记者推断的信息,是任何记者的一项基本技能。

大型语言模型LLM带来了新的挑战:它们可能会编造引文或将准确的引文错误地分配给错误的来源。这是因为它们的工作方式是根据先前的文本预测序列中下一个最可能的单词。此类错误可能会削弱人们对媒体的信任,应该避免。

我们的目标

在IPPEN.MEDIA,我们一直在尝试大型语言模型 LLM 的大量用例。其中一些包括建议标题和线索变体,以及总结或重写文章以针对不同的受众。在处理引用时,生成摘要或文本变体很容易出错。

在我们的第一轮测试中,我们发现 ChatGPT 倾向于重写引用,即使明确指示不要这样做。当我们试图通过在提示中添加特定约束来总结一篇文章,同时保持所有引用不变时,ChatGPT 只是忽略了这些约束并重写了引用。更糟糕的是,虽然提示有时会按预期工作并且所有引文都会正确再现,但大多数时候却并非如此。

这种不一致部分是 LLM 所固有的,LLM 是概率性模型,而不是确定性模型。

即使我们对使用 ChatGPT 和其他 LLM 编辑的所有文本采取了双重检查,虚构的文本仍然可能通过人类编辑的审查。

我们的方法

事实证明提示工程的基本概念之一:构建尽可能具体和清晰的提示来定义所需的输出——可能还不够。我们的方法是,需要结合指令冗余的多步骤方法。

我们最初添加到 ChatGPT 提示中的摘要和文章的指令以两种方式失败:原始引用要么被重写并加引号,要么被解释。

我们尝试将初始提示分为两个步骤。我们还通过使用系统提示为模型分配经验丰富的新闻编辑的角色来提供更多背景信息。同样,该模型通常最终会解释原始引用。

及时迭代是关键

小技巧,我们将温度参数设置为 0 以减少输出的变化。

我们再次使用了分步方法,但这次我们的做法有所不同:我们指示模型首先使用格式“”提取所有引号(即查找引号之间的任何内容),然后生成摘要或包含先前提取的引号的新文本版本。

结果要好得多。然而,即使它有效地提取了步骤 1 中的所有引号,模型仍然可能偏离提示并错误地使用、重写引号。

更糟糕的是,对于具有多个引用的较长文章,该模型可能会犯两个常见错误:要么无法提取所有引用,要么错误地将出现在实际引用旁边或中间的非引用句子识别为引用。一般来说,文本越长,识别的引号数量越少。对于 GPT-3.5 模型尤其如此。

此迭代过程中真正的游戏规则改变者是接下来的两项调整。首先,添加一个简单的系统提示。结果显着改善,支持了为 LLM 提供更多背景知识可以提高其表现的观点。

第二个重大改进来自使用 GPT-4。我们的测试表明,OpenAI 的最新模型优于 GPT-3.5。使用我们的两步方法,几乎都被正确识别。

3832b1ba797f936cbd4bad8e3714e46f.png

总结,GPT-4 远远优于 GPT-3.5。在 12 篇文章中的 11 篇中,所有引用都正确包含在 AI 生成的摘要中。

指令冗余效果很好。在我们的两步方法中,我们在第二步中要求 GPT-3.5 和 GPT-4 重写或总结文本,不仅粘贴了在步骤 1 中提取的所有引用,而且再次把原始文章粘贴到提示的末尾。即使 GPT-3.5 和 GPT-4 未能在第一步中提供正确结论 ,他们通常能够在第二步中正确地输出。

df25fcf9f135dc152d2b0c4ae7d10032.jpeg

备注:提示工程社群

9025feb9f93100aea2416355f537b9fd.png

opus

作者分享的提示工程,供大家参考。也欢迎加入Mix的提示工程社群~~

提示工程:

[1] The text contains quotations; they are enclosed in quotation marks. Quotations must remain as in the original.

[1]正文包含引文;它们用引号引起来。引文必须保持原样。

[2] You are an editor with 30 years of experience. You need to rewrite the following article into a new text. Think step by step.
Step 1: Rewrite the following original title using vivid but neutral language; Step 2: Make sure that all quotations within quotation marks are reproduced in the new content in the same way. Nothing in quotation marks may be rewritten.

[2] 是一位拥有 30 年经验的编辑。您需要将以下文章重写为新文本。一步步思考。
步骤1:用生动但中性的语言重写以下原标题;步骤2:确保引号内的所有引用都以相同的方式再现在新内容中。引号中的任何内容都不能被重写。

[3] 1st step:
Extract all quotes between quotation marks such as “” in the following text:
###Text##

2nd step (after the model has extracted the quotes):
Rewrite the article and make sure the following quotes remain unchanged:
“quote”
“quote”
“quote”
Article: ###Text###

[3]第一步:
提取以下文本中引号之间的所有引号,例如“”:
###Text##

第二步(模型提取引号后):
重写文章并确保以下引号保持不变:
“quote”
“quote”
“quote”
文章:###Text###

[4] You are a precise journalist and editor.

[4]你是一位严谨的记者和编辑。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/681097.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

电容式电动汽车路径规划问题的双级蚁群优化算法

摘要: 电动汽车(EV)技术的发展导致了一个新的车辆路由问题(VRP),称为有容量的电动汽车路由问题(CEVRP)。由于充电站的数量有限,电动汽车的巡航范围有限,不仅要…

【从零开始学习JAVA | 第十九篇】初识内部类

前言: 内部类是类的五大成员。一个类的其他的成员分别是属性,方法,构造方法,代码块。本文将详细介绍什么是内部类,以及内部类的意义。 内部类: 内部类(Inner Class)是 Java 中的一个…

MedViT:一种用于广义医学图像分类的鲁棒Vision Transformer

文章目录 MedViT: A Robust Vision Transformer for Generalized Medical Image Classification摘要本文方法Locally Feed-Forward Network 实验实验结果 MedViT: A Robust Vision Transformer for Generalized Medical Image Classification 摘要 卷积神经网络(cnn)在现有医…

实现一个 AI 驱动的马里奥(使用双重深度 Q 网络),它可以自己玩游戏

训练玩马里奥的 RL 智能体 本教程将向您介绍深度强化学习的基础知识。 最后,您将实现一个 AI 驱动的马里奥(使用双重深度 Q 网络),它可以自己玩游戏。 # !pip install gym-super-mario-bros7.3.0import torch from torch import …

STM32实现延时

在STM32单片机中,实现延时一般都是使用定时器,既可以使用Systick定时器,也可以使用常规的定时器。 定时器在设置了定时并开启之后,就会进入自主运行模式,其中,初始化设置这一阶段是由CPU执行相应指令完成的…

Spring Cloud_Spring Cloud Alibaba_00000

contents 微服务介绍版本选择创建项目创建Maven工程 说明 微服务介绍 微服务架构是一种架构模式。它提倡将单一应用程序划分成一组小的服务。服务之间相互协调、相互配合,为用户提供最终价值。每个服务运行在其独立的进程中,服务与服务间采用轻量级的通…

html通过web3JS 获取当前连接的区块链信息和账号信息

前面 我们讲了 MetaMask和ganache的配置安装 并用 MetaMask管理ganache的启动的虚拟区块链 那么 我们现在也完全可以写一个网页来做这个东西的管理 您可以先查看文章web3.js获取导入做一个导入了 web3的html文件 首先我们可以来试着 获取 自己当前是在哪个区块的 getBlockNum…

【深度学习】【分布式训练】DeepSpeed:AllReduce与ZeRO-DP

AllReduce与ZeRO-DP ​ ZeRO-DP是分布式训练工具DeepSpeed的核心功能之一,许多其他的分布式训练工具也会集成该方法。本文从AllReduce开始,随后介绍大模型训练时的主要瓶颈----显存的占用情况。在介绍完成标准数据并行(DP)后,结合前三部分的内…

玩游戏提示d3dx9丢失-找不到d3dx9怎么修复

相信有些朋友遇到了d3dx9丢失的情况不知道怎么解决,而今日小编带来的这篇文章就是讲解关于d3dx9丢失进行修复的操作内容,d3dx9丢失怎么解决?(修复方法)d3dx9文件是DirectX中必备文件,许多游戏需要此文件运行。 d3dx9丢…

文件系统概述

目录 概述用户空间层面1.应用程序可以直接使用内核提供的系统调用访问文件:2.应用程序也可以使用 glibc 库封装的标准 I/O 流函数访问文件: 硬件层面1.块设备2.闪存3.NVDIMM 内核空间层面 概述 在 Linux 系统中,一切皆文件,除了通…

【MySQL 】:测试数据准备、SQL语句规范与基本操作

前言 欢迎来到小K的MySQL专栏,本节将为大家准备MySQL测试数据、以及带来SQL语句规范、数据库的基本操作的详细讲解~✨文末送书,小K赠书活动第二期 目录 前言一、准备测试数据二、SQL语句规范三、数据库的基本操作四、总结:文末赠书 一、准备测…

直线导轨在焊接领域有什么作用?

焊接技术在现代制造业中的应用越来越广泛,直线导轨作为重要的传动元件,已经成为焊接设备中不可或缺的部分。 相对于直线轴承来说,直线导轨具有较高的负载能力和刚度,能够保证高精度的直线运动,滑动摩擦小,惯…

【Python】异常处理 ③ ( 捕获所有类型的异常 | 默认捕获所有类型异常 | 捕获 Exception 异常 )

文章目录 一、Python 默认捕获所有类型异常1、默认捕获所有类型异常 - 无法获取异常类型2、代码实例 - 默认捕获所有类型异常 二、Python 捕获所有类型异常 - 捕获 Exception 异常1、捕获 Exception 类型异常 - 可获取异常类型2、代码实例 - 捕获 Exception 异常 一、Python 默…

管理类联考——逻辑——知识篇——形式逻辑——三、直言——haimian

直言 考点分析 直言 年度 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023题量786223232 性质定义 直言命题也叫做性质命题,是判断事物是否具有某种性质的命题。直言命题由四部分组成:主项、谓项、联项、量项。 不同种类 对当关系 对…

PID控制算法:2、Derivative Kick(微分冲击)

什么是微分冲击Derivative Kick 引入微分,就是为了减少超调量的,但是根据PID的经典公式 就看微分部分 在PID刚开始时,误差值肯定是存在的,但是PID启动的瞬间,这个dt是很小的,这就导致是一个很大的值&#…

软件开发实习个人总结

软件开发实习个人总结篇1 一、实习目的 随着时代发展和社会进步,用人单位对游戏软件专业大学生的要求越来越高,对于即将毕业的游戏软件专业在校生而言,为了能更好的适应游戏软件专业严峻的就业形势,毕业后能够尽快的融入到社会&am…

Golang学习日志 ━━ 通过将gin-vue-admin项目上传到自己的仓库并且与原版保持更新来学习github操作

gin-vue-admin是一套国人用golang开发的后台管理系统,本文是从作者早期原文中截取的一部分,后期会以本文为框架进行扩展说明。 官网:https://www.gin-vue-admin.com/ 学习视频:https://www.bilibili.com/video/BV1kv4y1g7nT/?p6 …

Redis 2023面试5题(七)

一、Redis redlock 实现原理 Redlock是一种基于Redis的分布式锁实现,它可以解决在分布式系统中由于主从切换、网络延迟等导致的锁竞争问题。 Redlock的实现原理如下: 创建多个Redis实例,每个实例都有相同的锁名称。使用Redis的SETNX命令尝试…

如何选择消息中间件

一、 分布式系统消息通信技术简介 分布式系统消息通信技术主要包括以下几种: 1. RPC(Remote Procedure Call Protocol). 一般是C/S方式,同步的,跨语言跨平台,面向过程 2. CORBA(Common Object Request Broker Architecture). CO…

Vlan与ARP讲解

目录 Vlan讲解 Vlan标签 二层接口类型 ARP ARP的作用 ARP地址解析报文讲解 免费ARP报文讲解 ARP缓存表 Vlan讲解 Vlan(Virtual Local Area Network)虚拟局域网,将一个物理的LAN在逻辑上划分为多个广播域;可以理解为一个V…