翻译像机翻?4点教会你ChatGPT高质量翻译

news2024/12/22 20:48:22

a7f36c1d1767f41fe3628b11e8ebb4cf.jpeg如果完全靠自己的英文和中文水平,要达到这样的翻译速度和质量那是不太可能的,主要还是得益于ChatGPT的帮助,首先用GPT-4的API粗翻,再用ChatGPT Plus精翻。很多人都用过ChatGPT翻译,但翻译出来的结果比起Google翻译和DeepL这种,似乎翻译质量并没有好太多,但其实是你没有最大化的利用大语言模型的优势,如果你能善用ChatGPT(尤其是GPT-4)这样的大语言模型,可以让你的翻译质量提升一个大台阶。

那么大语言模型相对于传统的翻译工具有什么优势呢?

1. 可以根据Prompt产生不同的结果 使用大语言模型的时候,借助Prompt你可以提出很多个性化的要求,比如说:

  • 可以提供不同的翻译风格,比如你可以将翻译的结果更加口语化 - 你可以将某些专有名词使用特定的翻译(不会闹笑话把“LLM”翻译成“法学硕士”)。
  • 你可以提供上下文让翻译更有针对性,比如说这是一篇 AI 相关的技术文章,尽可能翻译成专业术语。
  • 你可以让它识别错别字,比如在语音转文字时,经常会产生错别字,或者翻译完成也可能会有错别字,这些错误人工纠正很容易疏漏,可以让AI帮你纠正,又快又准。
  • 可以提供背景解释,大语言模型背后有一个超级庞大的知识库,几乎囊括了互联网所有的公开信息,有时候我们在翻译时,遇到一些因为文化背景不一样的内容,很难理解其中的含义,这时候就可以让大语言模型帮你解释,帮助你更好的理解。
  • 等等


当然缺点也有:

1. 价格高(如果是API比较贵,包月的ChatGPT Plus其实性价比还是挺高)

2. 速度慢,比谷歌翻译和DeepL这些速度要慢 这里分享一下我使用ChatGPT帮我翻译字幕的经验。

一、写好Prompt

用ChatGPT的第一条就是写好Prompt,如果你只是写“请将我翻译以下内容为中文”,也能得到一个还不错的结果,但这样只是把ChatGPT当DeepL来用了。但如果你能写一个高质量的Prompt,那么就能得到更好的结果。一个好的Prompt的结构

  • 角色、技能、个性
  • 目标、任务
  • 生成规则
  • 输入输出格式
  • 示例

比如我通常会给它先设定一个角色: “你是一位精通简体中文的专业翻译,写作风格是短小精悍、通俗易懂。” 然后给它的任务:“现在你要帮我将以下英文字幕翻译成中文” 再加上一些规则:- 忽略错别字或者拼写错误 - 翻译时结合上下文意译而不是直译 - 译文通俗、简洁、易懂 - 英文单词前后加上空格 在有些情况下给出示例,比如说:“英文单词前后加上空格,例如"中 English 文"” 有时候会说明输出格式:“提供 5 种不同类型的翻译风格:意译、直译、口语化翻译、创意翻译、文学翻译”。

二、提供足够的上下文,但一次只翻译一段,并且提供多个翻译结果选择使用

ChatGPT时,如果提供足够的上下文,那么有助于ChatGPT更好的理解要翻译的内容,给出更好的结果。所以我在翻译字幕时,会尽可能将完整字幕一次性输入,这样ChatGPT可以看到完整的内容,能更好的纠正错别字、给出更好的翻译结果。但我每次只让ChatGPT翻译一段,因为输出结果太长的问题在于:1. 很容易超出最大上下文长度,比如我输入完整英文字幕,让ChatGPT完整翻译,通常最后一部分会无法正常输出,产生“幻觉”,因为超出了最大上下文长度。2. 输出内容长的话质量要低一些,参考论文《Lost in the Middle: How Language Models Use Long Contexts》但是一次翻译一段的话,缺点就是速度慢一些,翻译完一段又要输入一段。但是对于精翻来说还可以接受,因为本来就需要慢工出细活,逐句斟酌。 另外还有一个很重要的技巧,就是翻译的时候,让ChatGPT一次提供3-5个不同风格的翻译结果,然后你就可以得到很多不同角度的翻译结果,大部分时候,你只要从这几种不同翻译结果里面选一个就可以了。ChatGPT这类大语言模型是一种概率模型,根据概率生成内容,有时候很难一次就得到一个很好的结果,所以要得到好的生成效果,可以让它一次多生成几种结果,然后你可以从中选一个最好的,甚至于你可以让它自己帮你选一个。有的时候,它能随机出来相当不错的翻译结果,所以大部分时候就只要从几个翻译选项中选一个最好的,或者组合一下。

三、追问,帮助更好的理解原文

有时候就算它提供了若干翻译选项供选择,但还是很难理解什么意思,这时候就可以在ChatGPT中追问。比如上一次我在翻译Sam Altman一段关于授权的回复时,他说:“setting the training wheels at the right height and increasing them over time as people learn more and I build up more trust.”,然后ChatGPT的翻译结果是:“适当地设置“训练轮”,并随着人们学到更多知识和我对他们的信任增加而逐步提高。”。说实话我是没看懂,如果我直接就这么翻译,从字面上理解也没问题,但是肯定有很多人像我一样看不懂什么意思。于是我就继续问ChatGPT:“能不能详细解释一下这里的"setting the training wheels at the right height"?” 于是ChatGPT给我详细解释了这里的意思:> “设置合适高度的训练轮”这个短语可以理解为在团队管理和人员培养方面,为新员工或团队成员提供适当的支持和指导,而不是一开始就给予他们太多的责任和压力。这里的“训练轮”可以比喻为在员工成长和学习的初期阶段提供的辅助工具或支持,而“合适的高度”则意味着这种支持和指导应该是适度的,既不能太少也不能太多,以便他们能够逐步学习和适应,最终能够独立完成任务和承担更多的责任。随着时间的推移,这些“训练轮”会逐渐提高,意味着给予员工更多的自由和责任,让他们有更多的机会来展示他们的能力和潜力。我继续问:“请按照上面的解释重新翻译”,于是我得到了一个新的翻译结果:“我们要像调整孩子自行车上的辅助轮那样,为他们设定合适的支持和指导,随着他们的学习和我对他们的信任逐渐增加,我们可以逐步提高这个“辅助轮”的高度。” 这样就容易理解多了,因为“training wheels”是特指自行车的辅助轮,其实去年教孩子学自行车我就知道这单词,但是没有那么熟悉,尤其是一开始被翻译成“训练轮”,我很难将它和自行车的辅助轮联系起来,但是你一追问,那么ChatGPT就能从多个角度帮你分析解释,这样译者就能更好的理解原文的意思和背景,从而提供更为准确的翻译。我觉得现在很多著作的中文翻译很晦涩难懂,很多时候是因为译者自己都没看懂,只能按照字面意思翻译,如果他们借助ChatGPT理解背后的意思,那么就能提供更好的翻译结果。

四、使用时避免上下文超长

ChatGPT这类LLM有个天然缺陷,就是上下文窗口无法太长,比如ChatGPT Plus,按我的经验,GPT-4大约8K的Token就是上限了,差不多~6000英文、~4000中文的样子。如果超出这个长度,后面的内容会出现幻觉,也就是胡说八道,出来的结果跟你输入的完全不相关。避免这个问题有两个小技巧:1. 优先使用Advanced Data Analysis(以前叫Code Interpreter)模型,这个模型上下文窗口明显能长一些2. 多用ChatGPT的编辑功能 如果你在ChatGPT中不停地回复新内容,那么每次生成的时候都会把历史消息都加入发送过去,这样越到后面占用的Token越多,一会就会超出上限。但是如果你每次只是编辑消息的话,它就只修改,不新增。所以我通常第一条消息发Prompt,第二条消息用来编辑,不停的变更要翻译的段落,这样每次都只有2条消息,基本不会超过上下文长度上限。

补充

关于消息编辑的功能使用: 我每次翻译字幕的时候,都把完整字幕输入给GPT,然后告诉它,先不要翻译,只回复OK,后面等我发新的了,你就按照我的XX要求去翻译,提供5个选项。这样我后面只要一直编辑第二条消息(参考图1),将我要翻译的段落放进去,不需要再写Prompt,然后保存发送后就自动给我翻译这一段内容,提供5个选项。并且第一条消息有完整的字幕内容,这样就算后面我发送的只有一段,它也能从第一条消息找到完整的上下文。

1db392c77cf94dbdb22c03caf7e2a2a1.jpeg

另外有时候Whisper识别字幕的时候,会产生错别字,可以直接问ChatGPT是不是有错误,它可以指出是不是有问题。

4bea46fd19e071f62e59f4b6d37afea9.jpeg

附:图一:用来让ChatGPT翻译的Prompt

1226d334a387b44c52cf3db114795e39.jpeg

图二:追问,更好的理解上下文,得到更好的翻译结果

08ef17d5cc8f00c1d495f208ec565e61.jpeg

图三:不同翻译风格的结果

49d55036eac27055ae5dba0aa3d03785.jpeg

图四:使用编辑功能避免上下文超长

ce9d63739eb208cc41cc06d7d1f90182.jpeg


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1039422.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

排序:插入排序算法分析以及相关优化(折半插入排序)

1.算法思想︰ 每次将一个待排序的记录按其关键字大小插入到前面已排好序的子序列中,直到全部记录插入完成。 直接插入排序:顺序查找找到插入的位置,适用于顺序表、链表。 2.算法实现 //直接插入排序 void InsertSort(int A[], int n) {int i, j, tem…

12.InnoDB记录结构

title: “InnoDB记录结构” createTime: 2022-03-06T15:52:4108:00 updateTime: 2022-03-06T15:52:4108:00 draft: false author: “ggball” tags: [“mysql”] categories: [“db”] description: “” InnoDB记录结构 innoDB存储引擎介绍 存储引擎的作用就是内存和磁盘打…

python随手小练2

题目: 今有物不知其数,三三数之剩二,五五数之剩三,七七数之剩二,为何? (即:一个数除3余2,除5余3,除7余2) 具体操作: xint(input(&quo…

AI编写文案工具哪些好用且免费

什么是AI编写文案工具?AI编写文案工具基于自然语言处理技术的应用程序,它们旨在协助用户创建各种类型的文案,从广告、营销材料到新闻稿和博客文章,都可以得心应手。这种技术的崛起源于对写作效率和质量的不断追求。 AI编写文案工具…

做销售管理分析需要看哪些关键指标?

做销售管理分析需要看哪些关键指标? 销售管理分析时抓取关键指标,有着能够【分析和判断销售趋势、为销售决策提供数据支持、优化销售流程和客户管理】等的好处 在了解了分析关键指标的目的之后,我们就可以根据企业的需求来确定关键指标&…

淘宝/天猫获得店铺的所有商品 API 返回值说明

淘宝API接口是为开发电商类应用程序而设计的一套完整的、跨浏览器、跨平台的接口规范。 通过开放接口,开发者可以不改变现有系统,直接在原有系统上实现新功能。 在开发过程中,使用淘宝API接口可以帮助开发者快速搭建自己的应用,实…

2023年Java毕业设计题目如何选题?Java毕业设计选题大全

大家好,我是程序员徐师兄,最近有很多同学咨询,说毕业设计了,不知道选怎么题目好,有哪些是想需要注意的。 确实毕设选题实际上对很多同学来说一个大坑, 每年挖坑给自己跳的人太多太多。选到合适的题目的话&…

Linux字符设备驱动开发

文章目录 字符设备简单介绍file_operations结构体驱动编译为模块字符设备注册与注销设备的操作函数初始化添加LICENSE和作者信息设备号的分配文件操作函数字符设备驱动示例源文件chrdev.cMakefile文件测试代码app.c编译开发板上验证 字符设备简单介绍 字符设备是Linux驱动中最…

Lua函数

--函数--无参无返回值 function F1()print("F1函数") end F1() print("*****************")--有参 function F2(a)print("F2函数"..a) end F2(2) --如果传入参数和函数数量不一致 --不会报错只是补空 F2(1,2) print("*****************&quo…

iOS应用程序的签名、重签名和安装测试

目录 前言 打开要处理的IPA文件 设置签名使用的证书和描述文件 开始ios ipa重签名 前言 ipa编译出来后,或者ipa进行修改后,需要进行重新签名才能安装到测试手机,或者提交app store供apple 商店审核上架。ipaguard有签名和重签名功能&…

9.21广读最新arxiv论文 思路学习汇总

Towards Generative Modeling of Urban Flow through Knowledge-enhanced Denoising Diffusion 摘要:尽管生成式人工智能在许多领域取得了成功,但在建模地理空间数据方面的潜力仍尚未充分发掘。城市流动,是一种典型的地理空间数据&#xff0c…

单列集合顶层接口Collection

🐌个人主页: 🐌 叶落闲庭 💨我的专栏:💨 c语言 数据结构 javaEE 操作系统 Redis 石可破也,而不可夺坚;丹可磨也,而不可夺赤。 集合体系结构 一、单列集合顶层接口Collect…

机器学习小白理解之一元线性回归

关于机器学习,百度上一搜一大摞,总之各有各的优劣,有的非常专业,有的看的似懂非懂。我作为一名机器学习的门外汉,为了看懂这些公式和名词真的花了不少时间,还因此去着重学了高数。 不过如果不去看公式&…

软件推荐:wiztree

简要介绍 近期C盘占满,找到了这款优秀的软件wiztree。 wiztree称得上最快的磁盘空间分析器,界面简洁明晰,操作简单快捷,无广告。 下载地址:https://www.diskanalyzer.com/download 软件截图

Opencv cuda版本在ubuntu22.04中安装办法,解决Could NOT find CUDNN的办法

文章目录 概要下载cuda的runfile版本配置环境变量官网下载cudann安装Opencv依赖包下载opencv和opencv_contrib并解压准备编译安装anaconda环境执行编译命令安装OpenCV并检查是否安装成功 概要 解决以下安装问题: -- Could NOT find CUDNN: Found unsuitable versi…

OpenCascade绘制贝塞尔曲线

贝塞尔曲线有着很多特殊的性质, 在图形设计和路径规划中应用都非常广泛。 贝塞尔曲线完全由其控制点决定其形状, n个控制点对应着n-1阶的贝塞尔曲线,并且可以通过递归的方式来绘制。 一阶: 二阶: 高阶: …

雷士、书客、小米的护眼台灯谁的性价比最高?三款护眼台灯真实测评

护眼台灯怎么选一直是许多家长为孩子选台灯时的一个大难题,主要因为市场上的台灯种类太多,而且这些产品中混杂了许多不专业品牌,甚至包括许多劣质台灯和网红品牌!同时也经常能够看到报道很多“抽检不合格”的情况发生,…

S08-如何冻结表格行与列

通常表格第一行或第一列的数据都是数据归类的标题 所以比较常用到的是冻结首行首列 具体操作是点击菜单栏的“开始”-“冻结窗格”“冻结首行”

图像语义分割 FCN图像分割网络网络详解

图像语义分割 FCN图像分割网络网络详解 0、介绍1、VGG16网络结构2、转置卷积3、FCN-32S、FCN-16S,FCN-8S网络结构4、损失函数5、膨胀卷积6、FCN(Backbone-ResNet-50)6.1 项目框架6.2 ResNet50网络结构6.3 FCN(Backbone-ResNet-50)网络结构6.4 FCN(Backbone-ResNet-5…

关于接口测试——自动化框架的设计与实现

一、自动化测试框架 在大部分测试人员眼中只要沾上“框架”,就感觉非常神秘,非常遥远。大家之所以觉得复杂,是因为落地运用起来很复杂;每个公司,每个业务及产品线的业务流程都不一样,所以就导致了“自动化…