如何实现免费的文档翻译

news2024/9/24 7:15:01

文中有彩蛋,请一定要看完。

目录

文中有彩蛋,请一定要看完。

一、问题的提出

二、文档翻译现状

三、如何免费海量文档翻译

1. 采用CAT工具+机器翻译API法

2. 采用小牛文档翻译

四、学后反思


一、问题的提出

随着互联网和人工智能技术的飞速发展,在线翻译正在经历着革命性的变化。我们现在可以借助SDL Trados、 Memoq、译马CAT、YiCAT等计算机辅助翻译工具,有道、知云、GT4T等翻译软件,以及沉浸式翻译插件、彩云小译、有道灵动翻译,调用谷歌、Bing、小牛、有道等多个机器翻译API,辅以ChatGPT人工智能大模型来对译文进行评估和润色,帮助我们快速地获取流畅、准确的译文。

随着对外贸易需求不断加快,各国之间的经贸往来和人文交流日益频繁,语言服务行业也面临着各种挑战。当前,如何能够在确保翻译质量的前提下,降低使用门槛,减少支出预算,最大限度保留文件格式,高效快捷进行文档翻译已经成为校政行企等各级工作者日益增长的需求。

二、文档翻译现状

目前,文档翻译可以通过在线网站、CAT工具、翻译软件、Python调用机器翻译api来实现。

文档翻译

一般的在线翻译网站都会提供免费文档翻译,谷歌、Deepl、小牛、有道、搜狗、百度等平台都提供此项服务,收费情况也各不相同。国外的文档翻译受网络影响较大,而且收费较高,如Google的免费文档翻译提供10M以下,300页以内的文档翻译,文件仅限:.docx、.pdf、.pptx、.xlsx等格式。Deepl的入门级文档翻译收费高达8.74美元,免费白嫖难度大,而且像Deepl还会在翻译文档中放置难以根除的水印。

目前,小牛、有道、搜狗、百度等国内大厂都提供免费的文档翻译,有道、搜狗、百度的机翻质量还可以,但是其免费翻译额度有限,目前来看小牛翻译提供文档免费额度最多,每天提供100页的翻译额度,每月可享受3000页免费文档翻译额度,而且还开放了文档翻译的API,因此受到国内用户的青睐。

CAT工具是我们进行文档翻译的利器,但是前提是你必须安装价格高昂的CAT工具(如emoq每个单机授权高达5000RMB),熟练掌握Trados, Memoq或者Transmate等翻译CAT软件的基本使用方法,会使用CAT软件安装机器翻译的插件和相应的机器翻译api额度,如Trados和Memoq中内置常用的翻译插件,都可以调用免费的Bing翻译、阿里云和小牛机器翻译插件。这样方法虽然可行,但是有一定门槛,需要支付软件费用,学习CAT工具的使用方法,付出一定的学习成本,因此非专业译者一般不会采用这种方法。

Python软件也是我们调用机器翻译api进行文档翻译的重要工具。用户使用时需要有一定的Python编程语法基础,能够看懂并修改各大翻译提供商给出的样例代码,同时还得会使用python-docx, openpyxl, os等常见模块。此前我们就通过python来调用小牛机器翻译api实现快速翻译。

虽然Python是免费开源的编程软件,省去了购买CAT工具的麻烦,但是学习应用难度较大,普通的用户都会望而却步。以下是我整理个的Python调用各大机器翻译API的代码,大家可以参考使用。知云文献翻译8.0和Xtranslator两款翻译软件相互配合,则可以切换6个机器翻译引擎,进行高效的文档片段的翻译,软件是自动中英互译,不支持其他小语种,也不支持全文翻译。使用时,需要下载安装相应的翻译软件,初级用户在翻译额度上还有一定的限制。

三、如何免费海量文档翻译

如果我们要进行快速大量免费文档翻译,根据之前对文档翻译现状的分析,我们考虑尽可能地减少实现步骤,提升翻译效率和质量,降低预算。综合考量后,我们建议采用如下两种方法。由于搜狗、百度等平台有一定的页数限制,这里就不做详细介绍,主要介绍CAT工具法和小牛文档翻译两种。

1. 采用CAT工具+机器翻译API法

Trados, Memoq等国外CAT工具对计算机系统配置要求较高,运行速度慢,操作复杂,购买费用较高,因此我们采用国内免费的翻译CAT工具,如Transmate 7.3。这是一款本地安装版软件,内置百度翻译、有道翻译两款机器翻译api的调用接口,支持对于docx, xlsx, pptx等办公文件进行高效快速的翻译,还可以调用翻译记忆库和术语库,保留文件的格式。此方法的弊端是需要消耗机器翻译api的额度,百度高级认证版每月最多提供100万字符的免费翻译额度,而有道翻译目前新注册用户免费额度只有100万,用完就需要购买。

这种方法适用于懂一些翻译CAT工具的使用,追求译文高质量,希望译完进行译后编辑的中高级需求者使用。

2. 采用小牛文档翻译

小牛翻译云平台由小牛翻译团队(核心成员来自东北大学自然语言处理实验室)自主研发的国产机器翻译平台,具备稳定性和安全性的特点。

对于普通的用户,建议使用小牛的网页在线文档翻译,因为它上手容易、操作简单,不需要安装和学习CAT工具或者是学习软件,支持上百种语言的互译,而且每天提供20万字符、多达100页的免费文档翻译额度,还可以通过签到领流量的方法获取更多,足够满足我们日常的翻译需求。

小牛翻译网站界面

它的在线版支持格式:PDF、DOCX、DOC、PPT、PPTX、XLS、XLSX等文档格式,免费版可以上传大小为10M以下的文件,支持进行上百种语言之间的随意转换,是目前国内文档翻译中支持语言种数最多,提供免费的翻译额度最多的厂家之一。它支持后台自定义翻译术语库、记忆库,而且不限制条数,可以有效地对译文进行术语干预,进一步提升译文的质量。

小牛机器翻译提供清爽的翻译页面,使用者打开网站,导入文件,点击翻译就可以快速实现免费的在线文档翻译。我们可以通过以下步骤实现这一过程。

第一步,注册网站。我们需要注册小牛翻译网站,目前小牛支持手机号、邮箱和扫码注册。

注册小牛翻译

大家先进入以下网址,如果是第一次注册小牛,就可得到高达1212页免费文档翻译额度。

http://www.niutrans.com

第二步,打开网址。我们打开小牛文档翻译的网址。或者打开小牛官网,切换到文档翻译选项卡,进入档翻译界面,选择源语言和目标语言类型。

上传文件

第四步开始翻译。文件提交以后,就会出现在网页下方的文件列表当中,并且在它的右侧会一个蓝色的【翻译】按钮。点击翻译,就可以很快实现本地文档的在线翻译。由于文档上传是加密传输,不存在泄露的风险,而且整个翻译过程是在远程的服务器上进行的,因此速度相当快。

如果想进一步提升译文的质量,可以在小牛翻译的后台添加术语库和翻译记忆库,在翻译过程中启用。

文档翻译中应用术语库和翻译记忆库

第五步,下载译文。可以选择下载了。下载格式支持原文文件、译文文件和双语文件三种。

下载翻译后的文档

如果还想对译文进行简单的译后编辑,可以下载双语文件,如下图所示。

翻译后的文档

接下来,我们测试有格式的文档:我们把原文进行格式化处理,添加下划线,文字底色等,然后导入小牛翻译。以下是格式化后的原文:

带格式的原文

以下是翻译后的译文。

带格式的译文

二者对比,可以看出,在保证较高的翻译质量前提下,译文高质量地保留了原文的格式,用户不必对译文进行过多的格式调整,极大地减轻了工作量。

四、学后反思

1. 面对语言服务行业用户需求的不断提升,各大企业都在回应市场需求,不断完善自身产品,比如有道、百度都把AI技术放入了翻译工作流中,对于用户来说智能翻译、AI大模型翻译无疑更加吸引人。

2. 小牛的文档翻译的确不错,免费额度大、格式保留好、翻译质量高,但是我们也看到小牛翻译存在的一些不足,比如:界面不够大气,文字显示比较小,用户体验还需要进一步提升。尽管其自主研发了CAT插件、OFFICE插件、翻译APP,但是其翻译过程中目前还没有融入AI技术,也没有开发电脑端的翻译软件,因此未来还有进一步的提升空间。

3. 对于文档翻译的选择,建议专职译员还是用CAT工具,普通用户使用小牛、百度、Google的在线文档翻译,科研工作者阅读英文文献可以用知云和X-translator。如果想在Office中直接应用翻译,可以选择小牛翻译的office翻译插件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1312999.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【力扣】19. 删除链表的倒数第 N 个结点

19. 删除链表的倒数第 N 个结点 相比于昨天,感觉刷题越来越轻松了~ 我进步了! 以后刷题力度要加快了,因为我报了蓝桥杯!加油~ 法一:计算链表长度 思路: 首先用个函数来计算出该链表的长度,然…

接口返回HTML页面详解

import requests from bs4 import BeautifulSoup import re import jsonurl https://listado.mercadolibre.com.mx/hogar-muebles-jardin/cocina/almacenamiento-organizacion/organizadores-cocina/_CustId_570995983_PrCategId_AD# 添加 headers 和 cookies headers {User-…

批量解压imagenet1k数据集中的zip文件

导言: 最近在处理imagenet1k数据集时,面对大量的zip包,手动一个一个解压显然不是明智的选择。作为程序员,我们可以采用批量解压的方法来提高效率,下面就是解决这一问题的方法和原因分析。 问题背景: image…

拆解大语言模型 RLHF 中的PPO算法

为什么大多数介绍大语言模型 RLHF 的文章,一讲到 PPO 算法的细节就戛然而止了呢?要么直接略过,要么就只扔出一个 PPO 的链接。然而 LLM x PPO 跟传统的 PPO 还是有些不同的呀。 其实在 ChatGPT 推出后的相当一段时间内,我一直在等…

11月,1Panel开源面板项目收到了这些评论

2023年11月24日,1Panel开源面板项目(https://github.com/1Panel-dev)发布了题为《10月,1Panel开源面板收到了这些评论》的社区评论合集。在该文章的评论区,很多社区用户跟帖发表了自己对1Panel开源项目的使用感受和意见…

【思考】只有实对称矩阵才能正交对角化吗?【矩阵的合同】

1:命题改写(A可以正交对角化) 2:左乘Q右乘Q逆(Q转置) 3:取转置 4:得证 总结 可以看到,矩阵如果可以正交对角化,那么一定是实对称矩阵。 另外,这…

stm32项目(12)——基于stm32f407zgt6的频率计设计

1.项目功能 配置stm32自带的定时器,以一定的周期产生中断,在中断服务函数里面,对某个IO口进行取反,这样就在该管脚上产生了一定频率的方波(频率可以用按键调节)。然后再使用stm32的捕获功能,对产…

Python语言学习笔记之十一(DotEnv)

本课程对于有其它语言基础的开发人员可以参考和学习,同时也是记录下来,为个人学习使用,文档中有此不当之处,请谅解。 1、认识Python DotEnv dotenv是Python中的一个工具包,它主要用于谈取项目中的.env文件&#xff0…

科研论文中PPT图片格式选择与转换:EPS、SVG 和 PDF 的比较

当涉及论文中的图片格式时,导师可能要求使用 EPS 格式的图片。EPS(Encapsulated PostScript)是一种矢量图格式,它以 PostScript 语言描述图像,能够无损地缩放并保持图像清晰度。与像素图像格式(如 PNG 和 J…

VR智慧眼:为各行业打造3D数字化业务协同平台

自改革开放以来,城镇化建设一直在不断推进实施,如今各城市化速度虽然在不断加快,但随之而来的部分城市开始出现资源短缺、环境污染、交通拥堵、安全隐患等问题,因此为了满足智慧城市大型区域场景数字化升级需求,助力区…

SQL Server数据库使用T-SQL语句简单填充

文章目录 操作步骤:1.新建数据库起名RGB2.新建表起名rgb3.添加三个列名4.点击新建查询5.填入以下T-SQL语句,点击执行(F5)6.刷新之后,查看数据 操作环境: win10 Microsoft SQL Server Management Studio 20…

【项目管理】CMMI对项目管理有哪些个人启发和思考

导读:本人作为项目经理参与公司CMMI5级评审相关材料准备工作,现梳理CMMI有关知识点,并结合项目给出部分示例参考,以及本人对于在整理材料过程中一些启发和体验思考。 目录 1、CMMI定义 2、CMMI-5级 3、CMMI文档清单 4、示例-度…

【Spring Boot】Starter机制的使用及案例

一、引言 1、什么是SpringBoot Starter SpringBoot中的starter是一种非常重要的机制(自动化配置),能够抛弃以前繁杂的配置,将其统一集成进starter,应用者只需要在maven中引入starter依赖,SpringBoot就能自动扫描到要加载的信息并启…

7+m6A+分型+实验,甲基化方向的生信思路,没有思路的同学可参考

今天给同学们分享一篇生信文章“Landscape analysis of m6A modification regulators related biological functions and immune characteristics in myasthenia gravis”,这篇文章发表在J Transl Med期刊上,影响因子为7.4。 结果解读: MG相…

Notes Domino 14.0正式版发布

大家好,才是真的好。 经过12个月的等待,经过三个Beta版本的迭代,昨天晚上11:00,Notes Domino 14.0版本正式发布! 过去半年,经过我们对三个Beta版本不断的测试和介绍,一些新功能可能大家已经了…

基于Java的在线教育平台设计与实现论文

摘 要 互联网发展至今,无论是其理论还是技术都已经成熟,而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播,搭配信息管理工具可以很好地为人们提供服务。针对学生课程学习信息管理混乱,出错率高,信息安全…

人工智能如何改变未来的教育

人工智能(AI)正在以惊人的速度发展,并有可能彻底改变我们生活的方方面面,包括教育。AI 可以用于提高教学效率、个性化学习体验和扩大教育机会。 在教学效率方面,AI 可以用于自动化许多繁琐的教学任务,例如…

机器学习---音乐分类案例

1、傅里叶变换 时域分析:对一个信号来说,信号强度随时间的变化的规律就是时域特性,例如一个信号的时域波形可以表达信号随着时间的变化。 频域分析:对一个信号来说,在对其进行分析时,分析信号和频率有关的…

ubuntu下搜索文件的几种方法

一、whereis命令: whereis命令只能用于程序名的搜索,而且只搜索二进制文件(参数-b)、man说明文件(参数-m)和源代码文件(参数-s)。如果省略参数,则返回所有信息。 whereis的命令格式: whereis [-bmsu] [BMS 目录名 -f ] 文…

C语言—每日选择题—Day47

第一题 1. 以下逗号表达式的值为() (x 4 * 5, x * 5), x 25 A:25 B:20 C:100 D:45 答案及解析 D 本题考查的就是逗号表达式,逗号表达式是依次计算每个表达式,但是只输出最后一个表…