机器翻译后的美赛论文怎么润色

news2025/1/18 18:57:51

美赛论文的语言表达一直是组委会看重的点,清晰的思路和地道的语言在评审中是重要的加分项。

今天我们就来讲讲美赛论文的语言问题。

我相信有相当一部分队伍在打美赛的时候,出于效率的考量,都会选择先写中文论文,再机翻成英文

但是这么做是有风险的:

  1. 翻译质量的不稳定:机器翻译往往不能准确地捕捉原文的意思,特别是对于那些比较复杂的学术概念和专业术语,机器翻译可能会对文本内容本身产生误解或者转化成不正确的表达。

  2. 语法和句子结构的差异:中文和英文在语法和句子结构上有很大差异。最明显的:中文喜欢把所有定语放在前面,而英文中喜欢把较长的定语作为定语从句放在后面。机器翻译可能无法很好地处理这些差异,导致生成的英文句子杂乱无章。

    同时在实践中我们发现,机器翻译喜欢把中文里比较短的几句话合并成一句很复杂的英文语段,不仅容易造成句意传达的谬误,还会使阅读理解论文意思增加难度。

  3. 与学术写作风格的差距:机器翻译往往只是单纯地逐字逐句翻译中文文本,并无法提供符合学术标准的翻译。

所以,在机翻过文本之后,我们可以通过以下几种方式来提高英文文本的质量

  1. 仔细校对和修改:这一步主要是去检查有没有明显的语义翻译错误,例如句子之间的逻辑顺序,专业术语的翻译。

  2. 人工校对:找一个擅长英文的人再次校对机器翻译的内容,例如切割长语句,更改句中主谓宾的位置使其更符合英语阅读习惯,同时确保语言的准确性和自然性。

  3. 语言润色:将文本中未达到英语学术写作的语段和用词斟酌修改。

常见的日常用语和学术写作的替换可以参考下面的表格:

接下来我们用实例来为大家一步步讲解分析润色应该怎么做。

以下文本均来自于某比赛中某一支队伍的摘要。

润色实例1

这是摘要第一段的中文版:

本文对于全球变暖的研究问题,运用ARIMA时间序列预测模型、LSTM预测模型、BP神经网络、Chow Test检验、逐步回归等方法,首先对全球变暖的趋势进行了判断与预测,其次对于影响全球温度的因素进行了探讨,最后结合分析结果对如何抑制全球变暖的趋势给出建议。

这是用某具有权威性的翻译软件的翻译结果:

In this paper, for the research problem of global warming, ARIMA time series prediction model, LSTM prediction model, BP neural network, Chow Test test, stepwise regression, and other methods are used, firstly, the trend of global warming is judged and predicted, and secondly, the factors affecting the global temperature are explored, and finally, the results of the analysis are combined with the advice on how to inhibit the trend of global warming.

让我们逐字逐句看看这里面的问题。

  • 句子冗长:这段话通篇只有一个句号,并且包含了很多内容,从研究问题的主题,到运用的方法,再到逐步的实现过程。读中文版的时候,觉得逻辑通畅。但是读到英文版,就有种一口气喘不过来的感觉。

  • 连接词的使用:句子中使用了firstlysecondlyfinally来组织内容,虽然在学术写作中是可以接受的,但是使用得太过紧密,也会给人一些奇怪的感觉。

  • 内容本身:这是摘要的第一段,我们需要确保ARIMALSTM这些模型需要在第一次出现时给出全称,而不是缩写。

因为美赛中允许使用人工智能辅助,所以接下来我们用ChatGPT来试着润色一下这段文本:

This paper addresses the research problem of global warming by employing various methods, including ARIMA time series prediction model, LSTM prediction model, BP neural network, Chow test, and stepwise regression. Firstly, the paper aims to assess and forecast the trend of global warming. Secondly, it seeks to investigate the factors influencing global temperature. Finally, the analysis results are combined with recommendations on mitigating the trend of global warming. The choice of these methods is based on their suitability and relevance to the research problem. The research design is supported by established literature in the field (cite relevant sources).

让我们再来逐字逐句看一下这里的问题:

  • the research problem of … 这个短语并不常用,GPT没有发现。

  • ARIMALSTM这些缩写GPT并没有管,因为它只能在这个语段中找出问题,并不能把它放在一个论文的语境里,也并不知道这是论文摘要的第一段。

  • 同样的问题,连接词的使用,FirstlySecondly过于紧密。这其实也是GPT在生成文本时的通病,很喜欢给文本加上并不必要的逻辑连接词,这里因为本来文本里就有,所以润色时也没有太大的改动。

  • 最后“自作主张”加了两句并不需要的解释,反而会显得论文在说大空话。

这是由我们团队GRE写作5.0(排名在全球GRE考生中占前10%)的学姐润色修改的结果:

In this paper, we address the issue of global warming by employing several analytical methods, including the ARIMA time series prediction model, the Long Short-Term Memory (LSTM) prediction model, the Back Propagation (BP) neural network, the Chow Test for structural analysis, and stepwise regression. Our objectives are threefold: to assess and forecast the trend of global warming, to investigate the factors influencing global temperatures, and to provide recommendations based on our findings for mitigating the warming trend.

没有用到复杂的单词和词组,只是把文本的内容和逻辑用一种更地道、简练、清晰的方式表达出来,这也是英语学术写作最重要的地方。

润色实例二

中文:

为预测未来全球温度水平,本文使用Python软件建立能提取线性特征的ARIMA时间序列预测模型与能提取非线性特征的LSTM模型,通过对各年份的全球温度对未来进行预测,得出全球温度水平保持波动上升趋势的结论,并预测出全球气温分别在2146年和2169年达到20(摄氏度)。

机器翻译:

In order to predict the global temperature level in the future, this paper uses Python software to establish ARIMA time series prediction model that can extract linear features and LSTM model that can extract nonlinear features, and forecasts the future through the global temperature of each year, and concludes that the global temperature level maintains a fluctuating upward trend, and predicts that the global temperature will reach 20 (degrees Celsius) in the years 2146 and 2169, respectively.

当我把文本粘贴到编辑器里时,Grammarly已经开始给这段文字疯狂划红线了,即使是机器翻译,我们也要认真查看是否存在语法问题。

这段语句的问题如下:

  • In order to这个短语其实替换成to就可以,没必要在这种地方体现语言的复杂度。

  • the global temperature level只是单纯地逐字逐句翻译中文,但是在英文语境下看得很奇怪意思也比较模糊,改为global temperature trend更明确一些。

  • 在英语中,目的这种补充性的内容最好放在一句话的末尾。

  • Python software这个短语显得不太专业,改成the Python programming language比较好。

  • establish这个词,会给人一种这个模型是自己创造搭建的感觉,这和论文实际做的工作不符,换成employ或者develop比较合适。

  • extract换成capture更恰当一点,意为模型捕获了这样的特征。

基于以上问题,该文本的润色结果如下:

This paper employs the Python programming language to develop an ARIMA model, which captures linear features, and an LSTM model for non-linear patterns, to forecast global temperature trends. The analysis of annual temperature data indicates a fluctuating upward trend in global temperatures. The models predict that the global average temperature will reach 20 degrees Celsius in the years 2146 and 2169, respectively.

润色实例三

中文:

为解决经度与全球温度线性相关性低的问题,本文使用Python软件建立BP神经网络来提取非线性特征,得出经度会改变地理位置(高原、沿海等)从而影响全球温度的结论。

机器翻译:

To solve the problem of low linear correlation between longitude and global temperature, this paper uses Python software to build a BP neural network to extract nonlinear features, and concludes that longitude changes geographic location (plateau, coast, etc.) and thus affects global temperature.

这个语段的问题如下:

  • 在中文中,相关性低和相关性弱是一个意思,但是在英文中描述相关性一般不用low而用weak

  • 这里用concludes that可能不够准确,用分析或者发现会更合适。

  • longitude changes geographic location这个表述会让人误解(其实中文就已经让人误解了),我们可以说地理状况会随着经度变化,但是不能说经度会改变地理状况。

  • geographic location (plateau, coast, etc.) 中括号及其内容很不严谨,不符合学术规范。

基于以上问题,该文本的润色结果如下:

We address the issue of the weak linear correlation between longitude and global temperature by employing a BP neural network in the Python programming environment, to identify nonlinear relationships. The analysis suggests that longitude is associated with varying geographic features, such as plateaus and coastlines, which may influence global temperature patterns.

最后我想说,学术英语写作的根本要义是,把你的研究内容和结果以一种清晰的、明确的、简洁的、严谨的、不带任何歧义的方式表达出来。

不需要用华丽的词语也不需要用复杂的句式。

以上就是针对如何润色机器翻译的论文文本的实例讲解,希望对各位论文手有所启发。

如果你在论文写作中遇到了问题,也欢迎和我交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1432146.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

海外盲盒系统搭建,加快盲盒企业出海进程

盲盒作为我国的潮流消费模式,融入了潮流、艺术、动漫等多种元素,吸引了使得越来越多的“Z世代”玩家进入到盲盒市场,促进了市场的迅速扩大,同时也吸引了众多企业入场,“盲盒经济”迅速走红。 盲盒走向海外市场 随着盲…

安装配置Oracle 11g 、PLSQL及使用Navicat远程连接Oracle

目录 一、下载 二、安装 1.执行安装程序 2.配置安全更新 3.安装选项 4.系统类 5.网络安装选项 6.选择安装类型 7.选择产品语言 8.选择数据库版本 9.指定安装位置 10.选择配置类型 ​编辑11.指定数据库标识符 12.指定配置选项 13.电子邮箱 14.指定数据库存储…

寒假思维训练day17 C. Equal Frequencies

不知不觉已经过了差不多一个月了,坚持一件事情还是有点收获的,今天更新一道1600的构造。 寒假训练计划day17 摘要: Part1 题意 Part2 题解 (有数学推导,latex形式) Part3 代码 (C版本,有详细注释) Part4 我对构造题…

Linux Zip解压缩命令

Zip 用法 $ zip [-选项] [-b 路径] [-t 日期] [-n 后缀名] [压缩文件列表] [-xi 列表] 默认操作是添加或替换压缩文件列表中的压缩文件条目,压缩文件列表可以包括特殊名称 -,压缩标准输入数据 Zip 是一个创建和管理 zip 文件的压缩工具 Unzip 是一个用…

使用 Python 进行自然语言处理第 3 部分:使用 Python 进行文本预处理

一、说明 文本预处理涉及许多将文本转换为干净格式的任务,以供进一步处理或与机器学习模型一起使用。预处理文本所需的具体步骤取决于具体数据和您手头的自然语言处理任务。 常见的预处理任务包括: 文本规范化——将文本转换为标准表示形式,…

初识C语言·编译与链接

1 翻译环境和运行环境 C语言标准ANSI C 实现C语言代码的时候 一般需要经过两种环境,一是翻译环境,二是运行环境,计算机能识别的是二进制的指令,人写完代码后通过翻译环境,使代码变成计算机能读懂的可执行的机器指令&a…

伦敦金重点知识:控制亏损的方法

在很多人的预期中,伦敦金重点知识肯定是那些涉及市场分析的方法,那些方法能帮助投资者一把抓住交易机会,在市场中建立优势。但笔者要说的是,那些方法固然重要,但笔者认为还有更加重要的,那就是控制亏损。控…

大模型增量预训练新技巧:解决灾难性遗忘

大家好,目前不少开源模型在通用领域具有不错的效果,但由于缺乏领域数据,往往在一些垂直领域中表现不理想,这时就需要增量预训练和微调等方法来提高模型的领域能力。 但在领域数据增量预训练或微调时,很容易出现灾难性…

LLM大模型

LLM 学习链接 : 大语言模型 LLM行业背景和市场需求 大模型的涌现能力 大模型核心前沿 大模型应用范式和职业规划

大数据 - Spark系列《四》- Spark分布式运行原理

Spark系列文章: 大数据 - Spark系列《一》- 从Hadoop到Spark:大数据计算引擎的演进-CSDN博客 大数据 - Spark系列《二》- 关于Spark在Idea中的一些常用配置-CSDN博客 大数据 - Spark系列《三》- 加载各种数据源创建RDD-CSDN博客 目录 🍠…

200行C++代码写一个网络调试助手(TCP服务端TCP客户端)

前言 今天分享一个200行C代码写成的QT网络调试助手。 可以先看看效果 。 因为我不喜欢用QT Designer,因此我用的组件都是使用代码布局的,所以需要设计一下布局。 界面是参考的之前写的串口助手,就是把里面的逻辑改了改,因此外观…

关于网络面试题汇总

什么是TCP/IP五层模型?它们的作用是啥?基于TCP/IP实现的应用(层协议)有哪些? TCP/IP五层模型,从上向下分别是: 应用层:应用程序本身,应用层的作用是负责应用程序之间的…

比特币ETF广告战大爆发!

作者:秦晋 贝莱德主动发起广告攻势。 2月1日,据外媒Cryptoslate报道,贝莱德在提交给美国SEC的一份文件中显示,其提出一项在建筑物侧面投影比特币ETF广告计划。 据介绍,广告内容为:「IBIT」信号是一个以迈阿…

IP风险画像在企业网络安全中应用

随着企业数字化的不断深入,网络安全问题日益突显。IP风险画像作为一种综合性的网络安全工具,为企业提供了更全面的风险评估和防范手段。本文将结合一个实际案例,深入探讨IP风险画像在企业网络安全中的成功应用。 案例背景 一家大型金融机构…

VS2019 添加程序包

dotnet add package AlibabaCloud.SDK.Bailian20230601 来提示添加程序包 选择菜单栏 项目----管理NuGet程序包 输入程序包的名称,然后添加即可, 这只是给当前工程添加,并不是给VS添加,所以你打开新工程,需要使用的话…

详解WebRTC rtc::Thread实现

rtc::Thread介绍 rtc::Thread类不仅仅实现了线程这个执行器(比如posix底层调用pthread相关接口创建线程,管理线程等),还包括消息队列(message_queue)的实现,rtc::Thread启动后就作为一个永不停止的event l…

【图论】基环树

基环树其实并不是树,是指有n个点n条边的图,我们知道n个点n-1条边的连通图是树,再加一条边就会形成一个环,所以基环树中一定有一个环,长下面这样: 由基环树可以引申出基环内向树和基环外向树 基环内向树如…

【开源】WordPress一键崩溃宕机插件(整活娱乐)

插件介绍 可一键实现Wordpress崩溃宕机的整活向插件(请勿用于非法途径,仅供整活娱乐)。鼓励关注网站性能的提升,以提供更好的用户体验,提倡为用户提供良好体验和高效速度的原则。 介绍 长期以来,人们都在…

WordPress从入门到精通【安装部署】

初识WordPress WordPress,简称WP,其简称的由来是取英文单词“word”与“press”的首字母 WP中文官网 1WP主站(英文) 官方标称,已有43%的网站在使用WordPress WordPress亮点 WP使用PHP语言开发,兼容性极…

深度学习/自动驾驶数据集大集合(目标检测/图像分割/语义分割/图像分类/)

深度学习和自动驾驶技术的发展离不开高质量的数据集,这些数据集对于训练和验证各种自动驾驶算法和模型起着至关重要的作用。深度学习/自动驾驶数据集大集合是一项汇集了多种场景、多种数据类型的数据资源,旨在为深度学习和自动驾驶领域的研究者和从业者提…