自然语言处理学习笔记-lecture10-机器翻译01

news2024/11/17 14:47:01

机器翻译的产生与发展

机器翻译 (machine translation, MT) 是用计算机把一种语言(源语言, source language) 翻译成另一种语言(目标语言, target language) 的一门学科和技术。
机器翻译的困难如下:

  • 自然语言中普遍存在的歧义和未知现象
  • 机器翻译不仅仅是字符串的转换
  • 机器翻译的解不唯一,而且始终存在的人为的标准

基本翻译方法

直接转换法

从源语言句子的表层出发,将单词、短语或句子直接置换成目标语言译文,必要时进行简单的词序调整。对原文句子的分析仅满足于特定译文生成的需要。这类翻译系统一般针对某一个特定的语言对,将分析与生成、语言数据、文法和规则与程序等都融合在一起。

基于规则的翻译方法rule-based

1957年美国学者V. Yingve在《句法翻译框架》 (Framework for Syntactic Translation) 一文中提出了对源语言和目标语言均进行适当描述、把翻译机制与语法分开、用规则描述语法的实现思想,这就是基于规则的翻译方法。
基于规则的翻译过程分成6个步骤:
(a) 对源语言句子进行词法分析
(b) 对源语言句子进行句法/语义分析
© 源语言句子结构到译文结构的转换
(d) 译文句法结构生成
(e) 源语言词汇到译文词汇的转换
(f ) 译文词法选择与生成
由于基于规则的翻译方法执行过程为: “独立分析-独立生成-相关转换”因此,又称基于转换的翻译方法。
优点:可以较好地保持原文的结构,产生的译文结构与源文的结构关系密切,尤其对于语言现象已知的或句法结构规范的源语言语句具有较强的处理能力和较 好的翻译效果。
弱点:规则一般由人工编写,工作量大,主观性强, 一致性难以保障,不利于系统扩充,对非规范语言现象缺乏相应的处理能力。

基于中间语言的翻译方法Interlingua-based

输入语句 → \rightarrow 中间语言 → \rightarrow 翻译结果

  • 源语言解析器
  • 比较准确的中间语言(Interlingua)
  • 目标语言生成器(Target Language Generator)

优点:中间语言的设计可以不考虑具体的翻译语言对, 因此,该方法尤其适合多语言之间的互译。
弱点:如何定义和设计中间语言的表达方式,以及如何维护并不是一件容易的事情,中间语言在语义表达的准确性、完整性等很多方面,都面临若干困难。

基于语料库的翻译方法

基于事例的翻译方法Example-based

输入语句 → \rightarrow 与事例相似度比较 → \rightarrow 翻译结果
资源:大规模事例库
基于事例的翻译方法
优点:不要求源语言句子必须符合语法规定,翻译机制一 般不需要对源语言句子做深入分析。
弱点:两个不同的句子之间的相似性(包括结构相似性和 语义相似性)往往难以把握,尤其在口语中,句子结构一 般比较松散,成分冗余和成分省略都较严重,这更增加了 分析句子与事例句子的比较难度。另外,系统往往难以处 理事例库中没有记录的陌生的语言现象,而且当事例库达 到一定规模时,其事例检索的效率较低。

统计翻译方法

转02

神经网络机器翻译

转03

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/107595.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring IOC和Bean生命周期以及源码分析

这篇文章主要讲解 IOC 容器的创建过程,让大家对整体有一个全局的认识,文章目录如图: 1. 基础知识 1.1 什么是 Spring IOC ? IOC 不是一种技术,只是一种思想,一个重要的面向对象编程的法则,它能指导我们如何设计出松耦…

springboot小区物业管理系统maven idea1562

本小区物业管理系统以springboot作为框架,以MySql作为后台运行的数据库,使用Tomcat用为系统的服务器,同时使用JSP显示业主界面。本系统主要包括以下功能模块:个人中心、业主管理、费用缴纳管理、疫情防控管理、小区车位管理、车位…

基于 Traefik 的 Basic Auth 配置

前言 Traefik是一个现代的HTTP反向代理和负载均衡器,使部署微服务变得容易。 Traefik可以与现有的多种基础设施组件(Docker、Swarm模式、Kubernetes、Marathon、Consul、Etcd、Rancher、Amazon ECS...)集成,并自动和动态地配置自…

Allegro如何快速统计串阻前后端的长度操作指导

Allegro如何快速统计串阻前后端的长度操作指导 Allegro可以快捷的统计出串阻前后端的长度,并且归一到一个网络中,方便查看 比如需要统计1-3的总长 具体操作如下 选择Analyze-Model Assignment出现SI Design Audit窗口,直接点击ok<

CSS -- CSS3中3D转换相关属性讲解(translate3d,rotate3d,perspective,transform-style)

文章目录3D转换1 三维坐标系2 3D移动 translate3d3 透视 perspective4 3D 旋转 rotate3d5 3D旋转 rotate3d6 3D呈现 transform-style7 3D案例3D转换 我们生活的环境是3D的&#xff0c;照片就是3D物体在2D平面呈现的例子。 3D特点&#xff1a; 近大远小。物体后面遮挡不可见 …

[论文阅读] PointSeg: Real-Time Semantic Segmentation Based on 3D LiDAR Point Cloud

文章目录1. 主要思想2. 具体方法2.1 数据投影2.2 网络结构3. 实验支撑4. 总结启示5. 相关文献paper 原论文的链接 code: 源代码链接 67.4 (car) 19.2(ped) 32.7(cyclist)|90 fps/GPU 1. 主要思想 通过什么方式&#xff0c;解决了什么问题 在SqueezeSeg的基础上&#xff0c;利用…

小学生C++编程基础 课程8(A)

912.买水果 (课程8&#xff09; 登录 913.1或2 (课程8&#xff09; 登录 914.and和or &#xff08;课程8&#xff09; 难度&#xff1a;1 登录 915.在区间里 ( 课程8 ) 难度&#xff1a;1 登录 916.区间交集 ( 课程8 ) 难度&#xff1a;1 登录 917.区间并集 ( 课程8 ) 难度…

zabbix“专家坐诊”第178期问答汇总

大家好&#xff0c;我是乐乐。早在三年前&#xff0c;我们就在社区举办了zabbix公益问答活动&#xff0c;并且定在每周三邀请资深的zabbix技术工程师&#xff0c;为社群的小伙伴进行免费的答疑。到现在已经178期了。后续我将会把每期的答疑汇总分享在百家&#xff0c;供广大的z…

Qt——基本介绍、详解对象树

目录 一.基本介绍 二.对象树 一.基本介绍 创建qt项目是&#xff0c;如果选择空窗口QWidget&#xff0c;那么mian函数中会有如下代码&#xff1a; #include "myWindow.h"#include <QApplication>int main(int argc, char *argv[]) {QApplication a(argc, ar…

【微服务】Nacos为什么丢弃短连接(http)而选择拥抱长连接(gRPC)

目录 一、现状背景 二、场景分析 1、配置 2、服务 三、长连接核心诉求 1、功能性诉求 1.1、客户端 1.2、服务端 2、性能 3、负载均衡 4、连接生命周期 4.1、心跳保活机制 4.2、需要什么 四、长连接选型对比 五、基于长链接的⼀致性模型 1.、配置⼀致性模型 1.…

Unity导出并制作window安装程序exe

前言 如果我们是做pc端游或者基于pc的一些应用的&#xff0c;那么我们肯定对打包exe应用程序不陌生&#xff0c;我们经常会用到一些软件&#xff0c;比如&#xff1a;inno setup&#xff0c;NSIS等 而使用unity做游戏开发的的人来说&#xff0c;一般导出程序都是面向手机的apk…

比亚迪艰难的国际化之路

来源:猛兽财经 作者&#xff1a;猛兽财经 比亚迪是如何在中国市场取得成功的&#xff1f; 在深入分析比亚迪&#xff08;01211&#xff09;的国际化之前&#xff0c;我们有必要先了解一下比亚迪是如何在国内市场取得成功的。为了说明这一点&#xff0c;猛兽财经将在接下来进行…

【评测】扩散流完整性测试原理

早在1997 年出台的21 CFR Part 11中&#xff0c;就对与药物产品审批放行相关的电子记录有规定&#xff0c;应采取与纸质记录相同的控制要求1&#xff0c;包括生成或维护电子记录须采用恰当的访问控制措施&#xff0c;记录变更必须体现在记录审计追踪中等。 2003年&#xff0c;…

深度理解go中的Map

这里写自定义目录标题前言map的内存模型增量扩容查找过程分析插入过程分析前言 本篇将从底层讲解map的赋值、删除、查询、扩容的具体执行过程。结合源码&#xff0c;让你彻底明白map的原理。 map的内存模型 在源码中&#xff0c;表示map的结构体是hmap&#xff0c;其定义如下…

红队隧道应用篇之Burpsuite设置上游代理访问内网(五)

为何要设置上层代理 Burp Suite设置上游代理的主要原因是为了拦截和修改来自浏览器的请求。当您在使用Burp Suite进行Web应用程序安全测试时&#xff0c;您可能希望模拟攻击者发送恶意请求&#xff0c;以测试应用程序是否能够防御这些攻击。使用上游代理可以帮助您在浏览器和目…

Android OpenGL ES 学习(十) – GLSurfaceView 源码解析GL线程以及自定义 EGL

OpenGL 学习教程 Android OpenGL ES 学习(一) – 基本概念 Android OpenGL ES 学习(二) – 图形渲染管线和GLSL Android OpenGL ES 学习(三) – 绘制平面图形 Android OpenGL ES 学习(四) – 正交投影 Android OpenGL ES 学习(五) – 渐变色 Android OpenGL ES 学习(六) – 使用…

python自定义包实例

了解python中的异常捕获与传递请点击“python中的异常捕获与传递” 了解python中的模块与包详解请点击“python中的模块与包详解” 目录 一.实例&#xff1a;自定义包 二.详解 1.新建my_utils包 2.新建str_util.py和file_util.py两个python file 3.str_util.py中的代码 演…

移动设备软件开发-AlertDialog6种使用方法

AlertDialog 1.AlertDialog的6种创建模式 1.1setMessage 1&#xff09;Java代码 //1.创建构造器AlertDialog.Builder buildernew AlertDialog.Builder(this);//2.设置参数builder.setTitle("弹窗提示").setIcon(R.mipmap.boy).setMessage("选择你的性别&#xf…

什么是WMS系统?WMS系统有什么功能

科技进步促使的数字化转型正在为大多数行业铺平道路&#xff0c;并重新定义它们在各个方面的功能&#xff0c;物流行业也不例外&#xff0c;因为它见证了日常运营的重大转变。改变物流行业的关键之一就是WMS系统的引入。仓储一直是运输和物流部门的核心支柱&#xff0c;随着新工…

基于Vue+Express+Mysql开发的手机端电影购票系统(附源码)

基于VueExpressMysql开发的手机端电影购票系统 基于手机的电影购票系统-VueNode 一个VueExpressMysql的电影售票项目 项目完整源码下载 https://download.csdn.net/download/DeepLearning_/87327200 前端展示 后台展示 项目说明 项目目录 ├── film 前端页面项目文件 …