​小语种AI翻译技术新成果,传音荣获WMT 2024国际机器翻译大赛三项冠军

news2024/12/22 14:53:01

近日,由国际计算语言学协会(The Association for Computational Linguistics,ACL)举办的WMT 2024国际机器翻译比赛结果揭晓。传音TEX AI中心翻译团队在小语种领域再获佳绩,斩获三项翻译赛道的机器自动评测冠军,一项亚军。

WMT(Conference on Machine Translation)大赛是机器翻译领域顶级国际赛事之一,在全球学术界、工业界享有盛誉。自2006年起,WMT大赛已成功举办19届,每年都吸引了来自全球各地的顶尖研究机构和企业参赛,包括包括英伟达、Yandex、清华大学等众多名企高校。本届赛事共计提交478次译文数据,竞争异常激烈。传音TEX AI中心翻译团队持续迭代基于神经网络的机器翻译技术,并引⼊前沿机器翻译算法,不断创新算法和架构,提升翻译能力,最终在激烈的竞赛中脱颖而出。

传音TEX AI中心总经理史团委表示:“AI翻译由于具备语种多、效率高、知识积累和功能迭代快等特点,为消除语言障碍、促进跨文化交流提供了无限可能性。传音持续在小语种语言语音技术上长期研究和投入,我们相信AI翻译技术将进一步促进文化交流和知识传播,助力新兴市场国家经济、科技、教育等领域的进步。传音将继续推动AI翻译技术的发展,为新兴市场用户提供更高效、更精准的翻译产品与服务,打破语言壁垒,帮助弥合数字鸿沟。”

加快拓展新兴市场小语种AI翻译技术,优化用户场景体验

传音始终专注新兴市场,加快布局小语种AI翻译技术,通过长期的语言学资源积累,不仅构建起非洲智能翻译服务体系,同时加大针对南亚、东南亚等新兴市场本地小语种的研究探索,不断提升翻译能力。

此前,传音已获得WMT 2021「科萨语-祖鲁语」非洲小语种方向的机器自动评测冠军。此次在「英语-南美西班牙语」、「英语-印地语」等翻译赛道上夺冠,正是传音AI翻译技术进一步向新兴市场多语言覆盖的结果。目前,传音翻译已成为一个日翻译数十亿字符的多语种机器翻译引擎,支持多语种间的双向翻译,质量达到新兴市场业界领先水平。

围绕AI翻译技术,传音深度布局机器翻译生态,不断拓展应用场景,已涵盖通话翻译、社交对话翻译、会议同传等,同时还为传音智能语音助手Ella、Hi Translate等提供翻译服务支持,为本地用户带来更加便捷的智能交互体验。传音手机产品不仅支持英语、法语、阿拉伯语、西班牙语、葡萄牙语等官方语言或通用语,还支持多种非洲本地语言,包括阿姆哈拉语、斯瓦希里语、豪萨语、奥罗莫语、约鲁巴语、伊博语等小语种,以满足本地用户的需求。通过海量的传音智能终端用户使用反馈,传音不断提升、改进机器翻译算法,打造“前沿研究-产品应用-用户反馈”的完整闭环。

深耕人工智能技术,打造本地化的AI内容服务生态

传音聚焦广大新兴市场,旗下传音TEX AI中心致力于研发和集成人工智能技术,增强手机的核心功能和交互体验,为用户提供个性化服务。传音以技术为核心进行持续创新,不断推进小语种语音语言技术的研究和应用,凭借前沿的语言学领域、语音领域、自然语言领域等通用人工智能技术,不断优化用户场景的产品体验,打造本地化的AI内容服务生态。

凭借深厚的语言学资源和对人工智能技术的深入研究,传音在机器翻译、多语种AI语音助手、语音深度伪造检测、语音识别等方面取得了系列突破,频频斩获相关国际大赛奖项,先后获得接连荣获中非青年创新创业大赛一等奖等奖项、ICASSP 2023 SLU口语理解挑战赛子赛道第一名、IJCAI 2023 ADD 语音深度伪造检测国际挑战赛分赛道第二名等奖项、ASRU 2023 MADASR低资源语音识别比赛多项子赛道第一名。

未来,传音将不断推动人工智能技术在小语种上的技术研究和产品应用,挖掘更多本地化场景需求,助力用户全场景AI体验,为新兴市场用户提供更优质的智能终端产品和移动互联服务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1929354.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

每日一练 - IEEE 802.1Q中STP协议

01 真题题目 关于设备 SWC 的上述配置说法正确的是 (多选) A.SWC 为根交换机 B.stp instance 1 priority 4096 是配置交换机在实例 1 中的优先级为 4096, 该优先级默认为0 C.gtp edged-port enable 该命令是启用交换机 5WC 的 Ethernet 1/0/2 为边缘端口 D.sto …

手把手教你,如何利用积木易搭3D扫描仪完成文物三维建模?

当前,文物三维建模主要技术手段主要有摄影测量技术、三维激光扫描技术、结构光扫描技术。其中,积木易搭的MagicScan作为一款先进的3D扫描仪,是正是运用了结构光扫描技术的精髓,它巧妙地融合了点云相机的高精度空间数据采集能力、纹…

解析DDD开发框架Axon

在微服务架构盛行的当下,领域驱动设计(DDD)也得到了崭新的发展。在DDD中包含了聚合、领域事件等核心概念,也需要引入CQRS、事件溯源等架构模式。对于开发人员而言,如何简单而高效的实现这些核心概念和架构模式是一大痛…

C++11之constexpr

注:大前提,本篇文章是在介绍C11中的constexpr,自C14以来constexpr有了非常大的改动,如在实验中遇见与本文不符的地方还先请查阅其他资料,确定为本文错误后可留言,我会虚心接受并改正。 constexpr定义编译…

惠海H5112A降压恒流芯片IC 60V72V80V100V转24V36V48V多路共阳输出景观LED点光源

H5112A是一款外围电路简单的多功能平均电流型LED恒流驱动器,适用于5-90V电压范围的非隔离式大功率恒流LED驱动领域。芯片采用了平均电流模式控制,输出电流精度在士3%;输出电流对输入输出电压以及电感不敏感;芯片内部集成了环路补偿,外围电路更…

学习测试9-接口测试 2-抓包工具Fiddler

Fiddler 抓包工具的使用 怎么找接口信息,可以通过浏览器的开发者工具 Fiddler 是一个 HTTP 协议调试代理工具 File 菜单: Capture Traffic(或 F12):是个开关,可以控制是否把 Fiddler 注册为系统代理。当把…

Mac系统能装虚拟机吗 Mac装双系统虚拟机详细教程 macos可以用虚拟机装windows吗

随着科技的进步和用户需求的多样化,越来越多的用户希望在一台设备上运行多个操作系统。特别是对于Mac用户来说,安装虚拟机或者双系统已成为常见需求。这不仅可以满足用户在不同操作系统工作的需求,也可以让开发人员在不同的操作系统上进行测试…

【题目/训练】二叉树的创建遍历(递归非递归)

一、根据二叉树创建字符串 思路:在正常前序递归遍历的基础上,单独加上一个考虑到右子树为空的情况,如下:其结果为 1(2(4(5)(6)))&…

财伯乐伯乐遇马税务师事务所品牌发布会圆满落幕!

7月14日 ,由财伯乐主办,伯乐遇马集团、HRS卓玥学社联合主办的财伯乐&伯乐遇马税务师事务所品牌发布会在上海闵行区隆重召开。这场盛会不仅标志着财伯乐品牌的正式亮相,更预示着企业服务领域的一次创新和突破。来自行业的领袖、合作伙伴共…

React+TS前台项目实战(二十九)-- 首页构建之性能优化实现首页Echarts模块数据渲染

文章目录 前言Echart模块源码功能分析数据渲染一、HashRateEchart统计图1. 功能分析2. 代码详细注释 二、BlockTimeChart统计图1. 功能分析2. 代码详细注释 三、使用方式四. 数据渲染后效果如下 总结 前言 还记得之前我们创建的 高性能可配置Echarts组件 吗?今天我…

【刷题汇总 -- 乒乓球筐、组队竞赛、删除相邻数字的最大分数】

C日常刷题积累 今日刷题汇总 - day0141、乒乓球筐1.1、题目1.2、思路1.3、程序实现 2、组队竞赛2.1、题目2.2、思路2.3、程序实现 3、删除相邻数字的最大分数3.1、题目3.2、思路3.3、程序实现 -- dphash 4、题目链接 今日刷题汇总 - day014 1、乒乓球筐 1.1、题目 1.2、思路 …

RflySim工具链常见问题解答

7月10日,卓翼飞思实验室暑期公益培训首场直播圆满落幕,共吸引2400余名学员参与。本期直播培训以“RflySim-智能无人集群系统快速开发与验证工具链”为主题,对RflySim工具链的功能和资源框架进行了全面详细的介绍。本文将针对使用RflySim工具链…

数据结构-java中链表的存储原理及使用方式

目录 链表(线性表的链式存储) 代码实例:(链表构建,头插尾插) LinkedList LinkedList的使用: 1、构造方法 2、操作方法 LinkedList 和 ArrayList 的区别 链表(线性表的链式存储…

论文AI疑似度太高?AIGC降痕工具助你快速降低

面对论文降痕的挑战,许多人都感受过其中的困难和挑战。论文里面如果出现“引用”过多的内容,AIGC率高的情况,这个时候怎么办呢,相信大多数的人就是替换同义词或词组、删除冗余的词汇和句子,从而来增加论文的原创性。然…

数仓实践:数据回滚的实现思路

目录 一、什么是数据回滚? 二、数据回滚的作用 1. 增量更新过程中的错误处理 2.维护数据的一致性 3.支持数据同步的可靠性 三、数据回滚的实现思路 1.标识字段的应用 2.数据同步失败的处理 3.数据同步成功后的处理 四、实战案例 在数据同步时,当历史数据…

如何用Claude 3 Sonnet Artifacts实现对数据文件的可视化分析?

如何用Claude 3 Sonnet Artifacts实现对数据文件的可视化分析? Prompt模板: Initial Request: 初始请求: I have uploaded data of the number of Software Engineering Jobs in the US since May 2020. I need different visual creative…

Package hyperref Warning: Ignoring empty anchor on input line 202.

问题 使用https://github.com/yaoyz96/els-cas-templates下载的复杂模板使用overleaf编译会出现警告 解决方案 将cas-dc.cls文件中的代码调换位置,例如将下述代码位置放到文件的最后即可解决问题 \RequirePackage[colorlinks]{hyperref} \colorlet{scolor}{blac…

干货分享 | TSMaster RPC 基础入门:编程指导和使用说明

介绍RPC模块前,我们先浅聊一下RPC的相关说明,以及在什么样的情况下需要了解本文 。 1. RPC 说明 远程过程调用(RPC, Remote Procedure Call)是一种网络通信协议,使得程序可以调用另一台计算机上的程序或服务&#xff…

# Redis 入门到精通(五)-- redis 持久化(2)

Redis 入门到精通(五)-- redis 持久化(2) 一、redis 持久化–save 配置与工作原理 1、RDB 启动方式:反复执行保存指令,忘记了怎么办?不知道数据产生了多少变化,何时保存&#xff1…

多核并行加速 tokenizer

import multiprocessingdef tokenize_text(text):return tokenizer(text, truncationTrue, paddingTrue, max_length256)def parallel_tokenize(texts, num_processesNone):"""使用多核并行处理文本分词"""with multiprocessing.Pool(processesn…