案例分享 | AI助力肯尼亚“Sheng”语研究

news2024/9/23 14:33:56

你听说过一种叫做“Sheng”的语言吗?这是一种斯瓦希里语-英语俚语,主要使用者为肯尼亚内罗毕等城市地区的青年。近年来,随着“Sheng”的使用量不断增加,一家非盈利组织正在帮助更新该地区的社区信息资源,随时根据词汇中的新变化做出调整,以便及时为当地的人们提供尽可能准确可靠的信息。

CLEAR Global,前身为无国界译者(Translators Without Borders,是一个非营利组织,致力于帮助人们突破语言的边界,获取重要信息并积极传达自身观点。

CLEAR Global与澳鹏Appen作为公益合作伙伴,长期在一些文化发展较为不足的地区积极开发语音聊天机器人等人工智能应用,以促进当地的文化交流和人们的心理健康。

CHALLENGE

挑 / 战

CHALLENGE

由于“Sheng”是澳鹏Appen和CLEAR Global从未处理过的一种新语言,澳鹏Appen语言学家团队需要围绕语言研究、最佳实践和方法论开发一个项目模型。澳鹏Appen团队需要提供针对该语言特性的咨询服务,并形成定制文档,在未来的应用中实现类似的输出。

“Sheng”的使用发展迅速,目前已经被应用于广告和各类社会活动中。然而,由于社区之间的语言差异很大,词汇转换率很高,为形成规范文档带来了一定挑战

SOLUTION

解 / 决

SOLUTION

在处理一种对澳鹏Appen而言复杂或陌生的语言时,我们的团队会进行结构化研究,其输出是一份语言特性(LSP)文档。LSP是一份简明的研究文档,它概述一种语言的语音、语法和缀字法,以及该语言的应用环境,例如语音聊天机器人等

“Sheng”LSP需要强调这些变化模式,以帮助开发人员在他们的模型中妥善处理可变性。在两个多月的时间里,项目团队提供了5种咨询模板、一份Sheng LSP文档和一份LSP模板,其中包含了创建未来LSP文档的说明

“作为一名母语为Sheng和斯瓦希里语的人,澳鹏Appen提供的LSP文档的精准度让我印象深刻。这是个强大的工具,展现出诸多未开发语言的无限可能,相信我们可以在这些语言领域大有所为。”

——Paul Waramabo

CLEAR Global 斯瓦希里语负责人

RESULT

成 / 果

RESULT

该项目的咨询模板和LSP模板专为CLEAR Global开发,供人们进行可持续的进一步研究,特别是研究不太为人所知的小语种。通过澳鹏Appen提供的材料,CLEAR Global能够开发自己的LSP研究文档,用于未来开发一系列非洲语言的ASR模型。

与此同时,澳鹏Appen也通过参与此项目深受启发,为不同项目开发和编写的LSP文档的专业知识和流程得到进一步优化,这对于未来研究资源较少的语言和方言将大有裨益

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/171465.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【6s965-fall2022】深度学习的效率指标

两个核心指标是计算和内存(Computation and Memory)。需要考虑的三个维度是存储、延迟和能耗(Storage, Latency, and Energy)。 延迟 Latency Latency max(Toperation,Tmemory)max(T_{operation}, T_{memory})max(Toperation​,Tmemory​) 能耗 Energy 内存访问比计算更消耗…

Softmax Loss、AAM-Softmax(ArcFace)、Sub-center ArcFace的PyTorch实现与代码解读

概述 说话人识别中的损失函数分为基于多类别分类的损失函数,和端到端的损失函数(也叫基于度量学习的损失函数),关于这些损失函数的理论部分,可参考说话人识别中的损失函数本文主要关注这些损失函数的实现,…

开源PPP软件PRIDE-PPPAR使用记录(二)解算网友发来的GNSS观测文件

最近有个网友发来了几个GNSS原始观测文件,想使用TerraPos处理一下看看结果。 TerraPos打开这几个文件,都报一个格式错误,见下图: 正在上传…重新上传取消​ 这个问题不难,解决之道就是按照上一篇文章的方法&#xf…

杭州到温州老家自驾路线优化与整理

欢迎关注更多精彩 关注我,学习常用算法与数据结构,一题多解,降维打击。 背景及义意义 背景 考虑到后续经常回老家,需要提前熟悉回家的路线。杭州和温州有很多快速路和国道与高速是基本相伴而行的,可以利用这些道路取…

在项目管理中,甘特图是最常用的工具之一

在项目管理中,为了能对项目过程进行监控,可视化进度管理,需要使用辅助工具来帮助我们管理项目,而甘特图则是其中最经常使用的工具之一。 甘特图更够清晰的反映项目各个阶段的计划,任务由谁负责,计划与实际…

mysql性能优化二

1 mysql 基本功能 1.1、mysql连接器的工作流程: 1.2、查看连接状态: show processlist; Note:客户端太长时间没动静 就自动断开 这个时间是由wait_timeout参数控制的,默认8h 长连接短链接 长连接是链接成功后,如果客户端持续有请求,则使用同一个链接[尽量使用长连接,因为每次…

通用NetCore前后端分离项目Linux系统部署步骤

最近参与的大部分项目都是NetCore API加SAP页面的形式,都是部署在linux系统上,本文记录新领的服务器的部署步骤。采用NetCore3.1,MySql数据库。 本文记录的程序名:myapp.dll 部署文件保存目录: 后台程序:/u…

SOLIDWORKS 2023新功能揭秘!装配体升级 阵列实例、配合错误修复、零件替换同步更新

SOLIDWORKS 2023全新面世,今天众联亿诚为大家带来SOLIDWORKS 2023装配体的新功能揭秘,SOLIDWORKS 2023对装配体进行功能增强,并且继续加强性能,让我们深入研究这些令人振奋的新功能吧!在装配体中阵列是一种常见的、节省…

jfow-core 代码分析

EntityNoName目录概述需求:设计思路实现思路分析1.code:2.code2:3.FLows4.frm5.code3:code4:EntityTreeAttrEntitiesNoNameenum:JUmp way参考资料和推荐阅读Survive by day and develop by night. talk for import biz , show your perfect code,full bu…

深度学习是什么?深度学习和神经网络的区别是什么

1、深度学习中什么是人工神经网络? 人工神经网络(Artificial Neural Network,即ANN )是从信息处理角度对人脑神经元网络进行抽象,是20世纪80年代以来人工智能领域兴起的研究热点,其本质是一种运算模型&…

C++——多态、异常、转化函数

目录 一、多态 二、异常 ​三、转换函数 3.1标准转换函数 3.2自定义转换函数 3.3隐式转换&#xff08;explicit&#xff09; 封装Thread类 一、多态 c支持用基类的指针指向派生类。 #include <iostream>using namespace std;class A{ public:A(){ }~A(){ cout<…

vite+vue3环境变量的配置

文章目录一、vite1. 环境变量2. env 文件2.1 环境加载优先级2.2 TypeScript 的智能提示3. 模式二、vue1. 开发环境2. 生产环境3. 在 vite.config.ts 使用环境变量一、vite vite官方文档&#xff1a;环境变量和模式 1. 环境变量 Vite 在一个特殊的 import.meta.env 对象上暴露…

爱普生LQ-635K针式打印机打链式打印纸设置自动切纸方法

链式打印纸还有别的叫法&#xff0c;折叠式打印纸、复写打印纸、等分打印纸、电脑打印纸...... 其实链式打印纸是打印纸的两边带孔的具有复写功能的一种。链式打印纸可连续打印&#xff0c;很合适大量的使用&#xff0c;节约放纸时间。 链式打印纸有整张、二等分、三等分的规格…

python比较两张图片并获取精准度

先安装依赖库dlib、face_recognition、cv2下载wheel文件&#xff1a;python3.6&#xff1a;dlib-19.7.0-cp36-cp36m-win_amd64.whl: https://drfs.ctcontents.com/file/1445568/768652503/68cb5d/Python/dlib-19.7.0-cp36-cp36m-win_amd64.whlpython3.7:dlib-19.17.99-cp37-cp3…

Spring中的IOC和AOP

IOC(控制反转)和AOP(面向方面编程)作为Spring框架的两个核心&#xff0c;很好地实现了解耦合。所以&#xff0c;简单来说&#xff0c;Spring是一个轻量级的控制反转&#xff08;IoC&#xff09;和面向切面&#xff08;AOP&#xff09;的容器框架。 spring的基本框架主要包含六…

2023年中职网络安全技能竞赛网页渗透(审计版)

三、竞赛任务书内容 (一)拓扑图 网页渗透测试 任务环境说明: 服务器场景:Server2127服务器场景操作系统:未知(封闭靶机)用户名:未知 密码:未知访问服务器网站目录1,根据页面信息完成条件,将获取到的flag提交;访问服务器网站目录2,根据页面信息完成条件,将获取…

SpringCloud(10):Hystrix请求缓存

1 类继承的方法来实现请求缓存 1.1 编写CacheCommand类 package com.study.service.hystrix;import com.netflix.hystrix.HystrixCommand; import com.netflix.hystrix.HystrixCommandGroupKey; import com.netflix.hystrix.HystrixCommandKey; import com.netflix.hystrix.H…

面试 | Python 自动化测试技术面试真题

本文为面试某公司测试开发&#xff0f;自动化测试工程师时的面试题笔记。 全部笔试内容没有全部写全&#xff0c;只贴通用性的技术相关的笔试面试题&#xff0c;至于测试理论和团队管理的问题&#xff0c;都是大同小异&#xff0c;也没什么实际的参考价值。 1.直接手写一个 Pyt…

智慧工地 | 数字孪生楼宇施工管理平台

随着科学技术的进步&#xff0c;时代的发展&#xff0c;越来越多的智慧应用走进我们身边&#xff0c;万物互联不再是口号。当前智慧城市建设的兴起&#xff0c;都在要求建筑实现与物联网结合&#xff0c;使其扩展和延伸到建筑物和任何物品之间进行交换和通信&#xff0c;也就是…

python环境构造

目录 1. python安装包下载 2. 双击默认安装即可 3. python插件安装 4. 本地手动安装python插件 1. python安装包下载 可以去官网 (Download Python | Python.org) 下载&#xff0c;但是可能速度会比较慢 也可以去我的百度网盘下载&#xff0c;版本是win64 3.11.1版&#xf…