荔枝集团出席扬帆出海PAGC 探讨AI在音频场景落地技术

news2024/11/24 20:09:46

近年来,中国企业的身影正不断活跃在全球商业版图上,无论是新兴技术的运用还是创新模式的尝试,其全球化的步履不停。近日,由扬帆出海主办的 2023产品与增长大会(简称PAGC)在广州广交会展馆召开,共同探索未来出海趋势和机遇,共享创新和成长生态,寻找海外市场的增长良机。

荔枝集团数据智能应用技术负责人陈宇恒受邀出席在主会场举行的AIGC出海创新产业峰会,并以“AI技术在音频互动产品中的创新探索”为主题探讨了AIGC大模型的行业现状、AI在音频社交场景的落地等话题。陈宇恒总结,AIGC是继UGC、PGC后的新一代内容生产方式,拥有巨大的生命力和可塑造性,而作为以音频为中心的声音的社交和娱乐平台,荔枝持续通过AI技术在播客、直播、社交形态上落地,并探索进一步与游戏等场景结合,增强差异化竞争优势。

长期以来,荔枝一直围绕AI语音相关技术进行了大量研究探索,并在语音识别ASR、语音合成TTS、AI变声、AIGC等多个方面取得突破,为业务的商业化应用奠定了坚实的技术基础,其中,全面推进AI聊天机器人在业务中的应用,打造聊天机器人平台成为今年行业亮点。

打造基于情感陪伴的AI聊天机器人

作为荔枝数据智能应用技术负责人,陈宇恒2015年海外留学回国后一直在互联网行业从事大数据商业智能应用与系统研发工作,曾负责手游、音频互娱产品的智能数据应用研发和技术攻关,研究方向是基于AIGC和云原生融合服务架构下大数据和人工智能的行业应用。

    陈宇恒表示,随着互联网的音频业务全球市场规模增长,在线音频业务平台生态和产品形态不断多样化,为互联网用户提供了音频类播客、直播、社交、游戏等服务场景,“从音频产业的创新技术发展来看,底层深度学习框架推动了AI在这一领域的产业化落地。基于市场和技术的双重作用,人工智能技术在音频业务中有了广泛的实践空间。”

其中,最为引人关注的是年初,荔枝在其全球化声音社交产品中接入了OpenAI的GPT模型,推出聊天机器人模块,并在3月底进一步优化,推出了全新升级版MY AI FRIEND聊天机器人。MY AI FRIEND聊天机器人不仅能帮助用户创建在线理想好友,还能为用户提供更加个性化的AI聊天体验。根据用户选择的MY AI FRIEND属性、视觉风格以及性格等,结合AIGC技术,将为用户生成AI好友的个性化形象。此外,通过MY AI FRIEND的社交互动功能,用户可以更便捷地分享心情、玩游戏、了解特色玩法。

荔枝拓展AI聊天机器人互动场景,实现AI机器人与原有社交生态的有效融合,为用户提供更多情绪倾诉和情感陪伴价值。基于荔枝在声音社交和在线陪伴领域的技术储备以及多年积累的运营经验,结合语音识别ASR、语音合成TTS等AI语音技术取得的突破,为用户提供更加差异化的在线陪伴体验。

作为长期研究和观察AI领域的专业人士,广东工业大学自动化学院副教授、粤港澳离散制造智能化联合实验室副主任孙为军表示,语音聊天机器人作为新兴的人机交互方式之一,为用户提供了更加丰富、个性化的社交体验,在增强虚拟社交生态的方面发挥重要作用。未来,语音聊天机器人将更加注重个性化服务的需求,通过持续改进的AI技术,不断提高机器人的音色、语速、表达方式等,让用户感受到更加亲切、贴心的互动体验。

AI技术在音频社交场景落地实践

据介绍,荔枝的业务中心之一就在于,以用户体验为核心,深化社区生态建设,促进音频互动业务的用户规模增长,加强用户关系的建立和沉淀。而随着AIGC和大语言模型的技术突破,为音频互动产品提供了更多创新的可能性,通过AIGC和大语言模型技术赋能业务产品创新探索将成为未来的发展趋势。

这也意味着,用户在音频社交场景下的音频体验至关重要。其中,音频社交场景与其他一些直播互动场景不同,比如教育等知识获取类场景,其着重在于知识的获取,音频的高音质体验不算是最重要的方向;比如会议类场景,其着重在于语音的流畅度和基本的清晰度,音频的全频带音质和互动性功能(比如音效、音乐、变声等)不算是最重要的方向。而音频社交场景,除了有趣的内容吸引用户外,音频的高音质体验和互动性功能也是让用户愿意持续参与的其中一个重要因素。

例如,荔枝APP的直播栏目就是一种直播+连麦的场景,即主播大部分时间是单人直播,用户一般以听众角色收听,但有时也可以通过点下方的代表连麦的电话按钮,主播收到连麦请求后,若通过,则此用户可与主播在RTC的系统里进行实时互动(例如下图的群体连麦功能。)

而主播可以依赖强大的主播引擎为直播添加音乐或音效播放、也可以调用调音台进行声音美化或通过变声增强互动的娱乐性。此场景下,多个主播可以在麦上进行互动或娱乐表演,而用户既可以在麦下收听、也可以上麦和主播们互动聊天。麦上的主播或用户是处在一个RTC系统里,而麦下的听众既可以加入RTC系统,也可以通过CDN进行拉流。

当主播进行才艺表演或播放音乐时,整个互动娱乐场景对于音质的要求是比较高的。从音频体验来讲,直播互动的文娱场景的目标就是让用户像本地参与一样参加到互动场景当中。

以“声音降噪”为例,荔枝音频技术团队基于以站内海量内容数据,通过自研训练的AI降噪算法,可以有效抑制互动文娱场景下音视频通话过程中的背景噪声,并保证语音无损伤,最终有效提升在多种复杂场景下的实时互动体验。

陈宇恒表示,随着算力持续增长,基于大数据训练的AI语音降噪算法具有强大的能力,使实时AI语音降噪算法在互动娱乐场景中成为可能。相比于传统的降噪算法,荔枝技术团队自研的 AI 降噪的效果有巨大提升,对直播场景可能经常会遇到敲键盘、喝饮料、背景讨论等噪声能进行有效抑制乃至降低到最低影响。

其中,自然语言处理(NLP)大模型(LLM)是声音聊天AI技术框架中最核心的部分。通过对自然语言处理NLP技术的深入研究和探索,荔枝推出在线聊天机器人实现了AI语音技术的应用。在线语音聊天机器人通过语音识别ASR技术可实现语音输入内容的自动识别,并应用NLP技术进行自然语言智能分析并对语意做出判断和反馈,最后通过TTS技术实现语音回复的输出,使用户可以通过语音对话与语音聊天机器人进行互动,并收到符合语境的语音回复。

陈宇恒最后总结,AIGC的出现和应用,意味着基于AI技术延伸出的大规模商业时代即将来临。对荔枝而言,抓住AIGC的机遇,持续进行前沿科技的研究和探索,进一步拓展相关技术的应用场景,包括实现语音聊天机器人在荔枝旗下音频产品中的落地,并结合音频产品的持续创新,丰富用户的声音社交、音频娱乐体验,“这有可能给荔枝全球业务带来新的机会。”

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/667211.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

6月20日作业

我实现的功能&#xff0c;执行一次应用程序led灯 亮&#xff0c;再次执行应用程序led灯灭。 内核模块&#xff1a; #include <linux/init.h> #include <linux/module.h> #include <linux/fs.h> #include <linux/uaccess.h> #include <linux/io.h&…

中职网络搭建(服务器)—Linux LVM(标准答案)

题目要求如下 使用fdisk-l查看磁盘信息 我们添加的磁盘分别是sdb和sdc Fdisk /dev/sdb 依次输入n,p,1&#xff0c;回车,2G &#xff08;新建2G的主分区&#xff09; 依次输入n,e,2&#xff0c;回车&#xff0c;回车&#xff08;使用剩余的全部空间建立扩展分区&#xff09; 依…

软件工程——第2章可行性研究知识点整理

本专栏是博主个人笔记&#xff0c;主要目的是利用碎片化的时间来记忆软工知识点&#xff0c;特此声明&#xff01; 文章目录 1.可行性研究的目的&#xff1f; 2.可行性研究的实质&#xff1f; 3.从哪些方面研究逻辑模型的解法可行性&#xff1f; 4.可行性研究最根本的任务是…

6个免费音效、配乐素材网站,无版权,可商用。

分享几个网站&#xff0c;配乐、音效素材都有&#xff0c;还是免费可商用的&#xff0c;希望能帮到大家&#xff0c;建议收藏起来~ 菜鸟图库 https://www.sucai999.com/audio.html?vNTYxMjky 虽然这是一个设计素材网站&#xff0c;但涵盖的素材非常广泛&#xff0c;想视频素材…

Git系列:运用Git创建空白分支进行项目相关文档管理

文章目录 起因一、为什么会选择Git分支二、Git分支的简单介绍和好处三、本次的具体操作1.$git checkout --orphan XXX2.删除当前分支里的内容3.提交新的分支 总结 起因 项目管理过程中没有做好相关文档管理&#xff0c;比如需求&#xff0c;开发&#xff0c;测试等文档&#x…

【Mysql】索引数据结构深入研究(一)

索引 1.什么是索引 数据库概论老师说&#xff1a;索引就是教科书的目录页&#xff0c;你要查哪个内容你就去目录页查询内容在哪。Mysql官网&#xff1a;索引是帮助Mysql高效获取数据的排好序的数据结构。 2.索引的数据结构 二叉树红黑树Hash表B-Tree 2.1 二叉树 我们先看…

右向辅助产品需求及交互策略说明书

介绍 Introduction 此文档的范围和目的 Scope and Purpose of This Document 定义并描述功能&#xff0c;功能逻辑&#xff0c;功能与驾驶员、环境和其它要素的依赖性和相互影响。为充分理解功能提供支持&#xff0c;以便支持后续阶段的研发活动。 To define and describe …

Prompt的技巧持续总结

Prompt 有很多网站已经收录了&#xff0c;比如&#xff1a;aimappro 有些直接抄上述网站的作业即可&#xff0c;不过也来看看&#xff0c; 有一些日常提问大概的咒语该怎么写。 1 三种微调下的提示写法 chatgpt时代的创新&#xff1a;LLM的应用模式比较 实际案例说明AI时代大…

在 Navicat Premium 中管理 MySQL 用户-第 1 部分:保护 Root 帐号

第 1 部分&#xff1a;保护 Root 帐号 管理数据库用户是数据库管理员&#xff08;DBA&#xff09;的主要职责之一。协调组织中的用户访问数据库的方式通常需要执行许多单独的任务&#xff0c;包括添加新用户&#xff0c;阻止已离开组织的用户的访问权限以及帮助无法登录的用户…

三、MNIST手写数字分类任务项目实战

分类任务和回归任务本质上并没有太大的区别&#xff0c;只是最终得到的结果和损失函数不同而已。 MNIST手写数字分类任务&#xff0c;最终得到的是10个值&#xff0c;也类似一个one-hot编码格式&#xff0c;表示该图片是0-9数字的概率&#xff0c;概率值最大的就是预测的最终结…

如何搭建企业内部Wiki?

企业内部wiki是一种基于web的知识管理系统&#xff0c;它可以帮助企业高效地管理和分享内部的知识和信息。搭建一个企业内部wiki需要考虑很多方面&#xff0c;包括选择合适的wiki软件、搭建服务器、设置权限、培训员工等。本文将介绍如何搭建企业内部wiki&#xff0c;以及如何管…

在职读研填充知识库,人大女王金融硕士项目是获取知识的有效途径

在工作中忙忙碌碌&#xff0c;等休息放空时&#xff0c;反而发现没有以前的快乐了。认识的人越来越多&#xff0c;反而觉得越来越孤独。或许这就是成长的代价。身在职场的我们距退休还有好久&#xff0c;这么漫长的时间不获取新知识怎么能行呢&#xff0c;让我们打开探索的窗户…

IO流(C++)

IO流C C语言的输入与输出流是什么CIO流C标准IO流C文件IO流二进制读写文本读写 stringstream的简单介绍 C语言的输入与输出 C语言中我们用到的最频繁的输入输出方式就是scanf ()与printf()。 scanf(): 从标准输入设备(键 盘)读取数据&#xff0c;并将值存放在变量中。printf():…

QtCreator屏蔽指定警告:如C4819等

QtCreator 频繁报出warning: C4819: 该文件包含不能在当前代码页(936)中表示的字符。请将该文件保存为 Unicode 格式以防止数据丢失。 方法一&#xff1a;&#xff08;屏蔽此警告&#xff09; 在工程文件.pro里面添加 # disable C4819 warning QMAKE_CXXFLAGS_WARN_ON -wd481…

【Linux】常用指令快速掌握

Linux常用指令 指令登录添加和删除普通用户ls 指令pwd & cd 指令touch 指令mkdir 指令tree 指令rm 指令man 指令nano 指令cp 指令mv 指令cat & tac 指令echo 指令more 指令less 指令head & tail 指令date & cal 指令find 指令which & whereis 指令alias 指…

【正项级数】敛散性判别(二)

【正项级数】敛散性判别&#xff08;二&#xff09; 比值判别法和根植判别法比值判别法和根植判别法例题比值/根植判别法失效时&#xff0c;该怎么处理&#xff1f;例题 比值判别法和根植判别法 比值判别法和根植判别法 例题 例1 一般遇到阶乘&#xff0c;为了方便约分&…

Java凉了吗?还能不能学Java?过来人谈谈看法!

别说Java&#xff0c;前端、python、C、C&#xff0c;哪一个没被提过“凉”&#xff1f;归根结底问题始终都只是一个&#xff1a;人确实改变了行业标准&#xff0c;但是人才过剩并不会造成行业衰退。 不可否认&#xff0c;现在Java技术栈相比前几年确实被不断拉长&#xff0c;难…

解决Tomcat控制台乱码、HTML乱码、system.out.println输出乱码、out.print乱码

开发环境 JDK8、IDEA 2023.1.2 (Ultimate Edition)、Tomcat 9.0.71 Tomcat控制台乱码 第一步&#xff1a;修改Tomcat目录下的 ./conf/logging.properties 文件&#xff0c;将3处UTF-8改为GBK&#xff0c;分别对应下图 IDEA 中的3个控制台的输出 第二步&#xff1a;删掉无用…

MySQL8.0与5.7版本的下载、安装与配置(atguigu)(史上最全最详细)

MySQL8.0与5.7版本的下载、安装与配置&#xff08;atguigu&#xff09;&#xff08;史上最全最详细&#xff09; 目录 MySQL8.0与5.7版本的下载、安装与配置&#xff08;atguigu&#xff09;&#xff08;史上最全最详细&#xff09;MySQL 8.0的下载MySQL5.7的下载MySQL8.0的安装…

01-初识threejs

基本概念 场景&#xff08;Scene&#xff09;&#xff1a;场景是 three.js 中所有 3D 对象的容器。它包含了所有的相机、灯光、几何体、材质、纹理等对象。相机&#xff08;Camera&#xff09;&#xff1a;相机定义了场景中的视角。它控制了场景中哪些部分会被渲染出来&#x…