RTE2023大会来袭,声网宣布首创广播级4K超高清实时互动体验

news2024/11/14 3:44:12

10月24日,由声网和RTE开发者社区联合主办的RTE2023第九届实时互联网大会在北京举办,声网与众多RTE领域技术专家、产品精英、创业者、开发者一起,共同开启了以“智能·高清”为主题的全新探讨。本届RTE大会将持续2天,开展1场主论坛及20+专场活动,包括RTE领域技术开发、趋势洞见、行业观察、创业投资等多维度内容分享,覆盖了AIGC、出海、数字化转型等时下最热门的话题。

在24日主论坛上,声网创始人兼CEO赵斌、声网合伙人兼客户成功副总裁孙雨润带来了《智能·高清 开启实时互动体验新时代》的主旨演讲。Founders Space创始人兼CEO 史蒂夫‧霍夫曼 (Steve Hoffman)从国际投资人视角,洞察了AI赋能RTE未来的诸多可能性。声网首席科学家、CTO钟声聚焦AI时代实时互动的趋势,带来了最前沿的技术观点和解读。联合国人口基金(UNFPA)驻华代表处副代表兼负责人欧雯姗(Ira Ovesen)则从“科技无国界”的角度,介绍了实时互动技术为世界带来的改变。

此外,声网首席运营官刘斌、喜马拉雅首席科学家卢恒、Soul APP技术副总裁张高政、小红书音视频架构负责人陈靖、商汤科技商务总监 数字文娱事业部副总裁李星冶,还以”AI如何赋能实时互动体验改善及场景升级“为主题进行了圆桌讨论。

智能·高清 开启实时互动体验新时代

回顾2023年,AIGC大模型驱动着各行业迎来新业务机会,AR、VR、XR等技术能力的迭代为实时互动在各个领域的应用提供了更多可能。在直播社交领域,弹幕玩法成为直播新风口,这些变化都影响着RTE行业的进化。

智能和高清正在推动实时互动体验进入全新时代,在大会开场演讲中,赵斌宣布:“声网在RTE行业首次实现广播级4K超高清实时互动体验。”他指出, “4K不仅仅只有分辨率一个纬度,光亮强度的动态范围、色彩的真实度、饱和度,以及色彩渐变的细腻程度,都是真正超高清体验里不可或缺的一环。”广播级超高清可以带来更加逼真的视觉效果,高对比度和丰富的色彩表现可以使影像更加生动,细节更加清晰,并以此提升观影体验。

赵斌认为,虚拟人+AIGC所创造的情感和情绪价值或将在未来解决社交供需不平衡的现状,并引领交互对象发生变化。另一层面,随着AIGC能力的进一步加强,越来越多的应用型开发将被AIGC替代,API+AI的形式将大幅提高应用开发效率。

大模型在快速发展,但交互界面仍局限于文字聊天互动方式。赵斌提到,通过过去一年的投入和打磨,声网推出行业首创AIGC-RTC能力模块,可支持与任何大模型平台结合,实现更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交 、直播、游戏等多种场景提供新玩法、新机会。

在AI等核心技术驱动下,实时互动QoE体验的变化对于用户留存和使用行为的影响日益增强。孙雨润介绍,“根据声网某东南亚头部泛娱乐客户数据显示,当视频从标清升级高清,停留超过30秒观众数提升19%,观众人均观看时长提升30%,同时观众打赏率大幅提升。某国内知名社交出海App,从CDN 升级声网极速直播,送礼率增长 12.3%。”

AI如何赋能RTE未来

AIGC被认为是当前的技术革命,它与RTE的深度结合,又将带来什么改变呢?Founders Space创始人兼CEO 史蒂夫‧霍夫曼在分享中指出:“人工智能将对许多领域产生影响,在AI赋能的RTE未来,我们将看到每个人都会拥有更加个性化的体验,更加动态的程序将随着图形、音频、视频的实时变化而变化,AI将为我们带来前所未有的连接方式。在更深层次上,AI还将为人类增加更多的生产力水平,带来动态的虚拟世界等等,让我们感受到更多的沉浸体验。”

史蒂夫‧霍夫曼表示:“在AI和RTE技术的加持下,新的穿戴设备可能会进入市场,比如新的皮肤电子设备、感官增强设备等,它可以让我们听到人类听力范围之外的频率。此外,脑机接口也将读取我们的脑电波,从而帮助我们实现冥想或对其他设备的控制。”在工业RTE场景应用下,人们可以聚在一起,实时通过虚拟或真实工厂观看流水线运作、产品生产等。在AI陪伴场景中,人工智能伴侣这一概念将成为人们社交生活、娱乐、事业的一部分。

综上,未来可能会有各种类型的伴侣应用以及新的实时接口方式出现,甚至会出现一套为RTE开发的全新硬件,这些都将极大改变RTE领域的发展前景。

AI时代 实时互动何去何从

AI时代已经来临,实时互动该何去何从?声网首席科学家、CTO钟声为我们带来了技术视角的深度分享。钟声指出,回溯过去五年,最典型的事件就是大模型的突破,从2017年的Transformer,到如今的ChatGPT-4,人工智能的发展,让信息传播和消费智能化的趋势越来越明显,万事归于中心化AGI接管的趋势和威胁也越来越明显。大模型在带来发展机遇的同时,也带来了计算需求快速增长、算力受能源供给力限制、大模型数据资源不够、存储需求增长过快等问题。未来,我们除了要做负责任的AI之外,在端上和边缘上的分布式实时智能将成为价值公平分配的重要技术手段,也是减缓中心化AGI对人类威胁的有效途径,这也注定会成为一个新的技术发展趋势。

钟声认为,AGI将走进实时互动,实现人人可分身,帮助在应用场景中复制名师、网红,甚至普通人也将通过AI分身丰富体验、缓解时间稀缺的瓶颈。此外,他预测,具备端边实时智能的高清实时互动能力将成新趋势和竞争焦点。

钟声介绍到,实时高清需要许多端上实时AI,在Low Level Vision and Audio这一需求层面,声网的SDK 4.1.x, 4.2.x版本已经可以支持1080P/4K视频的例如超分、虚拟背景、感知编码、降噪、去回声等底层计算机视觉处理和高音质的计算机听觉处理能力。在High Level Vision and Audio层面,声网已经部分实现对物体、声音、场景的理解和重构能力,包括面捕、动捕、情感计算,物体识别和场景重建等,可以大力改善多种应用场景下的用户体验。

科技赋能:共筑数字包容未来
 

在一个科技无国界的世界里,人工智能、实时互动技术、生物技术、材料科学等技术创新力量构建了一个“数字包容”的世界。过去一年,联合国人口基金与声网通过实时互动技术,为中国偏远地区的一万多名青少年提供了适龄的健康教育。联合国人口基金(UNFPA)驻华代表处副代表兼负责人欧雯姗表示,“人工智能和实时互动技术为那些仍在使用型号较老的多媒体设备的学校提供了量身定制的解决方案。它不仅优化了直播流的分辨率,还增强了在教学和学习过程中的音视频质量。学生和直播教师可以实现像传统课堂那样身临其境的教学质量和速度。”

同时,欧雯姗宣布,联合国人口基金驻华代表处与声网及其他合作伙伴联合发起了“智享银龄”科技助老青年创新挑战赛。她表示,“我们希望激发青年人,特别是大学生和年轻毕业生,为代际数字包容贡献想法并做出积极行动。”

圆桌:AI如何赋能实时互动体验改善及场景升级?

AI技术的发展为各行各业带来了用户体验改善和场景玩法创新。针对这一话题,喜马拉雅首席科学家卢恒、Soul APP技术副总裁张高政、小红书音视频架构负责人陈靖、商汤科技商务总监 数字文娱事业部副总裁李星冶、声网首席运营官刘斌进行了圆桌讨论。

谈到AI技术对业务发展的影响时,卢恒表示,作为全国最大的有声内容平台,喜马拉雅从文本处理到音频内容生成的过程中都使用了大量的AI技术,目前,AIGC生成的音频内容日均播放量已超过250万小时。张高政则表示,大模型的理解能力对于UGC平台及用户来说都非常有利,它不仅可以快速提升内容生产效率,还能降低内容生产门槛。

AI大模型的发展是机遇与挑战并存的。陈靖指出,对于很多公司而言,说清楚一些AI大模型项目的必要性是一个巨大挑战,很多项目并不像利用AI去做体验增强那样,能够跟用户留存及转化的一些指标建立关联。李星冶则表示,他所看到的挑战有两点。其一,在为许多C端流量产品提供服务时,算力、带宽、智力相关的弹性储备是一个很现实的挑战,其二,大模型开发厂商如何平衡投入以及预期收入之间的关系,也是一个挑战。各位嘉宾还分享了AI大模型在实时互动领域的一些玩法创新,其中陈靖提到,提高主播观看率的美颜美体功能可能是过去AI为实时互动领域贡献最大价值的场景,希望今后会看到更多新的尝试。

如刘斌所总结的,无论未来是挑战还是机遇,我们都应该在各自行业里去努力尝试。我们也期待,在大模型新的范式发展下,看到越来越多的场景落地及业务价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1131667.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【路径规划】A*算法 Java实现

A*(A-Star)算法是一种广泛使用的寻路算法,尤其在计算机科学和人工智能领域。 算法思想 通过评估函数来引导搜索过程,从而找到从起始点到目标点的最短路径。评估函数通常包括两部分:一部分是已经走过的实际距离&#x…

「我在淘天做技术」双 11 背后的营销技术体系

作者:朱咏杰(小枫) 近期淘天集团秋季 2024 届校园招聘正式启动,预计将发放 2000 多个 offer,其中技术类岗位占比超过 50%。为了方便大家更真实地了解淘天技术的布局和现状,我们策划了「我在淘天做技术」系列,首次全面分…

科技资讯|苹果穿戴新专利,表带、服装等织物可变身柔性屏幕或扬声器

根据美国商标和专利局(USPTO)本周公示的清单,苹果公司获得了一项新的技术专利,可以在 Apple Watch 表带、服装等物品上,引入基于织物的柔性扬声器。 根据专利描述,通过在织物中嵌入声学组件(例…

Makefile总结

一、Makefile用法及变量(自定义变量、自动变量、隐含变量) 一、Makefile的重要性 1、编译文件 2、正常编译,文件多的时候操作麻烦 3、决定能不能完成大型工程 二、Makefile的概述 1、自动化编译-makefile 编译效率:make编译…

01.MySQL(SQL分类及使用)

注意:DML只是进行增删改,DQL才有查询 分类全称说明DDLData Definition Language数据定义语言,用来定义数据库对象(数据库,表,字段)DMLData Manipulation Language数据操作语言,用来…

vue3的getCurrentInstance获取组件实例踩坑记录

一、getCurrentInstance基本用法 我们可以通过 getCurrentInstance这个函数来返回当前组件的实例对象,也就是当前vue这个实例对象 Vue2中,可以通过this来获取当前组件实例; Vue3中,在setup中无法通过this获取组件实例,console.lo…

ElasticSearch中关于Nasted嵌套查询的介绍:生动案例,通俗易懂,彻底吸收

题注:随着对ES接触的越来越深入,发现此前了解的ES知识点有点单薄,特此寻来ES知识点汇总成的一个思维导图,全面了解自己掌握了哪些,未掌握哪些。此外,作者斌并没有足够的精力学习ES全部的知识点,…

1024程序员节,飞桨星河社区开发者们一起闯关升级、玩转Prompt应用赢大奖~

1024,是属于每一位程序员/程序媛的节日~ 今年,飞桨给星河社区的开发者们也准备了“超级码力 碰撞未来”系列活动,和大家沉浸式玩转闯关冒险。 冲榜单 零代码打造爆款Prompt应用 飞桨AI Studio星河社区上线新版文心一言专区,帮助…

代码随想录算法训练营第三十三天 | LeetCode 1005. K 次取反后最大化的数组和、134. 加油站、135. 分发糖果

代码随想录算法训练营第三十三天 | LeetCode 1005. K 次取反后最大化的数组和、134. 加油站、135. 分发糖果 文章链接:K次取反后最大化的数组和 加油站 分发糖果 视频链接:K次取反后最大化的数组和 加油站 分发糖果 目录 代…

STM TIM(二)输出比较

STM TIM(二)输出比较 输出比较简介 OC(Output Compare)输出比较 输出比较可以通过比较CNT(CNT计数器)与CCR寄存器(捕获/比较寄存器)值的关系,来对输出电平进行置1、置0…

Camtasia2024中文免费版电脑录屏软件

真的要被录屏软件给搞疯了,本来公司说要给新人做个培训视频,想着把视频录屏一下,然后简单的剪辑一下就可以了。可谁知道录屏软件坑这么多,弄来弄去头都秃了,不过在头秃了几天之后,终于让我发现了一个值得“…

如何理解Go言中的Context?

目前看过除了《go语言程序设计》以外最好的教程:https://www.practical-go-lessons.com 原文:https://www.practical-go-lessons.com/chap-37-context 你将在本章中学到什么? 1.什么是上下文? 2.什么是链表? 3.如何…

DAOS学习笔记及思考

DAOS带来的思考 根据daos docs的描述,DAOS是Intel基于NVMe全新设计开发并开源的异步对象存储,充分利用下一代NVMe技术的优势,对外提供KV存储接口,提供非阻塞事物I/O,端到端完整性,细粒度的数据控制&#x…

班级信息收集小程序

老师们!这里有一个超级实用的班级信息收集小程序,让你告别繁琐的手动记录成绩,轻松实现学生自助查询成绩!是不是很期待? 什么是成绩查询系统? 成绩查询系统是一种基于互联网和数据库技术的应用程序&#x…

基于springboot+vue实现MOBA类游戏攻略平台项目【项目源码+论文说明】

基于springbootvue实现MOBA类游戏攻略平台 摘要 随着信息技术和网络技术的飞速发展,人类已进入全新信息化时代,传统管理技术已无法高效,便捷地管理信息。为了迎合时代需求,优化管理效率,各种各样的管理系统应运而生&a…

HTML5+CSS3+JS小实例:打散文字随机浮动特效

实例:打散文字随机浮动特效 技术栈:HTML+CSS+JS 效果: 源码: 【HTML+JS】 <!DOCTYPE html> <html><head><meta http-equiv="content-type" content="text/html; charset=utf-8"><meta name="viewport" conte…

SRS Config 二 Stream Caster

SRS StreamCaster 1 官网简介 Stream Converter侦听特殊的TCP/UDP端口&#xff0c;接受客户端连接和媒体流&#xff0c;并转成RTMP流&#xff0c;推送给SRS。 简单来说&#xff0c;它将其他流转成RTMP流&#xff0c;工作流如下&#xff1a; Client ---PUSH--> Stream Co…

微信小程序云开发笔记-初始化商城小程序

一 下载小程序工具 下载地址 二 创建小程序 三 初始化小程序 1 把cloudfunctions文件夹内所有文件删除 2 把miniprogram\components下所有文件删除 3 pages文件夹里面只保留index文件夹&#xff0c;其他都删除并修改index文件夹下文件 index.js 把数据清空&#xff0c;只保…

GEAR框架: Tractian的敏捷工程文化

GEAR(齿轮)框架是工业初创公司TRACTIAN提出的敏捷开发框架&#xff0c;强调一切以人为中心&#xff0c;客户需求为最高优先级&#xff0c;互动胜于流程的开发文化。原文: The GEAR Framework — Tractian’s Agile Engineering Culture GEAR框架&#xff0c;由TRACTIAN和Pietro…