AI Codec,视频模板技术,高效视频处理,RTC+AI,感知编码,CV-CUDA,窄带高清AI...

news2024/9/24 21:18:55

AI Codec,NPU硬件加速

Topic

基于AI和NPU的Codec变革

孔德辉  中兴微电子 多媒体技术总监

伴随通信容量(包括5G以及千兆有线网络)的发展,高带宽为更多用户接入超高清视频提供了可能。但是随着用户数量的增加,高质量的压缩方案也是变得更迫切,而边缘计算平台的性能提升也为解码增强提供了算力支持。AI算法的进步则提供了更丰富的计算方式。

本次分享包括三个部分:第一部分介绍Codec在不同场景下的需求,以及使用基于混合编码策略的困境;第二部分重点分析AI-Codec的发展思路,带来的收益通过修正编码参数、修复编码缺陷或者完全端到端方法的可行性以及部署困境;第三部分将讨论从算法到NPU硬件加速或者芯片化设计的一些可能形态。通过这些介绍,与各位同行讨论“云”和“端”结合的硬件架构与性能提升方法。

1. 经典编码标准在应用中的困境;

2. AI-Codec的发展现状,益处与困境;

3. AI-NPU-Codec的可能形态探讨;

多平台视频模板技术落地实践

Topic

兼容并蓄,全平台视频模板技术创新及应用

李磊  北京美摄网络科技有限公司 研发总监

在视频内容生产过程中,效果的复用可以极大简化生产流程,提高生产效率。美摄多平台的视频模板技术方案不仅可以在包装效果上实现复用,而且配套使用美摄自研的多端工具,可以让用户根据自身使用场景,在移动端、PC端、Web端之间实现工作方式的自由切换,随时随地完成视频内容生产。同时美摄模板支持以插件的方式实现对AE效果的转化,进一步拓展了使用范围。

1. 基于美摄多平台视频技术实现的视频模板方案

2. 通过AE插件转化视频模板技术探索

3. 美摄多平台视频模板技术落地实践

高效视频处理技术架构及实践

Topic

海量视频的系统化高效处理构想和算法实践

虞新阳  沐曦 AI解决方案总监

随着短视、直播、智慧城市、5G等的快速发展,视频内容遍地开花,五花八门,相应的处理需求也多种多样。如何能高效地应对这些视频处理需求?需要数据处理的系统管理,底层计算能力,以及算法研究等多方面协同努力。

本次分享主要分为三个部分:第一部分阐述对视频处理的需求理解和归纳;第二部分介绍沐曦应对视频处理场景的GPU产品;第三部分介绍视频系统处理的解决方案构想和实践。

1. 视频处理的需求理解和归纳;

智能编码,视频超分,语音提取字幕,视频结构化分析等

2. 沐曦高性能GPU产品简介;

3. 视频系统处理的解决方案构想和实践;

AI助力ORTC技术演进

Topic

ORTC与AI互相成就之道

李雪松  OPPO 高级后台工程师

随着计算规模的增大及对计算精度要求的提高,端侧AI运算已经不能满足高精度、高算力要求的应用场景,很多AI处理算法就要搬到算力强大的云端处理。而要达到近乎等同于端侧的效果,则需要在端云传输实时性、稳定性、抗弱网、分布式、集群等技术做深入优化,从而更好的发挥云端优势。

本次分享主要内容包括与RTC紧密结合的AI应用场景,ORTC在低延时、抗弱网所做的策略保证,媒体服务器如何实现AI算法解耦、如何保障大规模AI处理的有序进行,以及如何进行有效的预警及事后取证。

1. ORTC简介

2. ORTC在实时通信技术中实践案例

3. AI及其在实时通信的应用场景

4. AI助力ORTC技术演进

5. ORTC成就AI落地的探索展望

AI驱动的感知编码技术

Topic

AI驱动的感知编码技术及其落地实践

邢怀飞  百度智能云 资深工程师

人眼视觉出发的感知编码技术,成为互联网短视频、OTT等UGC场景的重点优化手段,可以更好的降低带宽成本、提升用户体验;AI技术为感知编码优化提供了必要的辅助技术手段。

本次分享,主要介绍AI驱动的感知编码优化方案,质量评价方法,技术落地收益等。期望通过本次分享,听众能够对相关技术有所了解,更好的进行技术选型。

1. 感知编码技术背景

2. AI驱动感知优化核心介绍

3. 应用落地实践

CV-CUDA: 高性能图像处理

Topic

CV-CUDA: 高性能图像处理加速库

张毅  英伟达 GPU计算专家团队工程师

盛一耀  字节跳动 机器学习系统团队工程师

在深度学习领域,图像前处理和后处理作为非常重要的组成部分存在于众多应用之中,例如内容理解,视频特效,图片/视频检索等。传统的方案中图像前后处理会在CPU上进行,一方面会占用CPU的资源,另一方面性能较差,容易成为整个流水线的瓶颈。因此NVIDIA和ByteDance联合开发了CV-CUDA图像处理加速库,有效提升了图像处理整体效率。

目前此方案不仅在字节跳动内部业务成功落地,而且也集成到 火山引擎,有需要的业务可以去上面体验。本次分享主要分为两部分,第一部分介绍CV-CUDA的特性和基本框架,第二部分介绍CV-CUDA在字节的典型使用案例。

1. CV-CUDA特性和基本框架

2. ByteDance典型应用案例

视频超分,窄带高清AI落地实践

Topic

B站视频云画质与窄带高清AI落地实践

成超  哔哩哔哩 资深开发工程师

视频赛道卷到下半场,一定会面临体验与成本的对抗,尤其是在行业大环境“过冬”的背景下,想要在有限带宽下获得最佳的画质观感变得异常具备挑战性。从视频云业务场景的视角来看,如何有效解决cross-domain问题、如何突破低业务延迟下的算力瓶颈、如何提升单位码字承载的有效信息量,成为我们在实践过程中的应用范式。

本次分享将分为两个部分:一是介绍B站视频云云端转码中的画质提升链路。重点介绍我们基于画质修复观点下的视频超分技术在点播业务中的应用落地,以及在4K@60fps直播场景下的实践;二是介绍B站窄带高清AI所采用的低秩重构方案是如何做到在视觉无损的条件下进一步压缩18%以上码率带宽的。

1. B站视频云画质提升链路

2. 4K超分在点播/直播业务中的落地实践

3. 窄带高清AI如何做到视觉无损下的极致视频压缩

所属专题

f02998eeb80325b819791790cae34500.png

相关阅读推荐

  • AI自动剪辑生成视频探索实践

  • FFmpeg AI推理+图形渲染的可定制GPU管线

  • 奇声(IQDubbing)-- 面向影视剧的AI配音技术

  • AI时代的视频云转码移动端化——更快、更好,更低,更广

  • 对话美摄科技李磊:走出一条AI与传统视音频技术相结合的美摄特色道路

a917ebf4bfa3bb8f811bf8a6c88c3c73.gif

↓ 点击「阅读原文」立即报名!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/372410.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

排序基础之选择排序法

目录 前言 一、什么是选择排序 二、实现选择排序 三、使用泛型扩展 四、使用自定义类型测试 前言 今天天气不错,这么好的天气不干点啥实在是有点可惜了,于是乎,拿出键盘撸一把! 来,今天来学习一下排序算法中的选…

港科夜闻|全国政协副主席梁振英先生率香港媒体高管团到访香港科大(广州)...

关注并星标每周阅读港科夜闻建立新视野 开启新思维1、全国政协副主席梁振英先生率香港媒体高管团到访香港科大(广州)。2月21日下午,在全国政协副主席、广州南沙粤港合作咨询委员会顾问梁振英先生的带领下,香港20余家媒体的高管及知名媒体人士到访香港科大…

电脑技巧:分享8个Win11系统必备小技巧

目录 1、让任务栏显示“右键菜单” 2、任务栏置顶 3、还原经典右键菜单 4、Win11版任务管理器 5、新版AltTab 6、开始菜单不再卡 7、为Edge浏览器添加云母效果 8、自动切换日/夜模式 Win11在很多地方都做了调整,但由于涉及到诸多旧有习惯,再加上…

SRE中 的SLO,SLI等知识 归纳

SLA Service Level Agreement 服务质量/水平协议SLO Service Level Objective 服务质量/水平目标SLI Services Level Indicator 服务质量/水平指标下面用人、事、物的逻辑进行阐释。人和事用从上到下,从左到右的顺序。客户 - 每 1 个客户在使用产品服务时&…

gin 框架初始教程

一 、gin 入门1. 安装gin :下载并安装 gin包:$ go get -u github.com/gin-gonic/gin2. 将 gin 引入到代码中:import "github.com/gin-gonic/gin"3.初始化项目go mod init gin4.完整代码package mainimport "github.com/gin-go…

JavaSE10-循环语句(for、while、do...while)

文章目录一、for循环1.格式2.执行流程二、while循环1.格式三、do...while循环1.格式四、循环控制(break、continue)1.break2.continue五、案例1.请输出下列的形状2.打印99乘法表一、for循环 1.格式 初始化语句只有在最开始的时候执行了一次如果第一次进行条件判断的时候结果为…

测试开发 | 视频编辑SDK测试

短视频编辑SDK测试有一段时间了,因此抽时间对编辑SDK的相关内容进行简要复盘。 功能说明 短视频编辑SDK支持gif,不同格式的图片,视频文件的拼接导入,编辑,添加特效,合成导出等功能。更具体的介绍可以参照…

Elasticsearch:如何轻松安全地对实时 Elasticsearch 索引重新索引你的数据

在很多的时候,由于一些需求,我们不得不修改索引的映射,也即 mapping,这个时候我们需要重新索引(reindex)来把之前的数据索引到新的索引中。槽糕的是,我们的这个索引还在不断地收集实时数据&…

Python3-数字

Python3 数字(Number) Python 数字数据类型用于存储数值。 数据类型是不允许改变的,这就意味着如果改变数字数据类型的值,将重新分配内存空间。 Python 支持三种不同的数值类型: 整型(int) - 通常被称为是整型或整数,是正或负整数&#x…

8.Spring Security 权限控制

1.简介入门JavaEE和SpringMVC :Spring Security就是通过11个Fliter进行组合管理小Demouser实体类user.type字段,0普通用户,1超级管理员,2版主补全get set tostringimplement UserDetails,重写以下方法// true: 账号未过…

_improve-2

-------------------- 左边定宽,右边自适应方案 float margin,float calc /* 方案1 */ .left {width: 120px;float: left; } .right {margin-left: 120px; } /* 方案2 */ .left {width: 120px;float: left; } .right {width: calc(100% - 120px);fl…

【深度学习】线性回归、逻辑回归、二分类,多分类等基础知识总结

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言1. 线性回归2、逻辑回归3. 单层神经元的缺陷&多层感知机softmax 多分类前言 入行深度学习快2年了,是时间好好总结下基础知识了.现在看可能很多结论和刚学的…

SystemVerilog-时序逻辑建模(5)多个时钟和时钟域交叉

数字硬件建模SystemVerilog-时序逻辑建模(5)多个时钟和时钟域交叉数字门级电路可分为两大类:组合逻辑和时序逻辑。锁存器是组合逻辑和时序逻辑的一个交叉点,在后面会作为单独的主题处理。组合逻辑描述了门级电路,其中逻…

办公室人员离岗识别检测系统 yolov7

办公室人员离岗识别检测系统根据yolov7网络模型深度学习技术,办公室人员离岗识别检测算法能够7*24小时全天候自动识别人员是否在岗位。YOLOv7 在 5 FPS 到 160 FPS 范围内,速度和精度都超过了所有已知的目标检测器,并在V100 上,30…

2023/2/26 Vue学习笔记 配置代理解决跨域[CORS ]的问题

利用vue的脚手架巧妙的解决ajax跨域的问题 1 我们首先利用springboot服务搭建 注意这里引出了跨域[CORS ]的问题: Access to XMLHttpRequest at http://localhost:5000/getUserInfo from origin http://localhost:8080 has been blocked by CORS policy: No Access-Control-A…

【Java】Spring Boot 2 集成 nacos

【Java】Spring Boot 2 集成 nacos 官方文档&#xff1a;https://nacos.io/zh-cn/docs/quick-start-spring-boot.html pom 本次Springboot版本 2.2.6.RELEASE&#xff0c;nacos-config 版本 0.2.7&#xff0c;nacos-discovery版本 0.2.7 parent <parent><groupId&…

带你深层了解c语言指针

前言 &#x1f388;个人主页:&#x1f388; :✨✨✨初阶牛✨✨✨ &#x1f43b;推荐专栏: &#x1f354;&#x1f35f;&#x1f32f; c语言进阶 &#x1f511;个人信条: &#x1f335;知行合一 &#x1f349;本篇简介:>:介绍c语言中有关指针更深层的知识. 金句分享: ✨今天…

麻省理工学院,Web3 人才辈出

2 月 22 日&#xff0c;NFT 交易平台 Blur 创始人公开身份&#xff0c;曾就读于麻省理工学院计算机系。除了 NFT 交易平台&#xff0c;在公链、交易所、VC、媒体、Layer2 等 Web3 和 Crypto 的多个赛道&#xff0c;麻省理工学院&#xff08;MIT&#xff09;的毕业生和教授们均有…

HDMI协议介绍(二)--DataIsland Packets

前言 前文简单介绍了HDMI传输的三个周期&#xff1a;控制周期、DataIsland周期和Video周期。DataIsland传输音频和辅助数据&#xff0c;这些数据以Packet的形式传输。本文简单介绍DataIsland Packet。 目录 前言 数据岛概述 数据岛包的构造 Packet Header Paket Body Dat…

从0开始学python -40

Python3 面向对象-3 类属性与方法 类的私有属性 __private_attrs &#xff1a;两个下划线开头&#xff0c;声明该属性为私有&#xff0c;不能在类的外部被使用或直接访问。在类内部的方法中使用时 self.__private_attrs 。 类的方法 在类的内部&#xff0c;使用 def 关键字…