音视频技术开发周刊 | 277

news2024/10/6 10:43:07

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。


0d9562e3300089923701fe8bca720927.png

GNNear:基于近内存处理的大规模图神经网络训练加速器

图神经网络(GNNs)已经成为分析非欧几里得图数据的最新算法。然而,实现高效的GNN训练是一项挑战,特别是在大规模图上。本文基于一篇于2022年发表在PACT上的论文,主要介绍基于近内存NMP的大规模图神经网络训练加速器GNNear。

BiSeNet V2:用于实时语义分割的带引导聚合的双边网络

本文提出了一种能有效权衡速度和准确度的高效框架 BiSeNet V2,它包括一个细节分支和语义分支。由于减少了通道数并采取了快速下采样策略,语义分支是一个轻量分支。此外,设计了一个引导聚合层(GAL)来增强相互连接并融合两种类型的特征表示;还设计了一种新的助推器训练策略来在不增加额外推理成本的基础上提高语义分割性能。定量实验和定性评估表明,所提出的体系结构优于最先进的实时语义分割方法。

4d32b53ee77f26f8f38d89cf48e41264.jpeg

物体自转对声音散射的影响

一个由KAUST(阿卜杜拉国王科技大学,King Abdullah University of Science and Technology)领导的国际团队建议,旋转物体和声波之间的相互作用可以帮助开发高精度工具,例如通过操纵声波来控制亚毫米物体的运动和位置的镊子。

空间音频在视频会议场景中的应用

空间音频(Spatial Audio)在影院、游戏、虚拟现实、舞台录音等场景中得到了广泛的应用,它提供给用户更加接近于真实的听觉感受。空间音频的实现方式有多种,常见的有基于心理声学原理、基于物理声场的重构、和基于双耳音频的精确重放。

风会不会影响声音传播的速度?

声音是一种波,是空气的振动,当空气流动起来之后,声波的传播可以分解成两种运动的叠加,空气的流动和声波相对于空气的运动。

c8528e50f1b238e26c1b348a31f09353.jpeg

即时互动、跨全平台,如何实现一场高难度元宇宙演唱会?

上周,首届全球数字贸易博览会在浙江省杭州市圆满落下帷幕,展会汇聚境内外800余家数字贸易头部企业,在这之中,「大有」元宇宙开放平台亮相同时摘得DT先锋奖铜奖,并首次对外展示了一场重新定义的“元宇宙演唱会”,该演唱会引来数十家媒体关注报道,吸足眼球。

891ffb4002f11ea180a6f839604f87d1.jpeg

播放器成功率优化

视频播放器是视频消费链路最核心的组件,针对播放器我们通常最关心的体验有:视频播放是否会出错、视频起播速度是否够快、视频播放过程中是否会出现卡顿;对于直播场景,我们还会关心:直播的延时是否比较低。

7a996d54a9d585e5723ae0b4516a25b4.png

Hi, SRS 5.0!

随着志宏大神合并完DASH的功能,SRS 5.0正式完成功能,进入一年左右的稳定性提升阶段,预计在2023年底正式发布,现在已经可以开始体验SRS 5.0的Alpha版本了。

2fd964fd00cc7d8da6108c7a29d30502.png

卡塔尔世界杯科技系列:算力网络为赛事直播保驾护航

咪咕在这次世界杯中打造的“内容+科技”的融合创新,背后离不开中国移动“5G+算力网络”的重要支撑。其保证了多元场景的连接,海量数据的传送,为广大球迷开启了“元宇宙世界杯”,不仅有4K/8K超高清电视转播,还有AI复刻赛场、在孪生赛场上还原精彩进球的数实融合黑科技体验。这一期我们就了解一下算力网络的核心技术和应用。

B站公网架构实践及演进

根据2022年Q3财报数据,B站的MAU已经稳定增长至3.3亿。用户在闲暇之余刷刷视频、看看直播,给自己喜爱的UP主一键三连,已经成为了生活中不可缺少的一部分。B站基础网络团队本着社区优先的理念,持续优化互联网接入网络架构,近2年内根据IDC规模发展和业务需求,对公网架构进行了有序升级改造,从稳定性、经济性等方面为B站业务提供了坚实保障。

0bd4329015070ea91f6f3ae07b6eafd0.png

非局部图像去噪

本文介绍一篇2016年发表于CVPR的去雾论文。

cdc38651c6722d14ee3b7ebd00605caa.png

基于VMAF的感知率失真优化

随着机器学习的发展,机器学习也被引入到改进的客观评估中。视频多方法评估融合(VMAF) 是最具代表性的基于学习的度量,它由Netflix开发,通过支持向量机(SVM)回归将多个基本度量组合在一起。结果表明,VMAF比常规指标具有更高的精度,对行业具有较好的实用性。现在基于学习的度量优于传统的度量,人们也非常希望将它们应用到编码中。

视频质量评价中美学因素和技术因素的影响

在传统的视频质量评价中,美学质量和技术质量一直是独立研究的。在美学质量评价中,照片一般是由专业的技术设备拍摄的,因此其质量很大程度上取决于照片中对象的语义,以及拍摄手法是否专业。

色差:连牛顿都在它上面犯了错

17世纪中叶,科学界开始了光的本质的论战——光的波动学说与光的微粒学说的论战,这场论战一直持续进行到19世纪中叶。荷兰物理学家惠更斯是光的波动学说的创立者;英国伟大的科学家牛顿是光的微粒学说的倡导者。光学发展史上这场长达200多年的论战,将光学引上了发展之路,使人类在论战中揭开了光学的层层面纱,认清了它的本质。

如何使用AV1码流分析工具AOM Analyzer?

我自己平时的工作中会经常用到码流分析软件,之前我也分享过一些开源的视频码流分析软件,此类工具都有一个共同的特点:它们都是"视频解码器+GUI界面"。

基于人眼视觉模型,实现码率、质量、成本的最优均衡

「窄带高清」便可以利用人眼视觉的掩蔽效应,从人眼视觉模型出发,将编码器的优化目标从经典的“保真度最高”调整为“主观体验最好”,从而实现码率、质量、成本的最优均衡。


推荐资源

Web3将如何影响社交网络?|万字研讨实录(上)

Web2的世界里,社交被誉为是互联网皇冠上的明珠,大家也非常期待在社交赛道以后会出现一个千亿级的大公司。这次推特的收购是否拉开了社交领域的Web3序幕?本次研讨也请到了数位Web3社交领域的创始人还有资深专家,来和我们共同研讨,到底怎么样来理解Web3社交,怎么样向Web3社交平台转型。

书单 | 比尔盖茨:到目前为止我最喜欢的5本书

节假日是享受一年一度传统的好时机。像许多人一样,我喜欢在年底与家人一起庆祝节日(我们通常会在圣诞节穿着家庭睡衣)。我也喜欢坐下来写我的年度假日书单——这是我过去十年中每到这会儿都会做的事。它一直是个令我开心的机会来回顾我最近读过的书。


活动推荐

3cc22fc5cb6770f0588628087e767edd.png

对话即构科技李凯——聊聊流媒体互动新趋势

线上交流目前已经成为了许多人生活与工作中的一部分,随着流媒体技术与能力的不断进步,基于互联网的线上互动交流不再局限于简单的语音、视频通信等,越来越多的人开始关注使用线上交流时的体验和感受,更多全新的互动形式、玩法,场景应用值得我们期待和探索。

时间:91e6932d7918cb35a98c013a851f9ee0.png12月27日 晚7点

报名:fb21d99f042774b9506748504890d4b5.png扫描图中二维码,预约观看精彩内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/115614.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

西门子1513CPU冗余组态

西门子1513R冗余配置 1、打开博图16软件,新建项目,添加新设备,在弹出的控制器目录下找到CPU 1513R-1 PN硬件,然后系统自动生成PLC_1和PLC_2; 2、打开设备组态中的网络视图,添加接口模块; 3、在…

Springboot 统计 代码执行耗时时间 ,玩法多到眼花

前言 近日群里有萌新提到关于统计代码执行时间的事: 开始 System.currentTimeMillis() 减去 结束 System.currentTimeMillis() 等于 耗时 其实我个人感觉OK的,就这样就蛮好的,很多项目都是这样用的。 简简单单的挺好。 这一篇就是 …

基于Java( jsp+servlet+javabean)+SQL sever 2017实现(Web)高校选课管理系统【100010058】

一、需求分析 开发意义: 随着信息技术不断向深入发展,越来越多的学校开始着手信息化建设。其中学生选课、成绩信息化管理就是其中重要的一块内容。学生选课与成绩信息规模大、项目条数多、信息量庞大,传统的人工管理方式显然已经无法满足要求…

买不到的数目(蓝桥杯C/C++A组真题详解)

题目详细: 题目思路: 对于这个题有一个定理 如果 a,b 均是正整数且互质,那么由 axby,x≥0,y≥0 不能凑出的最大数是 : a*b-a-b 具体的证明过程这里就不赘述 感兴趣的同学可以自行查找 这里就提供一种思…

rk3568 | rk平台GPIO冲突检测小技巧

上一篇我们讲解了如何编写gpio驱动,但是实际操作中,经常发现gpio引脚被占用的情况发生,那么本篇文章就详细讲解rxw平台下如何快速定位gpio复用问题以及如何解决。 一、GPIO寄存器查找 要想查看某个GPIO引脚可以配置的功能以及地址信息&…

Http协议基础

Http 是什么? Http 作为 WWW 的重要组成部分被提出 (World Wide Web) 而当时的 WWW 是为了帮助研究者更好的进行知识共享 基本理念:文档之间的相互关联形成超文本,最终连成相互参阅的 WWW Http (Hyper Text Transfer Protocol) 用于定义文…

QUIC的优势与缺陷

被寄予厚望的下一代互联网传输协议,QUIC究竟有哪些优点呢? 总结如下: 多路复用:QUIC升华了HTTP/2中的多路复用技术,实现了基于互相独立的多流(多通道)数据传输,从根本上解决了TCP存在…

基于C语言学生信息教务管理系统编程设计

一.实现功能 1.从键盘添加学生信息 2.从文件添加学生信息 3.显示学生信息到屏幕 4.显示学生信息到文件 5.删除学生信息 6.插入学生信息 7.查找学生信息 8.成绩排名 二、相关代码 #include<stdio.h> #include<stdlib.h> //使用malloc函数以及exit函数 #include<…

力扣(LeetCode)1759. 统计同构子字符串的数目(C++)

题目描述 双指针数学 根据同构字符串的定义&#xff0c;还有示例&#xff0c;发现同构子字符串的数量&#xff0c;只和字母相同的区间有关。如abbcccaa&#xff0c;有 444 个影响答案的区间&#xff0c;直观切分为a bb ccc aa&#xff0c;用空格划分区间。遍历的任务就是维护这…

灵动岛前端Ui

一、前言 灵动岛&#xff08;Dynamic Island &#xff09;是什么&#xff1f; 灵动岛&#xff0c;是苹果公司iPhone 14 Pro系列 [2] 交互UI&#xff0c;让虚拟软件和硬件的交互变得更为流畅。当有来电、短信等通知时&#xff0c;灵动岛会变化它的形态&#xff0c;以便让用户能…

【大数据】M1 mac win docker安装kafka+mysql+canal

文章目录kafkadocker-compose创建kafka容器启动以后&#xff0c;访问容器&#xff0c;并且发送消息测试问题Exception in thread "main" kafka.zookeeper.ZooKeeperClientTimeoutException: Timed out waiting for connection while in state: CONNECTINGmysqldocker…

LAPS本地管理员密码之使用PowerShell查看和重置密码

目录 一、PowerShell策略设置 二、引入AdmPwd.PS模块 三、查看密码 四、强制重置密码 文章主要介绍在部署了LAPS后&#xff0c;怎么使用PowerShell查看和管理域内本地管理员密码。需要注意的是被操作的电脑需要加域&#xff0c;所有操作都在域内环境下进行。 LAPS介绍 LAP…

Spring Boot 知识总结

Spring Boot 知识总结 一、Spring Boot基础 1.1 什么是Spring Spring是一个开源框架&#xff0c;2003年兴起的一个Java轻量级开发框架&#xff0c;作者&#xff1a;Rod Johnson。 Spring是为了解决企业级应用开发的复杂性而创建的&#xff0c;简化开发。 Spring是如何简化…

LeetCode 每日一题——1759. 统计同构子字符串的数目

1.题目描述 1759. 统计同构子字符串的数目 难度中等43 给你一个字符串 s &#xff0c;返回 s 中 同构子字符串 的数目。由于答案可能很大&#xff0c;只需返回对 109 7 取余 后的结果。 同构字符串 的定义为&#xff1a;如果一个字符串中的所有字符都相同&#xff0c;那么…

Rancher RFO 正式 GA

Rancher RFO GA RFO 是 Rancher For openEuler 的缩写&#xff0c;旨在面向 openEuler 打造 Rancher 基础平台。其中最核心的工作是打造一款面向 openEuler 生态的 Kubernetes 发行版。它基于上游 RKE2 的技术栈&#xff0c;构建物采用 openEuler base image&#xff0c;致力于…

C语言及算法设计课程实验一:C程序的运行环境和运行C程序的方法

C语言及算法设计课程实验一&#xff1a;C程序的运行环境和运行C程序的方法一、实验目的二、实验内容2.1、输人并运行一个简单的正确的程序2.2、输人并编辑一个有错误的C程序2.3、输入并运行一个需要在运行时输入数据的程序2.4、运行一个自己编写的程序三、实验步骤3.1、输人并运…

Android OpenGL ES 学习(十一) –渲染YUV视频以及视频抖音特效

OpenGL 学习教程 Android OpenGL ES 学习(一) – 基本概念 Android OpenGL ES 学习(二) – 图形渲染管线和GLSL Android OpenGL ES 学习(三) – 绘制平面图形 Android OpenGL ES 学习(四) – 正交投影 Android OpenGL ES 学习(五) – 渐变色 Android OpenGL ES 学习(六) – 使用…

基于MWORKS.Sysplorer的电子控制器应用案例——永磁同步电机FOC算法建模

1 前言 MWORKS是面向数字工程的新一代科学计算与系统建模仿真平台&#xff0c;可提供机械、电子、液压、控制、热、信息等多领域统一建模仿真环境。经过同元持续攻关&#xff0c;全新推出的MWORKS.Sysplorer嵌入式代码生成器&#xff0c;现已支持面向电子控制器的产品级的嵌入…

循环神经网络的简洁实现

参考8.6. 循环神经网络的简洁实现 — 动手学深度学习 2.0.0 documentation 本节将展示如何使用深度学习框架的高级API提供的函数更有效地实现相同的语言模型。 我们仍然从读取时光机器数据集开始。 pip install mxnet1.7.0.post1 pip install d2l0.15.0 from mxnet import n…

ubuntu18.04下用Fiddler抓取curl库网络数据包总结

本人在ubuntu18.04下进行开发&#xff0c;需要使用http和服务端进行通信&#xff0c;为了确认自己发送给服务端和服务端返回数据字段&#xff0c;所以需要进行抓包分析参数。本文就说明一下如何在ubuntu18.04使用fidder对自己编写的应用程序进行http协议数据包抓取。 目录 1.…