音视频技术开发周刊 | 293

news2025/1/21 21:58:50

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

4882a4f2c8ad681bcc5c1b9c073d2b02.png

谷歌全面反攻 ChatGPT!PaLM 2、Gemini 双杀,Bard 正式开放

以上是2023 Google I/O 大会的重点内容,AI含量极高。

谷歌推拥有26000个H100的超算,加速AI军备竞赛

云提供商正在组建 GPU 大军,以提供更多的 AI 火力。在今天举行的年度 Google I/O 开发者大会上,Google 宣布了一款拥有 26,000 个 GPU 的 AI 超级计算机——A3 ,这个超级计算机是谷歌与微软争夺 AI 霸权的斗争中投入更多资源进行积极反攻的又一证据。

OpenAI发布最新开源项目Shap-E,通过文本就能生成3D模型

5月6日,ChatGPT母公司OpenAI发布了最新开源项目Shap-E,通过文本就能生成3D模型。目前github已经突破2000颗星。

https://github.com/openai/shap-e 

为什么剑桥出身的“AI教父”辛顿会担心?

人类社会的稳定性和鲁棒性并不是弱不禁风、一触即倒的,熟话说的好,“魔高一尺,道高一丈”,未雨绸缪、居安思危将会一直伴随着人类文明的进化发展,现在发生的,过去已经发生过,而且还不止一次,估计这次也不会例外...... 

HugNLP开源啦!教你玩转各种NLP任务,还可训类ChatGPT模型

在大模型训练异常火爆的今天,基于HugNLP框架,还推出了能够支持类ChatGPT模型进行训练和部署的产品HugChat。

用图像对齐所有模态,Meta开源多感官AI基础模型,实现大一统

e0d622c2cf9b69b8ebd531ae92b1ddfe.png

Orillusion引擎正式开源!AIGC时代下的WebGPU轻量级3D渲染引擎!

IBM亮王炸!推出大模型Watsonx,7月将开源!

Watsonx由三大块组成,基础模型watsonx.ai;基于开放式 Lakehouse 架构构建的专用数据存储平台watsonx.data;用于AI安全治理的watsonx.governance。在这三大平台赋能下,可为用户提供一站式安全可靠的生成式AI服务。

「AI孙燕姿」全网沸腾!AI翻唱大爆发,整个华语乐坛都「复兴」了

2023春季《计算共形几何》课程总结

抖音关于人工智能生成内容的平台规范暨行业倡议

人工智能技术的快速发展,为互联网行业带来了更多可能性的同时,也带来了虚假信息、侵权等问题。参照《互联网信息服务深度合成管理规定》等法律法规,抖音提出十一条平台规范与行业倡议。

d0e5db99a808ffc3736006c09b906e0f.png

声网自研编码器 a264 & a265:更优画质更低能耗,进一步适配实时互动场景需求

“玲珑”编解码融合架构助力视频多元化需求

LiveVideoStackCon 2022北京站邀请到了安谋科技多媒体产品经理董峰,为我们分享“玲珑”编解码融合架构助力视频多元化需求。

MPEG LA和Via Licensing专利池的合并会带来哪些影响?

文章表示,该合并将使MPEG LA负责管理HEVC、AV1和VVC等主要视频编解码器的专利池,这些编解码器是当前和未来的许多流媒体应用程序所依赖的核心技术。此外,该合并还将减少客户在获取许可证时需要与多家公司沟通的复杂性,从而降低了使用这些编解码器的成本。

https://www.streamingmedia.com/Articles/News/Online-Video-News/Via-LAs-Heath-Hoglund-Talks-MPEG-LA-Via-Licensing-Patent-Pool-Merger-158547.aspx

d42d3798e438accdbfa1485c24365daf.png

元宇宙直播的终端架构设计和关键技术

adfeb7f94d489695fb816bda53c257ea.jpeg

5月16日 19:00,我们邀请到了百度智能云视频云资深研发工程师李明路老师围绕终端引擎技术发展与演进,详细介绍元宇宙直播技术体系、终端架构设计和关键技术,分享百度智能云在元宇宙直播场景中的实践探索。

7bf6ab0e181ceaab5598177790fa07fd.png

AVIF 图像编码器添加了实验性 AV2 支持代码合并请求

看起来 AV2 的工作进展顺利,很高兴看到更新的 AVIF 图像格式支持也将得到及时支持

https://github.com/AOMediaCodec/libavif/pull/1361 

Metal 和 OpenGLES 的差异,快速入门 Metal 开发

本文介绍Metal和Metal Shader Language,以及Metal和OpenGL ES的差异性,也是实现入门教程的心得总结。 

Point2Pix:通过神经辐射场进行逼真的点云渲染

作者将点云和 NeRF 相结合,从⽽提出了⼀种名为 Point2Pix 的新型点云渲染器,可以从彩⾊点云合成逼真的图像。

f3214d4ac651a5d7fd330a8e9134564f.png

存储芯片路线图

本文考虑的内存类型是 DRAM 和非易失性内存 (NVM)。重点是商品、独立芯片,因为这些芯片往往会推动内存技术。然而,嵌入式存储芯片预计将遵循与商品存储芯片相同的趋势,通常会有一些时间滞后。对于 DRAM 和 NVM,都考虑了详细的技术要求和潜在的解决方案。

b6526aee7540fe7c262b959813324217.png

云剪辑-B端在线剪辑⼯具架构设计与演进

我们在探索B端在线剪辑产品的过程中遇到不少挑战:如何满足快速与定制两种集成场景?如何保证云端视频合成的效率与质量?LiveVideoStackCon 2022北京站邀请到了腾讯云音视频的成锐林老师为我们分享他们团队是如何解答这一系列问题的。

音视频杂谈--AI工具大比拼

作者分别询问了印象AI、ChatGPT和Bard等TCP和UDP的区别,以上是它们的答案。

视频技术如何助力财险理赔?

这是一篇关于视频技术应用在保险行业里的文章。在整个理赔过程中,数字工具是缩短等待时间和提高客户满意度的关键。

ed5538f72be191b3c59b716d570be5ac.png

音视频通讯QoS技术及其演进

利用多种算法和策略进行网络传输控制,最大限度满足弱网场景下的音视频用户体验。

通过DRM(Digital Radio Mondiale)数字广播进行远程教学

这是一篇详尽介绍DRM广播教育应用场景的文章,结合DRM技术特点和功能成功实现教育普及的理想远景。

https://www.audioblog.iis.fraunhofer.com/cn/radioschooling

2026f93ff13d25fc89a9314d857c82d4.jpeg

南洋理工大学提出基于单目相机和超宽带传感器的VR-SLAM:实现高精度室内定位与建图

本文提出了一种使用单目相机和UWB传感器的SLAM系统。系统称为VRSLAM,是一个多阶段框架,利用每个传感器的优势并弥补其弱点。

首个系统综述!基于深度学习的相机标定技术最新研究进展!

本综述首次系统性地概述了深度学习驱动下的相机标定技术,涵盖了深度学习时代以来(8年时间跨度)各类相机模型标定及其应用的最新研究进展。

6d42bbef7c7f33ef9feccc4df5fd08ed.png

RTC 体验优化的“极值”度量与应用

LiveVideoStackCon 2022北京站邀请到火山引擎RTC团队负责人——杨智超,为大家介绍在实时通信场景下火山引擎RTC对体验的理解与应用落地。

NSDI 2015 | PCC:重新建构面向持续高性能的拥塞控制

本文作者提出了面向性能的拥塞控制,一种新的拥塞控制结构( PCC ),PCC 中持续关注控制机制中动作(asction)和基于经验的性能表现之间的联系,这样做能够使得 PCC 采取的动作能够持续导致高的性能表现。

如何以实时精度完善5G场内体验

这篇文章讨论了如何在场馆中提供完美的 5G 体验。作者认为,5G 可以极大地改善用户在场馆中的体验,包括视频流、VR/AR、实时互动等方面。

https://www.red5pro.com/blog/perfect-5g-in-venue-experiences/


6066459a12f801e2a4ba16fc8ede0069.png

LiveVideoStackCon 2023上海讲师招募中

LiveVideoStackCon是每个人的舞台,如果你在团队、公司中独当一面,在某一领域或技术拥有多年实践,并热衷于技术交流,欢迎申请成为LiveVideoStackCon的讲师。请提交演讲内容至邮箱:speaker@livevideostack.com。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/527249.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

uni-app框架的小程序开发环境

文章目录 一、下载微信开发工具安装 二、构建uni-app开发环境2.1 Node.js下载与安装2.2 下载HBuilder-X2.3 创建uni-app项目2.4 填入uni-app专属标识和小程序标识 在阅读此博文前,需要注册完毕小程序账号 一、下载微信开发工具 微信开发工具下载地址 下载稳定版即…

代码随想录算法训练营day41 | 343. 整数拆分,96.不同的二叉搜索树

代码随想录算法训练营day41 | 343. 整数拆分,96.不同的二叉搜索树 343. 整数拆分解法一:动态规划 96.不同的二叉搜索树解法一:动态规划 总结 343. 整数拆分 教程视频:https://www.bilibili.com/video/BV1Mg411q7YJ 1、dp[i]代表…

【Linux命令】脚本里常用的几个命令sort,uniq,tr,cut,split,eval

脚本里常用的命令 一、SORT命令1.1、语法格式1.2常用选项 二、uniq命令2.1命令格式2.2常用选项2.3小实验,过滤出现三次以上的IP地址 三、tr命令3.1语法格式3.2常用选项3.3实验 四、cut命令4.1语法格式4.2常用选项 五、split命令5.1语法格式5.2常用选项 六、eval七、…

一个优秀系统构架师应具备的能力

作为软件开发的设计架构师,那么必须拥有一定的编程技能,同时有高超的学习新的架构设计、程序设计技能。另外,我觉得作为软件架构师,还必须了解一定的硬件、网络、服务器的基本知识。要不然,你都不知道有些什么材料可以…

基于MWORKS的电动汽车电平衡分析

1 引言 随着电动汽车的快速发展、电池技术的进步和智能电力管理系统的应用,电动汽车电平衡已经成为了电动汽车技术研究中的重要问题之一。 电动汽车电平衡是指车辆发电机、蓄电池、整车用电器在一定时间内的电能供给与消耗达到平衡状态。如果车辆电能产生与消耗无法…

USART硬件流控制概念以及原理(硬件控制流以及软件控制流)

USART 数据流控制 也就是 USART_HardwareFlowControl 一、流控制的作用 这里讲到的 “流”,指的是数据流;在数据通信中,流控制是管理两个节点之间数据传输速率的过程,以防止出现接收端的数据缓冲区已满,而发送端依然…

ResNet 论文理解含视频

ResNet 论文理解 论文理解 ResNet 网络的论文名字是《Deep Residual Learning for Image Recognition》,发表在2016年的 CVPR 上,获得了 最佳论文奖。ResNet 中的 Res 也是 Residual 的缩写,它的用意在于基于 残差 学习,让神经网…

真实业务场景使用-门面模式(外观)设计模式

1.前言 最近接到要修改的业务功能,这个业务增删改查很多功能都需要校验时间,比如: 1.失效时间不能超过自己父表的失效时间, 2.失效时间不能是当前时间 3.失效时间不能早于生效时间 类似这样的不同的判断还有很多,…

软考A计划-真题-分类精讲汇总-第十章(程序设计语言)

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例 👉关于作者 专注于Android/Unity和各种游戏开发技巧,以及各种资源分享&am…

【GO 编程语言】切片与Map

切片与Map 文章目录 切片与Map一、切片 Slice1.定义切片2.make 函数创建切片3.切片扩容与遍历4.在已有数组上创建切片5.切片是引用类型7.深拷贝、浅拷贝 二、Map1.Map 初始化2.map 的使用3.map 的遍历4.map 结合 slice 一、切片 Slice 1.定义切片 Go 语言切片是对数组的抽象。…

设置ELK集群账号密码

一、设置ELK集群账号密码 切换到es用户 主节点生成证书 cd /home/es/elasticsearch-7.6.2/bin ./elasticsearch-certutil cert -out config/elastic-certificates.p12 -pass "" 将主节点证书发给其他两个节点 修改配置文件,启用x-pack:cat /…

Linux指令运行原理和权限

Linux指令运行原理和权限 一.命名行解释器二.权限1.用户分类2.什么是权限3.增删权限4.更改权限的拥有者5.三个概念1.权限掩码2.目录权限3.粘滞位 三.权限总结 一.命名行解释器 那么命令行解释器存在的意义:1.进行命令的解释。2.保护os,对于非法的请求&am…

TimesNet:用于一般时间序列分析的时间二维变化模型

摘要 时间序列分析在天气预报、异常检测和动作识别等广泛应用中具有极其重要的意义。本文重点研究时间变量建模,这是广泛分析任务的共同关键问题。以前的方法试图直接从一维时间序列完成此操作,由于错综复杂的时间模式,这极具挑战性。基于对…

使用flask获取树莓派摄像头监控视频

目录 1、安装flask库 2、使用flask打开网页传输视频 2.1 在树莓派终端桌面上,新建一个flask文件夹 2.2 在flask文件夹里面,新建一个template文件夹和app.py文件 2.3 在template文件夹里面,新建一个index.html文件 2.4 使用flask运行代码…

【半小时入门vue】最容易理解的vue入门方式

半小时入门vue 前言(!important)学习vue的前提什么是vue?vue的引入方式实例化一个对象和创建一个对象实例化一个vue对象模板语法1.插值表达式2.v-text和v-html指令3.v-bind指令4.v-on指令5.v-model指令6.v-if和v-show指令7.v-for指…

AD-STM32

AD-STM32 ADC (Analog-Digital Converter) 模拟-数字转换器A DC可以将引脚上连续变化的模拟电压转换为内存中存储的数字变量,建立模拟电路到数字电路的桥梁 12位逐次逼近型ADC,1us转换时间 输入电压范围: 0-3.3V,转换结果范围: 0~409518个输…

MySQL内幕揭秘:探索MySQL调优指南,解锁MySQL的强大功能

1、MySQL大事记 1994年:Michael Widenius和David Axmark创建了MySQL AB。 1995年:MySQL从最初的beta版本发布,成为一款开源软件。 1997年:MySQL发行版本3.21,并成为了第一个支持多个存储引擎的数据库管理系统。 2000年…

uniapp 地图组件(map)的使用总结

总结一下本次在uniapp中使用map遇到的一些问题 文章分别是基础 定位图标 获取自身经纬度 通过经纬度获取当时城市信息 首先先看成品 首先引入map组件 <template><view class"content"><map style"width: 100%; height: 90vh;" :layer-…

通过云函数搭建内地可用的OpenAI代理(腾讯云centos系统)

需求&#xff1a; 大陆内地云服务器无须搭梯子&#xff0c;无须NGINX反向代理访问openAI。 背景&#xff1a; 平时工作环境是局域网&#xff0c;不方便分享给朋友用&#xff0c;即使不是局域网也不可能一直开着自己的电脑啦&#xff0c;于是想着给弄到云服务器上。 一般来说&…

diff命令和vimdiff命令

文章目录 diff命令基本用法选项示例 vimdiff命令命令格式选项说明常用操作 diff命令 diff命令是一个文本比较工具&#xff0c;用于比较两个文件的内容&#xff0c;它会逐行比较两个文件的内容并输出它们之间的差异。下面是diff命令的常用选项和用法&#xff1a; 基本用法 比…