音视频技术开发周刊 | 291

news2024/12/26 23:04:37

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

fdb300511f70de5f24f8c07baec9ca67.png

谷歌将 AI 芯片团队并入云计算部门 追赶微软和亚马逊

OpenAI推出的ChatGPT获得一定成功,微软是OpenAI的重要投资者,它将ChatGPT植入必应搜索,威胁到谷歌搜索地位。谷歌将会整合旗下两个AI研发实验室DeepMind和谷歌Brain,以增强公司AI部门实力。

Google DeepMind最新研究:如何将人类价值观融入AI?

政治哲学家 John Rawls 在《正义论》中探讨共生社会下的道德问题时,提到了一个旨在帮助确定群体决策公平原则的思想实验——无知之幕,Google DeepMind 认为,它可能是在管理 AI 时选择分配原则的合适机制。

美国NMA正式发布,ChatGPT等生成式AI监管原则

这是美国第一家权威机构正式发布的生成式AI监管原则,本次原则包括知识产权、透明度、问责制、公平、安全和设计6大部分,适用于文本、视频、图片、音频等其他格式的AI生成内容。

国内首个类 ChatGPT 模型:复旦大学 MOSS 正式开源,RTX 3090 显卡可运行

目前,MOSS 模型已上线开源,相关代码、数据、模型参数已在 Github 和 Hugging Face 等平台开放,供科研人员下载。

https://github.com/OpenLMLab/MOSS

全球首个车载语音GPT发布:SoundHound Chat AI for Automotive

据悉,这款AI内置了ChatGPT等当今顶级大语言模型产品,同时也支持汽车制造商自定义集成任何第三方大语言模型,以满足特定场景业务需求。众多汽车生产商对于该产品也产生了浓厚的兴趣。

https://www.businesswire.com/news/home/20230424005379/en/SoundHound-Launches-Chat-AI-For-Automotive-As-Study-Finds-50-Of-Regular-Drivers-Likely-To-Use-Generative-AI-Capabilities

WPP收购声音品牌服务商amp,将拓展基于生成式AI的品牌体验设计

完成收购后,amp将加入WPP旗下的品牌和设计咨询公司Landor & Fitch,增强后者在提供沉浸式品牌标识方面的专业知识,从而改变客户体验并使客户品牌在竞争激烈的市场中脱颖而出。

OpenAI将发布企业版订阅服务ChatGPT Business

OpenAI计划为ChatGPT引入一个新的订阅层,以满足企业客户的需求。这款被称为ChatGPT Business的产品被OpenAI公司描述为“为需要更多数据控制的专业人士以及寻求管理终端用户的企业提供服务”。

https://techcrunch.com/2023/04/25/openai-previews-business-plan-for-chatgpt-launches-new-privacy-controls/

投资10亿美元!普华永道扩大对ChatGPT、GPT-4的应用

全球四大会计事务所之一的普华永道(PwC)在宣布,计划在未来三年内投资10亿美元,扩大对ChatGPT、GPT-4等生成式AI的应用,并帮助客户通过生成式AI重构业务流程实现降本增效。

30de12f698a070a76b6aeb320786e5a1.png

AIGC的阿克琉斯之踵 

文章总结了ChatGPT的诸多难以忽视的问题,剖析了多模态大模型的本质、前提和不足,值得一看。

https://huaweicloud.blog.csdn.net/article/details/130284728?spm=1001.2014.3001.5502

AI音乐家:给我一个prompt,帮你实现编曲自由

来,放松一下,听点AI做的音乐吧。

1769a3663bc43c102086288f7f846e15.png

陆奇最新演讲实录:我的大模型世界观 

奇绩创坛创始人兼CEO陆奇是中国AI布道人,也是中国针对大模型最有发言权的人之一。到现在为止,你几乎很难在公开渠道听到陆奇的观点。本文涵盖了他对大模型时代的宏观思考,包括拐点的内在动因、技术演进、创业公司结构性机会点以及给创业者的建议。

对话算想未来创始人赵亚雄:希望做“为中国 AI 经济而生的 AWS” 

“未来一定是AI的世界”,赵亚雄博士的商业猜想转移到大模型。但他的商业方案“算想未来”不直接参与做大模型,而是要做大模型和AI应用的基础设施。未来“算想未来”要做AI的基础设施—— AI IaaS Cloud,区别于传统的云计算厂商,即一个以AI为导向的云计算厂商。

52c9fd2f3ea084ea0ea35c69d2b65cbe.png

如何在Java Spring Boot应用程序中使用Amazon S3存储桶来存储和检索媒体文件

这篇文章提供了一个非常实用的指南,教你如何在Java Spring Boot应用程序中集成Amazon S3存储桶来存储和检索媒体文件。它涵盖了所有必要的步骤和配置,并提供了有用的技巧和最佳实践。

https://www.twilio.com/blog/media-file-storage-java-spring-boot-amazon-s3-buckets

3fb2ca14d1c92e1535e83a426536f1f7.jpeg

腾讯多媒体实验室画质增强技术的前沿应用

LiveVideoStackCon 2022 北京站邀请到腾讯多媒体实验室视频技术研发负责人——夏珍与大家分享画质增强技术的一些前沿探索和应用研究,在经典影像中非常重要的画质提升技术人脸修复和去压缩失真的能力,以及在腾讯视频和云游戏中能带来画质增强的技术。

333de3cddd65ed930917d8957c150c72.jpeg

美国海军空战中心开源!首个仅使用单目拍摄地面纹理的SLAM系统

64dac00178feedec7e7787af215d03b4.png

振动台系统的预防性维护

与被动维护不同,预防性测试方法为您的振动台是否会在不久的将来遇到问题提供了有价值的见解。实施预防性维护测试计划允许您在紧凑的测试计划的时间范围内规划维护,并降低计划外停机和设备故障的风险。 

AudioGPT:理解并生成语音、音乐和播报 

虽然ChatGPT一直在挑战我们的认知极限,但目前的大模型仍然无法处理复杂的音频信息或进行语音对话(如Siri或Alexa)。在本篇论文中,作者团队研发出名为AudioGPT的多模态 AI 系统。测试表明,AudioGPT在解决任务方面的能力,包括在多轮对话中理解和生成语音、音乐和声音中表现不凡。

http://export.arxiv.org/abs/2304.12995

2b293c471e41b2a11cf33c547a7772c7.png

SIGCOMM 2020|LiveNAS 神经增强型实时流媒体:通过在线学习改进实时视频摄取

规模增长背后抖音如何构建直播体验优化 

随着抖音直播用户持续增加,生态日渐丰富,在经历亿万规模化增长的过程之中,体验优化是必须要面对的问题,LiveVideoStackCon 2022北京站邀请到火山引擎直播技术负责人周一楠,分享抖音体验优化过程的一些探索与实践。

SIGCOMM 2020|LiveNAS 神经增强型实时流媒体:通过在线学习改进实时视频摄取

作者提出了 LiveNAS 实时视频摄取框架,它利用超分辨率深度神经网络来增强独立于 ingest 端网络带宽的实时视频质量。LiveNAS 通过 WebRTC 在各种真实世界的网络轨迹中实现了 PSNR 相比 WebRTC 平均 1.96 dB 的整体视频质量改进,并为直播流观众带来了显着 (12%-69%) 的 QoE 改进。

NAB2023:OpenGear 和 Dante 集成以及 Bridge Live 等新功能

AJA 正在开发一种新的 OpenGear 卡,可以将 Dante 音频直接集成到 OpenGear 系统中。这样,用户就可以将音频和视频信号共享相同的设备,从而简化工作流程并提高生产效率。此外,AJA 还发布了 Bridge Live,这是一种基于云的视频编码和传输解决方案。该系统可以帮助用户实现高质量的远程视频制作,并支持多个协议和格式,如 RTMP、SRT 和 HLS。

https://www.streamingmedia.com/Articles/News/Online-Video-News/NAB-2023-AJAs-Bryce-Button-Talks-OpenGear-Dante-Integration-and-Bridge-Live-158337.aspx

a67cc835987edb3dd8b3a48f0ac7c871.png

Wowza Streaming Engine + AMD Alveo U30 让高密度流媒体变得简单

在本届NAB2023中,AMD宣布和Wowza达成合作,以应对在流媒体处理方面所面临的挑战,例如高负载和高延迟。AMD Alveo U30加速卡可以提供高性能和低延迟。将Wowza Streaming Engine与AMD Alveo U30集成,以便实现高密度流媒体处理。

https://www.wowza.com/blog/high-density-streaming-made-easy-with-wowza-streaming-engine-amd-alveo-u30

26e3921ac58aa3bd387836cf861ad4fa.png

2023年中国智能视频编码行业白皮书


194bb0a7407fb5b059c3abb49910e157.png

LiveVideoStackCon 2023上海讲师招募中

LiveVideoStackCon是每个人的舞台,如果你在团队、公司中独当一面,在某一领域或技术拥有多年实践,并热衷于技术交流,欢迎申请成为LiveVideoStackCon的讲师。请提交演讲内容至邮箱:speaker@livevideostack.com。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/479396.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java 基础入门篇(三)—— 数组的定义与内存分配

文章目录 一、数组的定义1.1 静态初始化数组1.2 动态初始化数组1.3 数组的访问 二、数组的遍历三、数组的内存图 ★3.1 Java 的内存分配3.2 数组的内存图3.3 两个数组变量指向同一个数组对象 四、数组使用的常见问题补充:随机数 Random 类 一、数组的定义 数组就是…

机器视觉工程师职场四点“心态>交流=思路>知行合一”

视觉人机器视觉团队,他们热爱机器视觉行业,爱学习,爱分享。这一路上,首先感谢粉丝们805天一如既往的支持。我想团队拥有这些粉丝,是富有的,也是我们一直创作的动力。 是否记得毕业季,自己的豪言壮语。希望你毕业三年后,无论结果如何,不忘初心,继续前行。 机器视觉工程…

Dart - 爬取Android Studio历史版本信息

文章目录 前言开发环境开发过程1. 遵循robots协议2. 页面结构分析3. Dart项目创建4. Dart项目运行与调试5. 第三库依赖6. 项目完整源码 运行结果最后 前言 整理Android Studio历史版本信息时发现有点多,于是想一劳永逸写一个简单的爬虫抓取一下数据并生成我想要的格…

【ansys】网格划分-优化、改善网格质量、修复网格、减小skewness、增大Orthogonal Quality的技巧

一、分析几何结构网格划分拓扑关系,调整网格尺寸 优化策略1:如果发现质量差的网格单元聚集在某一个实体附近,基本说明是这个实体的网格划分定义存在优化的地方。 例如下面这个几何模型。一个薄壁状长方体,加上一个模具框架&#x…

代码优美,搬砖不累:探索高质量代码之路

一、 前言 写出高质量代码是每个程序员的追求,也是提高自己编程能力的必经之路。高质量的代码可以提高软件的可维护性、可读性、可扩展性和可移植性等,降低软件开发和维护的成本。本文将介绍一些如何写出高质量代码的实用技巧和方法。 二、高质量代码的…

搞定Maven全功能,来从根上理解Maven拉包原理

依赖 生命周期与插件 模块聚合 模块继承 属性 版本管理 环境配置 私服 <dependencyManagement>的作用 在一次需求迭代中&#xff0c;我要求同事把写好的 RPC 接口打好包上传到公司私服上。然而&#xff0c;她并不熟悉 Maven&#xff0c;仅仅掌握了最基础的使用方…

【24】linux进阶——初识shell

大家好&#xff0c;这里是天亮之前ict&#xff0c;本人网络工程大三在读小学生&#xff0c;拥有锐捷的ie和红帽的ce认证。每天更新一个linux进阶的小知识&#xff0c;希望能提高自己的技术的同时&#xff0c;也可以帮助到大家 另外其它专栏请关注&#xff1a; 锐捷数通实验&…

管家婆辉煌Ⅱ 13.32版安装方法

因管家婆辉煌版已经长期不更新&#xff0c;现已经出现蓝屏的问题&#xff0c;故此新开此贴&#xff0c;慢慢更新安装方法。 首先管家婆下载地址&#xff1a;http://www.grasp.com.cn/download.aspx?id116 先安装sql server 2008 下载后&#xff0c;运行安装&#xff0c;请注…

《软件工程教程》(第2版) 主编:吴迪 马宏茹 丁万宁 第八章课后习题参考答案

第八章 面向对象技术与UML 课后习题参考答案 一、单项选择题 D &#xff08;2&#xff09;C &#xff08;3&#xff09;B &#xff08;4&#xff09;D &#xff08;5&#xff09;C &#xff08;6&#xff09;B &#xff08;7&#xff09;A &#xff08;8&#xff09;C&…

【LeetCode】343. 整数拆分

343. 整数拆分&#xff08;中等&#xff09; 方法一&#xff1a;数学推导 思路 将数字 n 拆分为若干个数字之和&#xff0c;即 n n1 n2 ... na &#xff0c;本道题等价于求解 max(n1 * n2 * ... * na) &#xff0c;根据数学推导&#xff0c;可以得到两个结论&#xff1a;…

【51单片机】LED点阵屏

&#x1f38a;专栏【51单片机】 &#x1f354;喜欢的诗句&#xff1a;更喜岷山千里雪 三军过后尽开颜。 &#x1f386;音乐分享【Waiting For Love】 大一同学小吉&#xff0c;欢迎并且感谢大家指出我的问题&#x1f970; 目录 &#x1f354;74HC595图片 &#x1f354;74HC59…

多层感知器模型与模型训练

文章目录 1. 多层感知器模型与模型训练1.1 多层感知器模型1.2 损失函数1.3 优化器与初始化模型1.4 编写训练循环1.5 案例代码整合 最近看了日月光华老师的《PyTorch深度学习简明实战》&#xff0c;将里面的代码自己动手复现了一遍&#xff0c;还是受益良多&#xff0c;书里面的…

【Python】狂肝两万字带你学会——类与对象

目录 01-初始对象 生活中的数据组织 程序中的数据组织​编辑 使用对象组织数据 总结01 02-类的成员方法 类的定义和使用 成员变量和成员方法 成员方法的定义语法 注意事项 成员方法——代码演示 总结02 03-类和对象 现实世界的事物和类 类和对象 使用类和对象…

Android 9.0 原生SystemUI下拉通知栏每条通知默认展开

1.前言 在9.0的系统rom原生开发中,在产品对SystemUI下拉通知栏做定制的时候,在下拉状态栏的时候,通知栏中 最后一条通知默认是收缩的 点击按钮 就会展开 原生系统systemui就是如此,为了更美观 所以要求最后一条通知也默认展开,显得更美观 最终效果图: 2.原生SystemUI下拉通…

网络通信原理

网络通信原理目录 1.网络通信基础1.1 IP地址1.2 端口号 2. 通信协议2.1 协议简介2.1 协议分层 3. 封装和分用 1.网络通信基础 &#x1f604;网络通信的目的是网络数据传输&#xff0c;是主机的不同进程间&#xff0c;基于网络实现的数据传输。那么&#xff0c;首先我们应该先弄…

Java实现调用外部程序

Java实现调用外部程序 Java库Runtime类与ProcessBuilder类参数传递执行结果Runtime类的使用ProcessBuilder类的使用无参数调用简单参数调用复杂参数调用 Apache Commons Exec库使用步骤介绍使用实例 Java库 在Java中&#xff0c;可以通过Runtime类或ProcessBuilder类来实现调用…

看看人家的MyBatis批量插入数据优化,从120s到2.5s,那叫一个优雅!

粗略的实验 最后 最近在压测一批接口的时候&#xff0c;我发现接口处理速度比我们预期的要慢。这让我感到有点奇怪&#xff0c;因为我们之前已经对这些接口进行了优化。但是&#xff0c;当我们进行排查时&#xff0c;发现问题出在数据库批量保存这块。 我们的项目使用了 myb…

开源小项目ChatGPT-website已获得100+star,我都干了什么

&#x1f4cb; 个人简介 &#x1f496; 作者简介&#xff1a;大家好&#xff0c;我是阿牛&#xff0c;全栈领域优质创作者。&#x1f61c;&#x1f4dd; 个人主页&#xff1a;馆主阿牛&#x1f525;&#x1f389; 支持我&#xff1a;点赞&#x1f44d;收藏⭐️留言&#x1f4d…

微信小程序学习实录1(wxml文档、引入weui、双向数据绑定、提交表单到后端)

微信小程序学习实录 一、wxml文档二、新建页面快捷方式三、微信小程序引入weui四、双向数据绑定1.wxml渲染层2.js逻辑层 提交表单到后端五、微信小程序跳转到H5 一、wxml文档 <!-- index.wxml --> <view><!-- 数据绑定 --><view><text>{{name}}…

蛋白质界的 ChatGPT:AlphaFold2 论文必备知识,不会有人还不知道吧

你知道 AlphaFold2 吗&#xff1f;它真正解决了蛋白质三维结构预测的算法困境&#xff0c;堪称蛋白质界的 chat-GPT4&#xff0c;甚至它的意义不是 chat-GPT4 所能够匹敌的。它为世界疾病治疗药物开发以及探究生物生命之谜提供了通向天神的一条道路&#xff0c;未来是生物的世纪…