音视频技术开发周刊 | 300

news2024/9/20 14:42:57

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

08848c859fa993da4458e9de23d902de.png

著名数据和AI企业Databricks,收购类ChatGPT开源平台MosaicML

6月27日,Databricks在官网宣布,以13亿美元(约94亿元)价格收购了类ChatGPT开源平台MosaicML。本次交易是全球生成式AI赛道第一笔超过10亿美元的收购。

LangKit:ChatGPT等大语言模型界的“安全管家”开源了

ChatGPT等大语言模型一直有生成虚假信息、数据隐私、生成歧视信息等难题,阻碍了业务场景化落地。为了解决这些痛点并增强大语言模型的安全性,AI和数据监控平台WhyLabs推出了LangKit。

加速大模型应用落地,“火山方舟”正式发布

6月28日,在2023火山引擎V-Tech体验创新科技峰会上,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。

理解指向,说出坐标,Shikra开启多模态大模型参考对话新维度

在人类的日常交流中,经常会关注场景中不同的区域或物体,人们可以通过说话并指向这些区域来进行高效的信息交换。这种交互模式被称为参考对话(Referential Dialogue)。如果 MLLM 擅长这项技能,它将带来许多令人兴奋的应用。例如,将其应用到 Apple Vision Pro 等混合现实 (XR) 眼镜中,用户可以使用视线注视指示任何内容与 AI 对话。

7195afba9892a4b026ccbeb9de446512.png

LinkedIn 将开放 AIGC 辅助撰写简历功能

面向职场的社交平台LinkedIn, 将生成式 AI 引入帖文写作中,此项功能在测试完成之后会面向所有用户开放。

ChatGPT的iPhone应用程序更新:添加了Bing搜索引擎

ChatGPT for iOS现在提供与Bing搜索的连接。这意味着AI驱动的ChatGPT应用程序,能够获取更近期的信息,而不仅仅使用它在训练过程中所接触到的旧数据(ChatGPT知识库截至2021年)。

https://www.digitaltrends.com/mobile/chatgpts-iphone-app-now-has-bing-built-in/

620a84a3ae60fbb20c73760f688f3df9.png

字节跳动服务器芯片负责人创立 RISC-V CPU 公司,估值超 1 亿美元

据获悉,字节跳动前 RISC-V 和服务器芯片项目负责人卢山已离职创业,成立蓝芯算力,方向为 RISC-V 数据中心 CPU(中央处理器),蓝芯算力正在进行首轮融资,投前估值超过 1 亿美元。

芯片工艺决定了未来计算芯片架构

论文作者总结了ISCA(国际计算机架构会议)举办至今五十年内,每个十年发表论文的共性主题,结合论文主题和半导体芯片工艺两者的变化进行了脉络梳理。在此基础上,作者提出观点:未来十年将是计算芯片架构领域的黄金十年。

Meta一直在为自主研发尽可能多的芯片做出努力

本月初,苹果发布了其Vision Pro混合现实头戴设备,将激化Apple和Meta之间在AR和VR市场的竞争。在过去的五年中,Meta一直在努力自主研发尽可能多的芯片,以更好地区分其产品与苹果的产品。

https://www.theinformation.com/articles/how-meta-stumbled-in-quest-for-chip-independence

72d7cef73415265b26d12a3c3f9c5738.png

COMSOL:基于图像数据生成网格的方法

这篇文章解释了COMSOL 软件如何帮助用户,利用三维成像技术获得的数据生成仿真网格。

老照片修复算法:具有细节和结构增强的修复网络

论文作者在这篇文章中,提出了一种级联的由粗到细的老照片修复算法,可以同时恢复老照片中的结构化和非结构化损伤。

科学量化的色差值DE不一定能真实反映人眼感受的颜色差异

在工业界,对于色差公式在人眼可感知阈值或者可接受容限附近色差的预测性能非常关注,因为色差公式对于产品颜色质量控制的评价主要处于这个色差范围。但人类对大自然中不同色彩的辨别能力是不一样的。

d937246a3eaca02cd60fd77230c43170.png

绿屏的6种检测方案

在这篇文章中,作者使用了opencv检测、图像全域检测等六种方案尝试解决问题,并提出了关于提高方案效率和健壮性的若干建议。

沉浸式视频流媒体的Versatile Video Coding(VVC)标准

该论文介绍了VVC(Versatile Video Coding)标准及其在沉浸式视频流媒体中的应用,以及VVC的ISOBMFF存储格式。

1a1794cf9dfeffcc903443b5d9d0b2a2.png

聊聊新一代蓝牙技术:LE Audio横空出世,无线耳机迎来进化

这篇文章梳理了蓝牙技术的发展脉络,并介绍了常见的蓝牙音频格式,并详细阐述了为何LE Audio能成为未来蓝牙音频中的主流。

95263cea86b88e516bc62ece0a511fe0.png

建设高性能终端平台——传音元宇宙的基础设施探索

本次分享将分为三个部分,第一部分介绍全球用户在音视频业务中的痛点;第二部分主要阐述传音针对不同用户所研发的网络优化,音视频影像,游戏体验优化等技术。第三部分详细介绍了,为提前布局元宇宙,并在AIGC时代迎来新的机遇,传音针对不同地区的人群研发了AI语音,虚拟人等技术;在未来也将在终端平台搭建异构计算,交互体验预测等新的技术平台。

华科开源:半直接法视觉-激光雷达里程计 SDV-LOAM

在这篇文章中,作者提出了SDV-LOAM,它结合了半直接视觉里程计和自适应扫描到地图激光雷达里程计,用于避免跟踪误差、实现高跟踪精度。

远程渲染虚拟现实中的眼底部分聚焦空间压缩技术

在远程渲染的虚拟现实(VR)中,应用程序的渲染被移至云端,使得高质量实时内容可以在低功耗的独立式头戴显示器(HMD)上消费。此篇论文探讨了,在远程渲染的虚拟现实中应用聚焦技术和超分辨率的策略,以解决延迟和高带宽要求的挑战,并优化传输的图像质量。

https://dl.acm.org/doi/pdf/10.1145/3597063.3597359

37fd49a3f8e39258d38a79924a4273a4.jpeg

Zoom加入AOMedia,双方的“见面礼”不仅是AV1

6月21日消息,视频会议软件Zoom加入了开放媒体联盟(AOMedia),成为了该联盟组织的其中一员。这意味着,下一代编解码器AV1有望获得Zoom公司的支持。

059e7ba01fabb94ae3e19ea67f0b587d.png

LiveVideoStackCon 2023 上海站日程发布

LiveVideoStackCon 2023 上海站音视频技术大会以「沉浸·新视界」为主题,除了探索音视频技术在不同场景下的融合与发展外,还增添了游戏、AIGC和数字化行业案例等新鲜火爆的话题。在这里,你可以感受到多媒体生态内的头部公司、顶级玩家对行业当前发展趋势、瓶颈挑战,与对未来规划的深入解读。

我们将邀请60余位顶级讲师聚集一堂,与你共同分享他们的专业见解。这是一个与业内顶尖专家进行深入交流的绝佳机会,你将有机会亲自与他们面对面,从他们丰富的经验中获得宝贵的技术心得。

04ed7e61ecaf7c1fbaa63b3b00c1fe95.png

3c891b96399180239cbd3cb24b5615ff.png

AIGC产业研究报告 2023

AIGC产业研究报告系列共分为六个部分,包括语言生成篇、图像生成篇、音频生成篇、视频生成篇、三维生成篇、分子发现与电路设计篇,目前已经全部发布,欢迎关注收藏并与我们共同探讨AIGC产业发展。

B站改革:将以视频播放分钟数代替播放次数

在B站14周年庆之际,董事长兼CEO陈睿进行了以“很高兴遇见你”为主题的演讲。该演讲分享了B站过去14年专注的三件事以及B站在UP主内容创作生态、商业收入等方面的发展。同时,B站将以播放分钟数替代目前外显的播放次数,以更好地挖掘B站的优质内容。

IBM扩大与Adobe合作,推进生成式AI应用

IBM在官网宣布扩大与Adobe的合作伙伴关系,帮助其生成式AI产品Adobe Sensei GenAI和 Adobe Firefly加速场景化落地和应用进程。

ad87950c731988d6f03f4381183c3e09.png

《时代》专访ChatGPT之父:人工智能影响经济还需要很多年

奥特曼的公司OpenAI,通过其病毒式产品ChatGPT,将人工智能带入公众的视野。几乎没有人质疑OpenAI是这场革命的先锋。最终,这场革命将改变世界,不管是好是坏,两者都有可能。

华创资本熊伟铭:不着急投资AIGC应用,真正的风口还没到来

ChatGPT爆火之后,大模型成为创投“新宠”,但也有一些长期布局AI赛道的投资人并没有出手。


1be1025204a6588f883228a03ef48130.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/714668.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

浅析便捷生活的新选择——抖音本地服务

抖音是一款风靡全球的短视频分享平台,其本地服务功能的发展也逐渐引起了广泛关注。本地服务是指抖音平台上的用户可以通过平台直接查找并使用周边的各种服务,比如美食外卖、快递配送、家政服务等。本地服务的发展对用户和商家都带来了很多便利和机遇。 首…

Spring Boot 中的 Spring Cloud Hystrix 是什么,原理,如何使用

Spring Boot 中的 Spring Cloud Hystrix 是什么,原理,如何使用 简介 在分布式系统中,服务之间的调用是不可避免的。但是,当一个服务调用另一个服务时,如果被调用的服务出现了故障或者延迟,那么调用者也会…

发布/上传Jar包到Maven中央仓库

1.注册Sonatype账号 2.项目申请,创建工单 2.1回复 groupId 域名 可以使用github, io.github.账号 创建工单根据评论回复,需要创建临时仓库,验证账户所有权。 3.gpg4win 地址:https://www.gpg4win.org/download.html &…

电子时钟制作(瑞萨RA)(5)----定时器驱动数码管

概述 要想让每个数码管显示不同的数字,但是数码管必须依次地被持续驱动,数码管之间的刷新速度应该足够快,这样就看不出来数码管之间在闪烁。刷新频率可以设置为2ms刷新一次,这样人眼就看不出闪烁了。 硬件准备 首先需要准备一个…

2011年全国硕士研究生入学统一考试管理类专业学位联考逻辑试题——纯享题目版

🏠个人主页:fo安方的博客✨ 💂个人简历:大家好,我是fo安方,考取过HCIE Cloud Computing、CCIE Security、CISP、RHCE、CCNP RS、PEST 3等证书。🐳 💕兴趣爱好:b站天天刷&…

生态环境脆弱性评价模型构建、时空格局演变分析与RSEI 指数的生态质量评价及拓展

近年来,国内外学者在生态系统的敏感性、适应能力和潜在影响等方面开展了大量的生态脆弱性研究,他们普遍将生态脆弱性概念与农牧交错带、喀斯特地区、黄土高原区、流域、城市等相结合,评价不同类型研究区的生态脆弱特征,其研究内容…

C++ STL --List

1. list的介绍及使用 1.1 list的介绍 1. list 是可以在常数范围内在任意位置进行插入和删除的序列式容器,并且该容器可以前后双向迭代。 2. list 的底层是双向链表结构,双向链表中每个元素存储在互不相关的独立节点中,在节点中通过指针指…

云原生之深入解析MySQL在K8S环境中部署与监控

一、准备工作 MySQL是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL 是最好的 RDBMS (Relational Database Management System&am…

Spring Boot的Maven插件Spring Boot Maven plugin详解

1.Spring Boot的Maven插件Spring Boot Maven plugin详解 2.Maven插件之git-commit-id-plugin

vue3+ts+elementui制作精美的课表

使用vue3tselementui 如何制作出精美的课表呢&#xff0c; 最终效果图如下: 直接上代码&#xff1a; 这里直接把封装成一个课表的组件&#xff1a; <script setup lang"ts"> import { ref, watch, onMounted } from "vue"; import IconText from …

Fortinet FortiOS 7.4.0 (FortiGate VM deployment Images) - 混合架构防火墙

Fortinet FortiOS 7.4.0 (FortiGate VM deployment Images) - 混合架构防火墙 下一代防火墙 (NGFW)、虚拟化 NGFW 和云原生防火墙 请访问原文链接&#xff1a;https://sysin.org/blog/fortios-7/&#xff0c;查看最新版。原创作品&#xff0c;转载请保留出处。 作者主页&…

MySQL表的增删改查(数据库系列3)

目录 前言&#xff1a; 1.CRUD的解释 2.表的基本操作 2.1查看数据表 2.2创建表 2.3查看指定表的表结构 2.4删除表 2.5注释 3.新增&#xff08;Create&#xff09; 4.查询&#xff08;Retrieve&#xff09; 4.1全列查询 4.2指定列查询 4.3查询字段为表达式 4.4指定…

Linux_Linux基本指令(1)

目录 一、ls指令 二、pwd命令 三、cd指令 四、touch指令 五、mkdir指令 六、rmdir指令&&rm指令 一、ls指令 语法&#xff1a;ls [选项][目录或文件] 对于目录&#xff0c;ls指令是用来列出目录下的所有子目录与文件。对于文件&#xff0c;则是列出文件名及其他信…

zabbix 安装 踩坑记录与解决方案

博主首次安装 zabbix 时&#xff0c;出现了一些错误&#xff0c;特此记录一下&#xff0c;希望帮助到一些 Zabbix freshman. 参考其他博客安装 zabbix 时&#xff0c;运行到如下command 安装zabbix 相关组件出现如下Error: apt installzabbix-server-mysql zabbix-frontend-p…

154个Bug!

持续测试了一个月的H5项目&#xff0c;终于迎来了上线日&#xff0c;在测试H5的过程中&#xff0c;遇到了一些坑&#xff0c;积累了些许经验&#xff0c;想着分享一下&#xff0c;希望对大家有所启发。 主要从以下一个方面展开&#xff1a; 一、项目背景 二、测试环境准备 三…

专项练习18

目录 一、选择题 1、下列选项中&#xff0c;&#xff08;&#xff09;不是网页中的事件 2、下面有关浏览器中使用js跨域获取数据的描述&#xff0c;说法错误的是&#xff1f; 3、请问以下程序的输出是 4、以下哪一项不属于浏览器Response Headers字段&#xff1a; 一、选择题 …

IDEA中集成zookeeper的插件

IDEA中集成zookeeper的插件 一、IDEA中集成插件 搜索插件并安装&#xff1a; 安装完成&#xff0c;重启IDEA 配置zk集群 连接成功

beego 跨域问题处理

这几台在搞前端与后端分离设计&#xff08;之前没接触过&#xff0c;前端vueelementUI&#xff0c; 后端Beego框架&#xff09;&#xff0c;前端要使用到后端数据时&#xff0c;向发送对应的请求&#xff0c;发现提示跨域访问失败&#xff0c;于是需要配置后端支持跨域访问&…

@RequestBody接收不到前端传递过来的json数据

uniRequest.post(/orderParking,{parkingRecord:this.ParkingRecord})我刚开始只是写RequestBody ParkingRecord parkingRecord 一直获取的都是null, 直到用了Map标签才终于获取到参数了 RequestMapping(value "/orderParking",produces"application/json"…

Linux:ssh配置

环境 内网win10 192.168.25.1 服务器centos 内-192.168.25.11 外-192.168.254.11 外网服务器 192.168.254.10 服务名称为&#xff1a;sshd 默认端口号为&#xff1a;22 rpm -qc openssh-server.x86_64 # 查看配置文件 *服务端主程序&#xff1a;/usr/s…