Google 新 AI 为视频生成配乐和对白;Runway 发布 Gen-3 视频生成模型丨 RTE 开发者日报 Vol.226

news2024/11/26 19:55:49

在这里插入图片描述

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY,@JLT,@鲍勃

01 有话题的新闻

1、日本增长最快独角兽即将诞生:人工智能公司 Sakana AI 成立一年后估值 1800 亿日元

6 月 17 日消息,日本生成式 AI 初创公司 Sakana AI 即将获得一笔新的重大投资,这将使该公司估值达到约 1800 亿日元(约合 83 亿元人民币)。「独角兽」系估值超过 10 亿美元(约合 72.76 亿元人民币)的未上市企业。报道称,去年 7 月,谷歌的人工智能研究人员在东京成立了 Sakana AI 公司,该公司对生成文本和图像的 AI 基本模型进行了研究,其具有将现有模型相互交叉的「开创性」技术,从而创建出高性能的 AI 模型。

Sakana AI 的主要投资者包括曾对 OpenAI 等公司进行了初期投资的风险投资家,他们将协调在本月底之前向 Sakana AI 投资约 200 亿日元(当前约 9.23 亿元人民币)。据报道,Sakana AI 将成为日本增长最快的「独角兽」企业。(@朝日新闻)

2、腾讯混元推出「Follow Your Emoji」

在这里插入图片描述

据 Arxiv 页面显示,腾讯混元携手香港科技大学和清华大学,共同研发出一款名为「Follow Your Emoji」的创新肖像动画生成框架。这项技术突破了传统界限,仅需一张静态照片,即可将其转化为栩栩如生的面部动画,捕捉并再现人物的微妙表情变化。用户只需上传一张照片,系统便能迅速生成一系列生动的面部表情,无论是夸张的大笑还是微妙的眨眼,都能轻松呈现。依托于先进的算法和庞大的数据支持,「Follow Your Emoji」能够对脸部进行极为精细的控制,包括眉毛的微挑、眼珠的转动,甚至是翻白眼等细节动作。( @CSDN)

3、腾讯视频号拟限制数字人带货:鼓励真人直播

近日为了优化视频号橱窗生态,营造良好的交易环境,腾讯对《视频号橱窗达人「发布低质量内容」实施细则》进行修订,修订内容于今年 6 月 7 日 -6 月 13 日进行意见征集。

据最新的修订方案,「使用插件、AI 等工具生成虚拟形象进行直播」「提供、售卖、教学或展示平台不提倡传播的内容:如讲解和售卖虚拟人代播软件」等涉及虚拟人/数字人直播,将被视频号明确列入低质量内容,并进行违规处理。

对于相关修订的原因,6 月 17 日,视频号相关人士告诉澎湃新闻记者,使用数字人/虚拟人直播目前属于平台直播带货中的违规行为,如被平台发现,将依据相关规则进行处罚,包括不限于减少直播推荐、减少账号推荐、限制直播带货能力等。

该人士称,平台希望并鼓励真实的真人主播,能跟观众进行实时的互动。(@澎湃新闻)

4、Runway 发布第三代视频生成模型,90 秒生成 10 秒片段

IT 之家 6 月 18 日消息,专为电影和图像内容创作者打造生成式 AI 工具的公司 Runway 发布了 Gen-3 Alpha 视频生成模型。

Runway 表示,与其之前的旗舰视频模型 Gen-2 相比,该模型在生成速度和保真度方面有了「重大」改进,并且对生成视频的结构、风格和运动提供了细粒度的控制。Gen-3 将在未来几天内向 Runway 订阅用户提供,包括企业客户和 Runway 创意合作伙伴计划中的创作者。

Runway 联合创始人 Anastasis Germanidis 表示,Gen-3 的视频生成时间明显快于 Gen-2。生成一个 5 秒的片段需要 45 秒,生成一个 10 秒的片段需要 90 秒。(@IT 之家)

5、抖音联合博纳出品 AIGC 科幻短剧集《三星堆:未来启示录》

6 月 17 日消息,博纳影业出品制作、抖音联合出品的 AIGC 科幻短剧集《三星堆:未来启示录亮相博纳 25 周年新闻发布会。

该剧第一季共 12 集,由抖音联合出品,将在抖音短剧暑期档播出。即梦 AI 作为首席 AI 技术支持方,基于豆包大模型技术,为《三星堆:未来启示录》提供了 AI 剧本创作、概念及分镜设计、镜头画面生成、图像到视频转换、视频编辑和媒体内容增强等十种 AI 技术。

据介绍,《三星堆:未来启示录》的故事设定在科技飞速发展的近未来。地球古文明遗迹的异变引起全球古文明研究组织的高度关注,泛大西洋人工智能组织 ACE 推测三星堆文物中蕴藏着解决文明危机的关键信息,中国古文明研究组织「西安路 34 号」派出科学家吴星言监督 ACE 组织在中国的行动。四川广汉的江家三代都是三星堆考古工作者,江城联合吴星言展开了一场跨越时空的冒险。(@IT 之家)

6、Google DeepMind 的新 AI 可以为视频生成配乐和对白

Google 的人工智能研究实验室 DeepMind 表示,它正在开发为视频生成配乐的人工智能技术。DeepMind 在其官方博客上发表文章称,它认为 V2A(「视频到音频」的缩写)技术是人工智能生成媒体拼图中必不可少的一部分。虽然包括 DeepMind 在内的许多机构已经开发出了视频生成人工智能模型,但这些模型无法在生成视频时同步生成音效。( @cnBeta)

02 有态度的观点

1、吴恩达最新演讲:除了下一代基础模型,Agent 工作流如何推动 AI 进步?

在 Snowflake Dev Day 上,斯坦福大学教授、Landing AI 创始人吴恩达与 Snowflake CEO Sridhar Ramaswamy 讨论了 AI 技术与法规。吴恩达介绍了视觉智能体(Vision Agent)的应用,它可以自动化复杂的图像处理任务,显示了 AI 在计算机视觉领域的潜力。

同时,他强调了 AI Agent 的工作流程,并提到了在 AI 研究和应用中跨学科合作的重要性。吴恩达认为 Agentic AI 是一个非常重要和令人兴奋的趋势。(@有新 Newin)

2、黄仁勋最新对话:未来互联网流量将大幅减少,计算将更多即时生成

在 2024 年 Databricks Data + AI 峰会上,英伟达创始人、CEO 黄仁勋指出生成式 AI 正以指数速度增长,强调企业需抓住此技术趋势。他认为开源和闭源 AI 模型将共存,企业需利用各自优势推动 AI 发展。

再者,AI 的发展需要考虑能源效率和可持续性。随着数据积累和智能技术进步,客户服务将成为企业实现智能化转型的关键领域。(@腾讯科技)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

在这里插入图片描述

素材来源官方媒体/网络新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1835042.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

烟雾自动监测识别摄像机

烟雾自动监测识别摄像机是现代城市安全管理的关键装备,其在各类场所的应用日益广泛,尤其在大型建筑、工厂和公共设施中,其重要性更为突出。该类摄像机采用先进的传感技术,能够实时监测环境中的烟雾密度和变化。通过高灵敏度的传感…

批量创建文件夹 就是这么简单 一招创建1000+文件夹

批量创建文件夹 就是这么简单 一招创建1000文件夹 在工作中,或者生活中,我们经常要用到批量创建文件夹,并且根据不同的工作需求,要求是不一样的,比如有些人需要创建上千个不一样名称的文件夹,如果靠手动创…

开发淘宝在线扭蛋机小程序:关键点与实战技巧

引言 在上一篇文章中,我们介绍了开发淘宝在线扭蛋机小程序的基本步骤和前期准备。但在实际开发过程中,还有一些关键点和实战技巧需要特别注意。本文将为您详细阐述这些关键点和技巧。 一、关键点 用户体验: 简洁明了的界面设计&#xff0c…

AI 视频生成工具 Sora 横空出世!一文带你了解 Sora:简介|主要功能|使用场景|平替工具等!

要说最近的头条热搜,非 Sora 莫属!Sora 的诞生,再一次引发了人们对 AI 人工智能以及 AIGC 的关注。 对第一次听说 Sora 的人,可能会好奇,大家都在说的 Sora 是什么? Sora 是什么软件? Sora&a…

录制视频软件哪个好?录制视频,4款好软件推荐

随着网络技术的飞速发展和社交媒体的普及,录制视频已经成为人们记录生活、分享知识和展示才华的重要方式。在众多录制视频软件中,如何挑选一款功能强大、操作简便的工具,成为了许多用户的难题。本文将为您推荐4款优秀的录制视频软件&#xff…

守护电力心脏:国网电力监控运维平台的智慧使命

国网电力监控运维平台,以其强大的数据分析和处理能力,实现了对电网运行的实时监控。无论是电压波动、电流异常,还是设备故障,平台都能迅速捕捉并发出预警,确保电力供应的稳定和安全。 山海鲸可视化电力监控运维平台 想…

Unity引擎UGUI上特效处理重叠和裁剪问题的多种解决办法

大家好,我是阿赵。   使用Unity引擎开发项目,使用UGUI做界面,经常会遇到需要把特效放在UI上,但UI本身和特效又需要有遮挡关系和裁剪效果。   之前我介绍了一下使用MaskableGraphic的方式把粒子特效渲染在UI上,把粒…

闲鱼平台与宝藏详情API接口

一、闲鱼平台简介 闲鱼,是我国知名二手交易平台,成立于2015年,隶属于阿里巴巴集团。联讯数据用户可以在闲鱼上买卖二手商品,实现闲置物品的流通与再利用。随着我国互联网经济的快速发展,闲鱼平台用户规模不断扩大&…

升级你的App推广策略!Xinstall用户来源朔源功能引领行业新潮流

一、引言 在App推广和运营的道路上,你是否曾经遇到过这样的困境:投入了大量的资源,但用户增长却迟迟不见起色?或是用户增长迅速,但用户留存率却极低?这些问题,往往源于我们对用户来源的不了解。…

自监督几何引导:开启单目视觉里程计的鲁棒新时代

论文标题: Self-Supervised Geometry-Guided Initialization for Robust Monocular Visual Odometry 论文作者: Takayuki Kanai, Igor Vasiljevic, Vitor Guizilini, Kazuhiro Shintani 导读: 本文提出了一种用于单目视觉里程计的自监督几…

全国各城市劳动力就业及收入状况数据

基本信息. 数据名称: 全国各城市劳动力就业及收入状况数据 数据格式: Shp、excel 数据时间: 2020-2022年 数据几何类型: 面 数据坐标系: WGS84 数据来源:网络公开数据 数据可视化.

回溯算法练习题(2024/6/18)

1全排列 II 给定一个可包含重复数字的序列 nums ,按任意顺序 返回所有不重复的全排列。 示例 1: 输入:nums [1,1,2] 输出: [[1,1,2],[1,2,1],[2,1,1]]示例 2: 输入:nums [1,2,3] 输出:[[1,…

pg分区表和mysql分区表的创建及删除添加操作

一、分区的类型 1、pg分区的类型 范围划分 列表划分 哈希分区 2、mysql分区的类型 范围分区 列表分区 hash分区 列分区 密匙分区 子分区 二、pg范围分区表的创建删除添加操作 1、pg分区表的创建 2、pg的分区表删除 3、pg分区表的添加 创建新的子分区 添加新创建的子分区 …

1999-2020年各地级市农村居民人均纯收入数据

1999-2020年各地级市农村居民人均纯收入数据 1、时间:1999-2020年 2、指标:年份、城市、农村居民人均纯收入 3、来源:区域年鉴、各省市年鉴 4、范围:地级市,具体每年城市数量参看下文图片,具体城市名单…

Jenkins macos 下 failed to create dmg 操作不被允许hdiutil: create failed - 操作不被允许?

解决方案: 打开设置,选择“隐私与安全”,选择“完全磁盘访问权限”,点击“”,选择jenkins的路径并添加。 同理,添加java的访问权限。

Vscode中的行尾序列CRLF/LF不兼容问题

最近开发的的时候,打开项目文件经常会出现爆红错误提示信息,显示如下图: 这东西太烦人了,毕竟谁都不希望在遍地都是爆红的代码里写东西,就像能解决这个问题,根据提示可以知道这是vscode中使用的prettier插件…

vue3-父子通信

一个简单的vue3子组件调用父组件方法的demo <template> <div> <h2>Parent Component父组件</h2> <ChildComponent notify-parent"handleParentMethod" /> </div> </template> <script> import { ref } fr…

图像处理与视觉感知复习--形态学图像处理

文章目录 计算图像膨胀和腐蚀计算开操作和闭操作击中或击不中变化 计算图像膨胀和腐蚀 定义&#xff1a; A c A^c Ac 表示集合A的补集几何的反射 有集合A中所有元素相对于原点的反射元素组成的集合称为集合A的反射&#xff0c;几位 A ^ \hat{A} A^ A ^ { w ∣ w − a , a …

泛微E9开发 查询页面添加按钮,完成特定功能

查询页面添加按钮&#xff0c;完成特定功能 1、关联知识&#xff08;查询页面实现新增按钮&#xff09;2、功能实现2.1. 点击按钮&#xff0c;输出选中的checkbox的值2.2. 点击按钮&#xff0c;打开一个自定义对话框 3、实现方法 1、关联知识&#xff08;查询页面实现新增按钮&…

SGPT论文阅读笔记

这是篇想要用GPT来提取sentence embedding的工作&#xff0c;提出了两个框架&#xff0c;一个是SGPT-BE&#xff0c;一个是SGPT-CE&#xff0c;分别代表了Bi-Encoder setting和Cross-Encoder setting。CE的意思是在做阅读理解任务时&#xff0c;document和query是一起送进去&am…