【专题速递】多模态数字人、多模态媒体大模型以及AI与AIGC对音视频的影响

news2024/11/26 10:50:05

  //  

随着AIGC内容的兴起,多模态媒体大模型逐渐进入大家的视野,而LLM的发展又让人们对未来音视频工具产生了新的思考。7月29日LiveVideoStackCon2023上海站AIGC与内容生产专场,集齐当下最热门的AIGC话题,与您共享。


AIGC与内容生产 

在技术、需求与产业链的共同驱动下,人们也从继UGC、PGC后,迈向了AIGC这个新兴的内容生产时代。但AIGC并不是一门单一的技术,它的本质是利用AI赋能技术而形成的一种高自由度且低门槛的内容生产能力,而这种能力将服务于各类场景中的创作者与生产者。

TOPIC1《华为云MetaStudio多模态数字人进展及挑战介绍》

李明磊 华为 虚拟数字人技术负责人

数字人作为AI能力集大成者,涉及计算机视觉、计算机图形学、语音处理、自然语言处理等技术,正在金融、政务、传媒、电商等领域应用越来越广。本报告主要介绍华为云在数字人领域当前的主要进展,包括2D数字人驱动、3D数字人建模、绑定、驱动、情感数字人生成等,同时介绍数字人领域的一些挑战。


本次分享将分为三个部分,第一个部分介绍华为云云原生数字人生产管线介绍及业务规划;第二部分介绍华为云2D数字人技术进展介绍,如何解决口型驱动、肢体编排、移动场景驱动等问题;第三部分介绍华为云3D数字人建模、绑定、驱动等技术的进展。

TOPIC2《AIGC音视频工具分析和未来创新机会思考》

王闻宇-PPIO CTO&联合创始人

大语言模型LLM和其他AIGC的技术发展,会给音视频行业带来哪些变化呢?我将会盘点一些很不错的硅谷流行的AIGC应用,然后进行技术+商业的一些思考,分析音视频结合AIGC在未来的创新创业机会所在。

演讲大纲:

1. AIGC给全行业带来了十倍变化要求;2. 盘点几款不过的硅谷AIGC应用;
3. 思考AIGC的本质和音视频的连接;4. 音视频行业未来的创新创业机会在哪

 TOPIC3《AI重新定义音视频生产力“新范式”》

武磊-网心科技 副总裁

主要框架:1、面向新摩尔定律时代,AI技术对音视频内容的影响;2、AI对音视频生产力的革新,需求构建怎样的基础设施与算力平台?3、AI智能化应用与构建实践。

 TOPIC4《从AIGC到多模态媒体大模型》

宋利-上海交通大学 教授

本次演讲将从多模态媒体生成、多模态媒体编码和多模态媒体交互三个方面展现新一代多模态媒体的特点以及未来基于大模型的智能跨模态编码的新趋势。


d8af061d5d81ac90f276f7415a78373e.png扫描图中二维码或点击“阅读原文 

查看更多LiveVideoStackCon 2023上海站精彩话题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/778476.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

华为云使用 helm 模板

登录华为云上的 cce 进入对应的集群,选择模板管理 注意:华为云上不能配置 helm 仓库,只提供手动上传模板,模板的后缀为 tgz 下载模板的方式有很多种,这里用 xxl-job 举例 添加 helm 仓库更新仓库下载模板 helm rep…

基于linux下的高并发服务器开发(第二章)- 2.24 信号集及相关函数

1.用户通过键盘 Ctrl C, 产生2号信号SIGINT (信号被创建) 2.信号产生但是没有被处理 (未决) - 在内核中将所有的没有被处理的信号存储在一个集合中 (未决信号集) - SIGINT信号状态被存储在第二个标志位上 - 这个…

概率论和随机过程的学习和整理--番外15,如何计算N合1的合成数量问题?

目录 1 目标问题:多阶2合1的合成问题 1.1 原始问题 1.2 合成问题要注意,合成的数量 1.3 合成问题不能用马尔科夫链来解决 2 方案1:用合成公式合成多次能解决吗? --不能,解决不了递归的问题 3 方案2,…

微分流形2:流形上的矢量场和张量场

来了来了,切向量,切空间。流形上的所有的线性泛函的集合,注意是函数的集合。然后取流形上的某点p,它的切向量为,线性泛函到实数的映射。没错,是函数到实数的映射,是不是想到了求导。我们要逐渐熟…

uni-app 微信小程序:启用组件按需注入

uni-app 微信小程序:启用组件按需注入 文章目录 uni-app 微信小程序:启用组件按需注入一、官方文档按需注入注意事项 二、HBuilder X 设置三、效果 一、官方文档 https://developers.weixin.qq.com/miniprogram/dev/framework/ability/lazyload.html 按…

大数据面试题:HBase读写数据流程

面试题来源: 《大数据面试题 V4.0》 大数据面试题V3.0,523道题,679页,46w字 参考答案: 1、写数据流程 1)Client先访问zookeeper,获取hbase:meta表位于哪个Region Server。 2)访…

MySQL的主从复制练习

基本原理图如下: 主从复制(也称 AB 复制)允许将来自一个MySQL数据库服务器(主服务器)的数据复制到一个或多个MySQL数据库服务器(从服务器)。当主库进行更新的时候,会自动将数据复制到…

【youcans动手学模型】目标检测之 RCNN 模型

欢迎关注『youcans动手学模型』系列 本专栏内容和资源同步到 GitHub/youcans 【youcans动手学模型】目标检测之 RCNN 模型 1. R-CNN 目标检测1.1 论文摘要1.2 技术背景1.3 基本方法1.4 算法实现1.5 总结 2. 使用 PyTorch 实现 RCNN 目标检测2.1 训练 AlexNet 模型2.2 微调 Alex…

《个人理财》——第六章 理财规划计算工具与方法

考点1: 货币时间价值概述 货币时间价值 也叫资金的时间价值 • 货币在无风险条件下, 经历一定时间投资和再投资发生的增值 • 同等数量货币或现金流的未来价值更低 • 不同时间单位的货币不具有可比性 产生的原因• 现有货币用于投资, 可获得…

IDEA+SpringBoot +ssm+ Mybatis+easyui+Mysql求职招聘管理系统网站

IDEASpringBoot ssm MybatiseasyuiMysql求职招聘管理系统网站 一、系统介绍1.环境配置 二、系统展示1. 登录2.注册3.首页4.公司5.关于我们6.我的简历7.我投递的简历8.修改密码9. 管理员登录10.我的信息11.用户信息12.职位类别13. 职位列表14. 公司列表15. 日志列表 三、部分代码…

听GPT 讲K8s源代码--pkg(八)

k8s项目中 pkg/kubelet/envvars,pkg/kubelet/events,pkg/kubelet/eviction,pkg/kubelet/images,pkg/kubelet/kubeletconfig这些目录都是 kubelet 组件的不同功能模块所在的代码目录。 pkg/kubelet/envvars 目录中包含了与容器运行…

深度学习入门教学——神经网络

深度学习就是训练神经网络。 1、什么是神经网络? 举个最简单的例子,以下是一个使用线性回归来预测房屋价格的函数。这样一个用于预测房屋价格的函数被称作是一单个神经元。大一点的神经网络,就是将这些单个神经元叠加起来。例如&#xff1a…

Java基础之stream流最新版,stream流的基本操作

您好,我是码农飞哥(wei158556),感谢您阅读本文,欢迎一键三连哦。 💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精…

java 应用 cpu 过高故障排查

文章目录 一、前言二、测试代码 Test.java三、Linux 编译运行 Test.java 程序四、top 命令查看 cpu 使用情况五、查看进程下的线程详情 top -H -p 11748六、将线程 12240 的 pid 转为 16 进制 printf "0x%x\n" 12240七、jstack 查看进程的快照遗留 一、前言 前两天…

二十六章:Pyramid Vision Transformer ——金字塔视觉Transformer:一种无卷积的用于密集预测的多功能主干网络

0.摘要 虽然卷积神经网络(CNN)在计算机视觉领域取得了巨大成功,但本研究探讨了一种更简单、无卷积的骨干网络,适用于许多密集预测任务。与最近提出的专门用于图像分类的Vision Transformer(ViT)不同&#x…

无人机自主探索FUEL:代码阅读1--边界簇检测更新与视点生成

~/src/catkin_fuel_refactored/fuel_refactored/fuel_planner/bagbag中包含三个.sh文件,为rosbag指令,给出了录包指令以及有用话题信息 FIS 1、增量边界检测与聚类 路径:~/fuel_planner/active_perception/src/frontier_finder.cpp 主要函…

五、模型训练

目录 1. 线性模型1.1 Lasso 回归1.2 Ridge 回归 2. 树模型2.1 随机森林(Random Forest,RF)2.2 梯度提升树(GBDT)2.3 XGBoost2.4 LightGBM2.5 CatBoost2.6 模型深入对比 3. 神经网络3.1 多层感知机3.2 卷积神经网络3.3 …

Linux 下 nc 发送接收 udp、tcp数据

nc,全名叫 netcat,它可以用来完成很多的网络功能,譬如端口扫描、建立TCP/UDP连接,数据传输、网络调试等等,因此,它也常被称为网络工具的 瑞士军刀 。 一、只服务端使用nc 备注:这种方式只能发…

【Hive】Centos7安装单机版Hive

Hive依赖MySQL存储元数据信息,安装Hive前需要先安装MySQL 一、安装MySQL 下载mysql安装包 wget http://repo.mysql.com/mysql57-community-release-el7-10.noarch.rpm2. 如果不是root用户需要先切换到root用户,安装第1步下载的rpm包 yum -y install …